人工智能

GPT-4 是实现 AGI 的一次飞跃吗？

更新 on 2024 年 4 月 23 日

微软最近发布了一篇研究论文，标题为：通用人工智能的火花：GPT-4 的早期实验。正如微软所描述的：

这张纸报告了我们对 GPT-4 早期版本的调查，当时 OpenAI 仍在积极开发该版本。我们认为（这个早期版本的）GPT-4 是新一批 LLM（例如 ChatGPT 和 Google 的 PaLM）的一部分，它们比以前的 AI 模型表现出更通用的智能。

在这篇论文中，有确凿的证据表明 GPT-4 远远超出了记忆的范围，它对概念、技能和领域有深入而灵活的理解。事实上，它的概括能力远远超过当今活着的任何人。

虽然我们之前已经讨论过 AGI 的好处，我们应该快速总结一下什么是AGI系统的普遍共识。本质上，AGI 是一种高级人工智能，可以跨多个领域泛化，而且范围并不狭窄。狭义人工智能的例子包括自动驾驶汽车、聊天机器人、国际象棋机器人或任何其他专为单一目的而设计的人工智能。

相比之下，通用人工智能将能够在上述任何专业领域或任何其他专业领域之间灵活切换。这是一种可以利用新兴算法的人工智能，例如转移学习和进化学习，同时还利用遗留算法，例如深度强化学习.

上述对 AGI 的描述与我个人使用 GPT-4 的经验以及微软发布的研究论文中分享的证据相符。

论文中概述的提示之一是 GPT-4 以一首诗的形式写出素数无穷的证明。

如果我们分析创作这样一首诗的要求，我们就会发现它需要数学推理、诗歌表达和自然语言生成。这是一个超出大多数人平均能力的挑战。

该论文想要了解 GPT-4 是否只是简单地基于一般记忆和理解上下文并能够推理来生成内容。当被要求以莎士比亚风格重新创作一首诗时，它能够做到。这需要多方面的理解，远远超出一般人的能力，包括心智理论和数学天才。

如何计算GPT-4智力？

那么问题就变成了我们如何衡量LLM的智力？ GPT-4 表现的是真正的学习行为还是仅仅是记忆行为？

当前测试人工智能系统的方法是在一组标准基准数据集上评估系统，并确保它们独立于训练数据并且涵盖一系列任务和领域。由于 GPT-4 训练的数据量几乎是无限的，这种类型的测试几乎是不可能的。

本文讨论了如何生成新颖且困难的任务/问题，这些任务/问题令人信服地证明 GPT-4 远远超出了记忆的范围，并且它对概念、技能和领域具有深入而灵活的理解。

当谈到智能时，GPT-4可以生成短篇小说、剧本，并且可以计算最复杂的公式。

GPT-4 还能够进行非常高水平的编码，无论是根据指令编写代码还是理解现有代码。 GPT-4 可以处理广泛的编码任务，从
现实世界应用程序的编码挑战，从低级汇编到高级框架，从简单的数据结构到游戏等复杂程序。 GPT-4还可以推理代码执行、模拟指令的效果并用自然语言解释结果。 GPT-4甚至可以执行伪代码，

GPT-4 可以对几乎任何给出的提示做出理性反应。事实上，它的智能在复杂性上几乎是无敌的。

GPT-4 限制

然后，论文继续描述他们如何探究 GPT-4 的反应和行为，以验证其一致性、连贯性和正确性，并揭示其局限性和偏见。

最明显的限制是它的产生幻觉的倾向。这是论文中给出的一个幻觉示例，其中 GPT-4 对自己的答案充满信心，但实际上是完全错误的。

看来甚至 GPT-4 也理解当前幻觉的局限性，因为当我问它什么是 GPT 幻觉时，它给出了这样的回应：

GPT 幻觉是指一种现象，即生成式预训练 Transformer (GPT) 模型（例如您当前正在与之交互的模型）产生的响应不基于事实信息或与所提供的上下文不一致。当模型生成看似合理但实际上不正确、具有误导性或无意义的文本时，就会出现这些幻觉。

换句话说，当你用世界数据训练法学硕士人工智能时，如何避免系统学习错误的数据？大型语言模型学习和反刍错误信息和阴谋论实际上可能是人类大规模采用法学硕士所面临的最大陷阱和威胁之一。这实际上可能是 AGI 带来的更大威胁之一，但在讨论 AGI 的危险时却令人惊讶地忽略了这一威胁。

GPT-4 情报证明

该论文表明，无论针对什么类型的复杂提示，GPT-4 都会超出预期。正如论文中所述：

它对自然语言的掌握无与伦比。它不仅可以生成流畅、连贯的文本，还可以以各种方式理解和操作它，例如总结、翻译或回答极其广泛的问题。此外，我们所说的翻译不仅指不同自然语言之间的翻译，还指语气和风格上的翻译，以及跨医学、法律、会计、计算机编程、音乐等领域的翻译。

对 GPT-4 进行了模拟技术审查，在这种情况下，如果另一端是人，那么它很容易就传递了含义，即他们将立即被雇用为软件工程师。对 GPT-4 在多州律师考试中的能力进行的类似初步测试显示，准确率高于 70%。这意味着未来我们可以将目前交给律师的许多任务自动化。事实上有一些目前正在致力于创建机器人律师的初创公司使用 GPT-4。

产生新知识

论文中的一个论点是，GPT-4 证明真正的理解水平的唯一方法就是产生新知识，例如证明新的数学定理，而这一壮举目前对于法学硕士来说仍然遥不可及。

这又是 AGI 的圣杯。虽然 AGI 落入坏人手中存在危险，但 AGI 能够快速分析所有历史数据以发现新定理、治愈方法和治疗方法的好处几乎是无限的。

AGI 可能是寻找治疗目前缺乏私营企业资金的罕见遗传疾病、一劳永逸地治愈癌症以及最大限度地提高可再生能源效率以消除我们对不可持续能源的依赖的缺失环节。事实上，它可以解决输入到 AGI 系统中的任何后续问题。这就是 Sam Altman 和 OpenAI 团队的理解： AGI确实是最后的发明这是解决大多数问题和造福人类所必需的。

当然，这并不能解决谁控制 AGI 以及他们的意图是什么的核按钮问题。不管这个纸做了出色的工作，认为 GPT-4 是实现人工智能研究人员梦想的一次飞跃我们不断增强企业的力量，最初的达特茅斯夏季研究项目人工智能夏季研讨会首次启动。

虽然 GPT-4 是否是 AGI 存在争议，但很容易认为，这是人类历史上第一次，它是一个可以通过人工智能系统图灵测试.

相关话题：德盛人工智能 GPT GPT-4 GPT4

下一步

OpenAI 的新举措：引导超级智能 AI 走向正确的方向

不要错过

什么是摩尔定律以及它如何影响人工智能？

安托万·塔迪夫

Unite.AI 创始合伙人 & 会员福布斯技术委员会，安托万是一个未来学家他对人工智能和机器人技术的未来充满热情。

他也是证券，一个专注于投资颠覆性技术的网站。

联合人工智能

GPT-4 是实现 AGI 的一次飞跃吗？

人工智能

GPT-4 是实现 AGI 的一次飞跃吗？

目录

如何计算GPT-4智力？

GPT-4 限制

GPT-4 情报证明

产生新知识

最新文章

联合人工智能

GPT-4 是实现 AGI 的一次飞跃吗？

目录

如何计算GPT-4智力？

GPT-4 限制

GPT-4 情报证明

产生新知识

你可能会喜欢

最新文章