人工智能

人工智能的类比推理能力：挑战人类智慧？

发布于 2023年8月7日

更新于 2026年5月23日

作者

Alex McFarland

类比推理是人类独有的能力，能够通过将陌生的问题与已知的问题进行对比来解决问题。然而，美国加州大学洛杉矶分校（UCLA）的心理学家进行的一项开创性的研究可能会让我们重新思考这一点。

GPT-3：与人类智慧相媲美？

UCLA 的研究发现，GPT-3，一种由 OpenAI 开发的人工智能语言模型，在解决类似于智力测试和标准化考试（如 SAT）的问题时，表现出了几乎与大学生相同的推理能力。这一发现发表在《自然人类行为》杂志上，引发了一个有趣的问题：GPT-3 是否由于其广泛的语言训练数据而模仿人类的推理，还是它正在使用一种完全新的认知过程？

GPT-3 的确切工作原理仍然被 OpenAI 保密，这让 UCLA 的研究人员对其类比推理技能的机制感到好奇。尽管 GPT-3 在某些推理任务中表现出色，但它并非完美。UCLA 的研究人员之一、博士后研究员泰勒·韦伯（Taylor Webb）指出，“虽然我们的发现令人印象深刻，但必须强调这一系统存在着显著的限制。GPT-3 可以进行类比推理，但它在处理人类轻松解决的任务（如使用工具进行物理任务）时却遇到了困难。”

GPT-3 的能力通过使用受雷文进步矩阵（Raven’s Progressive Matrices）启发的问题进行了测试，这是一种涉及复杂形状序列的测试。韦伯通过将图像转换为 GPT-3 可以解读的文本格式，确保这些问题对 AI 来说是完全新的。与 40 名 UCLA 大学生相比，GPT-3 不仅匹配了人类的表现，还模仿了人类犯的错误。AI 模型准确地解决了 80% 的问题，超过了人类的平均分数，但仍然处于顶级人类表现者的范围内。

该团队进一步测试了 GPT-3 的能力，使用未公开的 SAT 类比问题，AI 的表现超过了人类的平均水平。然而，它在尝试从短篇故事中推导类比时略有欠缺，尽管最新的 GPT-4 模型显示出改进的结果。

弥合人工智能与人类认知的差距

UCLA 的研究人员并没有就此止步。他们已经开始开发一个受人类认知启发的计算机模型，并不断地将其能力与商业 AI 模型进行比较。UCLA 心理学教授、研究人员之一基思·霍利奥克（Keith Holyoak）表示，“我们的心理 AI 模型在类比问题上优于其他模型，直到 GPT-3 的最新升级，它显示出更好的或相当的能力。”

然而，研究人员发现 GPT-3 在某些领域，特别是需要理解物理空间的任务中存在不足。在涉及工具使用的挑战中，GPT-3 的解决方案明显不合适。

该研究的首席作者洪静（Hongjing Lu）对过去两年技术的飞速发展，尤其是人工智能的推理能力感到惊讶。但是，是否这些模型真正地“思考”像人类一样，还是只是模仿人类的思维，这仍然是一个有待讨论的问题。为了深入了解人工智能的认知过程，需要访问人工智能模型的后端，这可能会影响人工智能的未来发展轨迹。

韦伯也表示，“获得 GPT 模型的后端将会极大地造福人工智能和认知研究人员。目前，我们仅限于输入和输出，缺乏我们所期望的决定性深度。”

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。

Unite.AI

人工智能的类比推理能力：挑战人类智慧？

GPT-3：与人类智慧相媲美？

弥合人工智能与人类认知的差距

发现更多