人工智能

AI的类比推理能力：挑战人类智慧？

Published August 7, 2023

Updated April 28, 2026

Alex McFarland

类比推理，这种人类独有的解决陌生问题的能力，长期以来被认为是人类认知功能的独特方面。然而，洛杉矶加利福尼亚大学（UCLA）的心理学家进行的一项开创性的研究提出了令人信服的发现，这可能会让我们重新思考这一点。

GPT-3：赶上人类智力?

UCLA的研究发现，GPT-3，一种由OpenAI开发的AI语言模型，展示了几乎与大学生相当的推理能力，特别是在解决类似于智力测试和标准化考试（如SAT）问题时。这一发现，发表在《自然人类行为》杂志上，提出了一个有趣的问题：GPT-3是否由于其广泛的语言训练数据集而模仿人类推理，还是它正在利用一种完全新的认知过程？
GPT-3的确切工作原理仍然被OpenAI隐藏，留下了UCLA的研究人员对其类比推理技能的机制感到好奇。尽管GPT-3在某些推理任务上的表现令人钦佩，但该工具并非完美。研究的主要作者、UCLA的博士后研究员Taylor Webb指出，“虽然我们的发现令人印象深刻，但必须强调，这个系统有着显著的限制。GPT-3可以进行类比推理，但它在人类轻松完成的任务中却苦苦挣扎，例如使用工具进行物理任务。”
GPT-3的能力通过使用受Raven的进步矩阵启发的问题进行了测试——一种涉及复杂形状序列的测试。通过将图像转换为GPT-3可以解读的文本格式，Webb确保这些是AI面临的全新挑战。当与40名UCLA大学生比较时，GPT-3不仅匹配了人类的表现，还模仿了人类所犯的错误。AI模型准确地解决了80%的问题，超过了人类的平均分数，处于顶级人类表现者的范围内。
该团队进一步探索了GPT-3的能力，使用未公开的SAT类比问题，AI的表现超过了人类的平均水平。然而，它在尝试从短篇故事中得出类比时略有欠缺，尽管更新的GPT-4模型显示出更好的结果。

弥合AI与人类认知的差距

UCLA的研究人员并没有就此止步。他们已经开始开发一个受人类认知启发的计算机模型，不断地将其能力与商业AI模型进行比较。UCLA心理学教授、共同作者Keith Holyoak评论说，“我们的心理AI模型在类比问题上优于其他模型，直到GPT-3的最新升级，显示出更好的或相当的能力。”
然而，该团队发现GPT-3在某些领域存在不足，特别是在需要理解物理空间的任务中。在涉及工具使用的挑战中，GPT-3的解决方案明显不准确。
该研究的高级作者Hongjing Lu对过去两年技术的飞跃，特别是AI的推理能力感到惊讶。但是，这些模型是否真正“思考”如人类一样，或者只是模仿人类的思维仍然是有争议的。了解AI的认知过程的探索需要访问AI模型的后端，这可能会塑造AI的未来轨迹。
Webb回应说，“访问GPT模型的后端将极大地造福AI和认知研究人员。目前，我们仅限于输入和输出，它缺乏我们所期望的决定性深度。”

Unite.AI

AI的类比推理能力：挑战人类智慧？

GPT-3：赶上人类智力?

弥合AI与人类认知的差距

You may like