人工智能
人工智能的类比推理能力:挑战人类智慧?

类比推理是人类独有的能力,能够通过将陌生的问题与已知的问题进行对比来解决问题。然而,美国加州大学洛杉矶分校(UCLA)的心理学家进行的一项开创性的研究可能会让我们重新思考这一点。
GPT-3:与人类智慧相媲美?
UCLA 的研究发现,GPT-3,一种由 OpenAI 开发的人工智能语言模型,在解决类似于智力测试和标准化考试(如 SAT)的问题时,表现出了几乎与大学生相同的推理能力。这一发现发表在《自然人类行为》杂志上,引发了一个有趣的问题:GPT-3 是否由于其广泛的语言训练数据而模仿人类的推理,还是它正在使用一种完全新的认知过程?
GPT-3 的确切工作原理仍然被 OpenAI 保密,这让 UCLA 的研究人员对其类比推理技能的机制感到好奇。尽管 GPT-3 在某些推理任务中表现出色,但它并非完美。UCLA 的研究人员之一、博士后研究员泰勒·韦伯(Taylor Webb)指出,“虽然我们的发现令人印象深刻,但必须强调这一系统存在着显著的限制。GPT-3 可以进行类比推理,但它在处理人类轻松解决的任务(如使用工具进行物理任务)时却遇到了困难。”
GPT-3 的能力通过使用受雷文进步矩阵(Raven’s Progressive Matrices)启发的问题进行了测试,这是一种涉及复杂形状序列的测试。韦伯通过将图像转换为 GPT-3 可以解读的文本格式,确保这些问题对 AI 来说是完全新的。与 40 名 UCLA 大学生相比,GPT-3 不仅匹配了人类的表现,还模仿了人类犯的错误。AI 模型准确地解决了 80% 的问题,超过了人类的平均分数,但仍然处于顶级人类表现者的范围内。
该团队进一步测试了 GPT-3 的能力,使用未公开的 SAT 类比问题,AI 的表现超过了人类的平均水平。然而,它在尝试从短篇故事中推导类比时略有欠缺,尽管最新的 GPT-4 模型显示出改进的结果。
弥合人工智能与人类认知的差距
UCLA 的研究人员并没有就此止步。他们已经开始开发一个受人类认知启发的计算机模型,并不断地将其能力与商业 AI 模型进行比较。UCLA 心理学教授、研究人员之一基思·霍利奥克(Keith Holyoak)表示,“我们的心理 AI 模型在类比问题上优于其他模型,直到 GPT-3 的最新升级,它显示出更好的或相当的能力。”
然而,研究人员发现 GPT-3 在某些领域,特别是需要理解物理空间的任务中存在不足。在涉及工具使用的挑战中,GPT-3 的解决方案明显不合适。
该研究的首席作者洪静(Hongjing Lu)对过去两年技术的飞速发展,尤其是人工智能的推理能力感到惊讶。但是,是否这些模型真正地“思考”像人类一样,还是只是模仿人类的思维,这仍然是一个有待讨论的问题。为了深入了解人工智能的认知过程,需要访问人工智能模型的后端,这可能会影响人工智能的未来发展轨迹。
韦伯也表示,“获得 GPT 模型的后端将会极大地造福人工智能和认知研究人员。目前,我们仅限于输入和输出,缺乏我们所期望的决定性深度。”












