Connect with us

人工智能

AI的类比推理能力:挑战人类智慧?

mm

类比推理,这种人类独有的解决陌生问题的能力,长期以来被认为是人类认知功能的独特方面。然而,洛杉矶加利福尼亚大学(UCLA)的心理学家进行的一项开创性的研究提出了令人信服的发现,这可能会让我们重新思考这一点。

GPT-3:赶上人类智力?

UCLA的研究发现,GPT-3,一种由OpenAI开发的AI语言模型,展示了几乎与大学生相当的推理能力,特别是在解决类似于智力测试和标准化考试(如SAT)问题时。这一发现,发表在《自然人类行为》杂志上,提出了一个有趣的问题:GPT-3是否由于其广泛的语言训练数据集而模仿人类推理,还是它正在利用一种完全新的认知过程?
GPT-3的确切工作原理仍然被OpenAI隐藏,留下了UCLA的研究人员对其类比推理技能的机制感到好奇。尽管GPT-3在某些推理任务上的表现令人钦佩,但该工具并非完美。研究的主要作者、UCLA的博士后研究员Taylor Webb指出,“虽然我们的发现令人印象深刻,但必须强调,这个系统有着显著的限制。GPT-3可以进行类比推理,但它在人类轻松完成的任务中却苦苦挣扎,例如使用工具进行物理任务。”
GPT-3的能力通过使用受Raven的进步矩阵启发的问题进行了测试——一种涉及复杂形状序列的测试。通过将图像转换为GPT-3可以解读的文本格式,Webb确保这些是AI面临的全新挑战。当与40名UCLA大学生比较时,GPT-3不仅匹配了人类的表现,还模仿了人类所犯的错误。AI模型准确地解决了80%的问题,超过了人类的平均分数,处于顶级人类表现者的范围内。
该团队进一步探索了GPT-3的能力,使用未公开的SAT类比问题,AI的表现超过了人类的平均水平。然而,它在尝试从短篇故事中得出类比时略有欠缺,尽管更新的GPT-4模型显示出更好的结果。

弥合AI与人类认知的差距

UCLA的研究人员并没有就此止步。他们已经开始开发一个受人类认知启发的计算机模型,不断地将其能力与商业AI模型进行比较。UCLA心理学教授、共同作者Keith Holyoak评论说,“我们的心理AI模型在类比问题上优于其他模型,直到GPT-3的最新升级,显示出更好的或相当的能力。”
然而,该团队发现GPT-3在某些领域存在不足,特别是在需要理解物理空间的任务中。在涉及工具使用的挑战中,GPT-3的解决方案明显不准确。
该研究的高级作者Hongjing Lu对过去两年技术的飞跃,特别是AI的推理能力感到惊讶。但是,这些模型是否真正“思考”如人类一样,或者只是模仿人类的思维仍然是有争议的。了解AI的认知过程的探索需要访问AI模型的后端,这可能会塑造AI的未来轨迹。
Webb回应说,“访问GPT模型的后端将极大地造福AI和认知研究人员。目前,我们仅限于输入和输出,它缺乏我们所期望的决定性深度。”

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。