人工智能
人工神经网络实现类人语言泛化

在人工智能(AI)不断发展的世界中,科学家们最近取得了一个重大突破。他们创造了一个神经网络,展现出类人语言泛化的能力。这一开创性的发展不仅是一步进展,而是朝着弥合人类认知和人工智能能力之间的差距迈出的一大步。
当我们进一步探索人工智能领域时,人工智能系统能够理解和应用语言的能力变得至关重要。这种最近的成就为我们展现了一个未来,人类和机器之间的交互将变得更加自然和直观。
与现有模型比较
人工智能领域并非对能够处理和响应语言的模型感到陌生。然而,这一最新发展的新颖之处在于其语言泛化能力的提高。当与现有模型(如流行聊天机器人背后的模型)进行比较时,这个新神经网络展示出更强的能力,将新词汇融入其现有词汇并在陌生情境中使用它们。
虽然当前最好的AI模型(如ChatGPT)在许多对话场景中表现出色,但它们仍然在无缝集成新语言信息方面存在不足。这一新神经网络使我们更接近于一个现实,机器能够像人类一样理解和交流,具有细微差别和适应性。
理解系统化泛化
这一成就的核心是系统化泛化的概念。它使人类能够轻松地适应和在多种情境中使用新词汇。例如,一旦我们理解“photobomb”这个词,我们就能直觉地知道如何在不同的情况下使用它,无论是“photobombing twice”还是“photobombing during a Zoom call”。同样,理解一个句子结构,如“the cat chases the dog”,使我们能够轻松地理解其逆向结构:“the dog chases the cat”。
然而,这种人类固有的能力一直是人工智能领域的一个挑战性前沿。传统的神经网络,作为人工智能研究的骨干,天然地不具备这种能力。它们难以将新词汇纳入其中,除非它们被大量训练以包含该词汇在多个语境中的多个示例。这种限制已经成为人工智能研究者几十年来的争论话题,引发了关于神经网络是否能真正模拟人类认知过程的辩论。
研究细节
为了更深入地了解神经网络的能力及其对语言泛化的潜力,进行了一项综合研究。这项研究不仅限于机器,还有25名人类参与者,他们作为基准来评估AI的性能。
实验使用了一种伪语言,一套对参与者来说陌生的构造词汇。这种方法确保参与者真正地第一次学习这些词汇,为测试泛化提供了一个干净的环境。这种伪语言包括两类词汇。‘原始’类别包括‘dax’、‘wif’和‘lug’等词汇,代表基本动作,如‘跳过’或‘跳跃’。另一方面,更加抽象的‘函数’词汇,如‘blicket’、‘kiki’和‘fep’,规定了这些原始词汇的应用和组合规则,形成如‘跳三次’或‘向后跳’这样的序列。
视觉元素也被引入训练过程中。每个原始词汇都与特定颜色的圆圈相关联。例如,红色圆圈可能代表‘dax’,而蓝色圆圈可能代表‘lug’。参与者被展示原始词汇和函数词汇的组合,并伴有代表这些函数应用于原始词汇的结果的彩色圆圈图案。例如,‘dax fep’短语可能与三个红色圆圈配对,说明‘fep’是一个抽象规则,重复某个动作三次。
为了评估参与者对系统化泛化的理解和能力,他们被呈现复杂的原始词汇和函数词汇的组合。然后,他们被要求确定正确的圆圈颜色和数量,并将它们以适当的顺序排列。
影响和专家意见
这项研究的结果不仅是人工智能研究领域的又一个进步,而是一个范式转变。神经网络的表现,其特点是类似于人类的系统化泛化,激发了学者和行业专家的兴奋和好奇。
约翰霍普金斯大学著名认知科学家保罗·斯莫伦斯基(Paul Smolensky)称赞这一成就为“训练网络系统化的突破”。他的声明凸显了这一成就的重要性。如果神经网络可以被训练以系统化地泛化,它们可能会在从聊天机器人到虚拟助手等多个应用领域带来革命性的变化。
然而,这一发展不仅仅是一项技术进步。它触及了人工智能社区长期存在的争论:神经网络能否真正作为人类认知的模型?近四十年来,这个问题一直是人工智能研究者的争论话题。一些人相信神经网络有潜力模拟人类思维过程,而其他人则由于神经网络在语言泛化方面的局限性而持怀疑态度。
这项研究及其令人乐观的结果使得人们对神经网络的潜力持更加乐观的态度。正如纽约大学认知计算科学家、研究共同作者布伦登·莱克(Brenden Lake)所指出,神经网络过去可能面临挑战,但通过正确的方法,它们确实可以被塑造以反映人类认知的某些方面。
迈向无缝人机协同的未来
人工智能的发展历程,从其初期阶段到现在的强大能力,始终伴随着不断的进化和突破。最近在训练神经网络系统化语言泛化方面的成就是人工智能无限潜力的又一证明。站在这一历史时刻,我们需要认识到这些进步的更广泛影响。我们正一步步接近一个未来,机器不仅能理解我们的语言,还能理解其背后的细微差别和语境,促进人机交互更加无缝和直观。












