人工智能

神经网络实现类人语言泛化

发布时间

6个月前

2023 年 10 月 25 日

亚历克斯麦克法兰

在不断发展的人工智能 (AI) 世界中，科学家们最近宣布了一个重要的里程碑。他们精心设计了一个神经网络，在语言泛化方面表现出类似人类的能力。这一突破性的发展不仅仅是一步，而是弥合人类认知和人工智能能力之间差距的巨大飞跃。

随着我们进一步进入人工智能领域，这些系统像人类一样在不同环境中理解和应用语言的能力变得至关重要。最近的这一成就为我们提供了一个充满希望的未来，人与机器之间的交互感觉比以往任何时候都更加有机和直观。

与现有型号的比较

人工智能世界对能够处理和响应语言的模型并不陌生。然而，这一最新发展的新颖之处在于其增强的语言泛化能力。当与已建立的模型（例如流行聊天机器人的底层模型）进行比较时，这种新的神经网络表现出了卓越的能力，可以将新学到的单词折叠到现有的词典中，并在不熟悉的上下文中使用它们。

尽管当今最好的人工智能模型（例如 ChatGPT）可以在许多对话场景中发挥作用，但在新语言信息的无缝集成方面仍然存在不足。另一方面，这种新的神经网络让我们更接近现实，机器可以理解人类的细微差别和适应性并与之进行交流。

理解系统泛化

这一成就的核心在于系统概括的概念。它使人类能够在不同的环境中毫不费力地适应和使用新学到的单词。例如，一旦我们理解了“照片轰炸”这个词，我们就会本能地知道如何在各种情况下使用它，无论是“两次照片轰炸”还是“在 Zoom 通话期间进行照片轰炸”。同样，理解“猫追狗”这样的句子结构可以让我们轻松掌握它的反义词：“狗追猫”。

然而，这种人类固有的能力对于人工智能来说一直是一个具有挑战性的前沿领域。传统的神经网络一直是人工智能研究的支柱，但它天然不具备这种技能。他们会努力合并一个新单词，除非他们已经接受过在上下文中使用该单词的多个样本的广泛训练。几十年来，这种限制一直是人工智能研究人员争论的话题，引发了关于神经网络作为人类认知过程的真实反映的可行性的讨论。

详细研究

为了更深入地研究神经网络的功能及其语言泛化的潜力，综合学习进行了。这项研究不仅限于机器； 25 名人类参与者错综复杂地参与其中，作为人工智能表现的基准。

该实验使用了一种伪语言，即一组参与者不熟悉的构建单词。这确保了参与者真正第一次学习这些术语，为测试泛化提供了一个干净的基础。这种伪语言由两类不同的单词组成。 “原始”类别包括“dax”、“wif”和“lug”等单词，它们象征着类似于“跳过”或“跳跃”的基本动作。另一方面，更抽象的“功能”词，如“blicket”、“kiki”和“fep”，为这些原始术语的应用和组合制定了规则，导致了“跳三遍”等序列。或“向后跳”。

培训过程中还引入了视觉元素。每个原始单词都与特定颜色的圆圈相关联。例如，红色圆圈可能代表“dax”，而蓝色圆圈则代表“lug”。然后向参与者展示原语和功能词的组合，并附有彩色圆圈图案，描绘了将功能应用于原语的结果。一个例子是短语“dax fep”与三个红色圆圈配对，说明“fep”是重复一个动作三次的抽象规则。

为了衡量参与者的理解和系统概括能力，向他们展示了原始词和功能词的复杂组合。然后，他们的任务是确定圆圈的正确颜色和数量，并进一步按适当的顺序排列它们。

影响和专家意见

这项研究的结果不仅仅是人工智能研究史册上的又一个增量；它们代表了范式的转变。神经网络的性能密切反映了类人系统泛化能力，引起了学者和行业专家的兴奋和好奇。

约翰霍普金斯大学语言专业的著名认知科学家保罗·斯莫伦斯基博士称赞这是“训练网络系统化能力的突破”。他的声明强调了这一成就的重要性。如果可以训练神经网络进行系统泛化，那么它们就有可能彻底改变从聊天机器人到虚拟助手等众多应用程序。

然而，这种发展不仅仅是技术进步。它触及了人工智能界长期存在的争论：神经网络真的可以作为人类认知的准确模型吗？近四十年来，这个问题一直让人工智能研究人员争论不休。虽然一些人相信神经网络具有模拟类人思维过程的潜力，但其他人仍然对其固有的局限性持怀疑态度，尤其是在语言泛化领域。

这项研究的结果很有希望，使人们更加乐观。正如纽约大学认知计算科学家、该研究的合著者布伦登·莱克（Brenden Lake）指出的那样，神经网络过去可能一直举步维艰，但通过正确的方法，它们确实可以被塑造来反映人类认知的各个方面。

迈向人机无缝协同的未来

人工智能从萌芽阶段到如今的强大历程，经历了不断的演变和突破。最近在训练神经网络系统地概括语言方面取得的成就再次证明了人工智能的无限潜力。当我们处于这个关头时，有必要认识到这些进步的更广泛影响。我们正一步步接近这样一个未来：机器不仅能理解我们的语言，还能掌握细微差别和上下文，从而促进更加无缝和直观的人机交互。