人工智能
人工智能聊天机器人致力于语言理解

人工智能 (AI) 聊天机器人的出现重塑了对话体验,带来了似乎与人类理解和使用语言相似的进步。 这些聊天机器人在大量语言模型的推动下,正在变得善于应对人类交互的复杂性。
但是,最近 根据一项研究, 揭示了这些模型在区分自然语言和废话方面的持续脆弱性。 哥伦比亚大学研究人员进行的调查对聊天机器人性能和人类语言处理的潜在改进提出了有趣的见解。
语言模型探究
该团队详细阐述了他们的研究,涉及九种不同的语言模型,并受到大量句子对的影响。 研究中的人类参与者被要求辨别每对句子中更“自然”的句子,反映日常用法。 然后根据模型的评估是否与人类的选择产生共鸣来对模型进行评估。
当模型相互比较时,基于变压器神经网络的模型比更简单的循环神经网络模型和统计模型表现出更优越的性能。 然而,即使是更复杂的模型也会出现错误,通常会选择人类认为无意义的句子。
与无意义句子的斗争
哥伦比亚大学 Zuckerman 研究所的首席研究员 Nikolaus Kriegeskorte 博士强调,大型语言模型在捕获简单模型所遗漏的关键方面方面相对成功。 他指出,“即使我们研究的最好的模型仍然会被无意义的句子所愚弄,这表明它们的计算遗漏了人类处理语言的方式。”
该研究中的一个引人注目的例子强调了 BERT 等模型错误地判断了句子的自然性,这与 GPT-2 等与人类判断一致的模型形成鲜明对比。 正如哥伦比亚大学心理学助理教授 Christopher Baldassano 博士指出的那样,这些模型中普遍存在的缺陷引起了人们对决策过程中对人工智能系统依赖的担忧,并提醒人们注意它们在标签方面明显的“盲点”句子。
影响和未来方向
Kriegeskorte 博士感兴趣的领域是性能差距以及探索为什么某些模型比其他模型更优秀的原因。 他认为,理解这些差异可以显着推动语言模型的进步。
这项研究还为探索人工智能聊天机器人的机制是否能够激发新的科学探究开辟了途径,帮助神经科学家破译人类大脑的复杂性。
考虑到人工智能工具在语言处理方面不断增强的能力,该论文的通讯作者 Tal Golan 博士表达了对理解人类思维过程的兴趣。 “将他们的语言理解与我们的进行比较,为我们提供了一种新的方法来思考我们的思维方式,”他评论道。
对人工智能聊天机器人语言能力的探索揭示了将其理解与人类认知结合起来的长期挑战。
不断深入研究这些差异以及随之而来的启示不仅将提高人工智能聊天机器人的效率,而且还将揭开人类认知过程的无数层面。
人工智能驱动的语言理解和人类认知的并置为多方面的探索奠定了基础,有可能重塑人工智能和神经科学相互关联领域的认知和推进知识。