人工智能

谷歌的新 Meena 聊天机器人可以就几乎任何事情进行明智、具体的对话

更新 on 2022 年 12 月 9 日

尽管 Siri、Alexa 和 Google Assistant 等虚拟助手令人印象深刻且有用，但它们的对话技能通常仅限于接收某些命令并提供预定义的响应。谷歌和亚马逊等公司一直在寻求人工智能训练和开发方法，使人工智能聊天机器人更加强大和灵活，能够以更自然的方式与用户进行对话。据 DigitalTrends 报道，谷歌最近发表了一篇论文展示其新聊天机器人“Meena”的功能。根据博客文章研究人员表示，Meena 可以与用户就几乎任何主题进行对话。

Meena 是一个开放域聊天机器人，这意味着它会响应迄今为止的对话上下文并适应输入以提供更自然的响应。大多数其他聊天机器人都是封闭域的，这意味着它们的响应以某些想法为主题，并且仅限于完成特定任务。

根据谷歌的报告，Meena 的灵活性是海量训练数据集的结果。 Meena 接受了从社交媒体对话中提取的约 40 亿个单词的训练，并筛选出最相关和最具代表性的单词。谷歌的目标是解决大多数语音助手中存在的一些问题，例如处理在对话中多次展开的主题和命令的能力，用户在机器人响应一个输入后提供额外的输入。这意味着人工聊天机器人无法提示用户进行澄清，并且当存在无法解释的查询时，它们通常只是默认为网络结果。

为了解决这个特殊问题，谷歌的研究人员启用了其算法来跟踪对话的上下文，这意味着它可以生成特定的答案。该模型使用了一个编码器来处理对话中已经说过的内容，以及一个解码器来根据上下文创建响应。该模型根据特定和非特定数据进行训练。具体数据是指与当前陈述密切相关的词语。正如谷歌帖子所解释的：

“例如，如果 A 说，‘我喜欢网球’，B 回答说，‘那很好’，那么这句话应该被标记为‘不具体’。该回复可以在数十种不同的情况下使用。但如果 B 回答：“我也是，我对罗杰·费德勒的了解还不够！”，那么它就会被标记为“具体”，因为它与正在讨论的内容密切相关。

用于训练模型的数据由对话中的七个“回合”组成。在训练期间，该模型拥有 2.6 亿个参数，检查了 341 GB 文本数据中的模式，该数据集比用于训练 GPT-8.5 模型的数据集大约 2 倍由 OpenAI 创建.

Google 报告了 Meena 在敏感性和特异性平均值 (SSA) 指标上的表现。 SSA 是由 Google 研究人员设计的一项指标，旨在量化对话实体在对话进行时回复具体、相关响应的能力。

SSA 分数是通过根据固定数量的提示测试模型来计算的，并跟踪模型给出的合理响应的数量。模型的分数是根据模型能够针对提示给出的合理/具体响应的百分比得出的。通用响应会受到惩罚。根据 Google 的数据，普通人在 SSA 上的得分约为 86%，而 Meena 的得分为 79%。另一个著名的人工智能模型，由潘多拉机器人，赢得了勒布纳奖，以表彰他们的人工智能机器人实现了复杂的类人通信。 Pandora Bots 代理在 SSA 测试中取得了大约 56% 的成绩。

微软和亚马逊也在尝试打造更灵活、更自然的聊天机器人。两年来，微软一直在尝试在聊天机器人中创建多轮对话，获取语义机是一家人工智能初创公司，旨在改进 Cortana。亚马逊最近运行了 Alexa 奖挑战，这促使参与者设计一个能够对话大约 20 分钟的机器人。