人工智能

Google 的新 Meena 聊天机器人可以进行关于几乎任何事情的合理和具体的对话

Published February 1, 2020

Updated April 28, 2026

Daniel Nelson

虽然像 Siri、Alexa 和 Google Assistant 这样的虚拟助手很令人印象深刻和有用，但它们的对话能力通常仅限于接收某些命令和提供预定义的响应。像 Google 和 Amazon 这样的公司一直在追求能够使 AI 聊天机器人更强大和灵活的 AI 训练和开发方法，使其能够以更自然的方式与用户进行对话。据 DigitalTrends 报道，Google最近发表了一篇论文，展示了其新聊天机器人的能力，称为“Meena”。根据研究人员的博客文章，Meena 可以与用户就几乎任何话题进行对话。

Meena 是一个开放域聊天机器人，这意味着它会根据对话到目前为止的上下文做出响应，并适应输入以提供更自然的响应。大多数其他聊天机器人都是封闭域的，这意味着它们的响应围绕着某些想法和特定的任务。

根据 Google 的报告，Meena 的灵活性是由一个巨大的训练数据集得来的。Meena是在社交媒体对话中提取的约 40 亿个词的基础上训练的，并过滤掉了最相关和最具代表性的词。Google旨在解决大多数语音助手中存在的一些问题，例如处理跨多个对话回合的主题和命令的问题，用户在机器人响应一个输入后提供额外的输入。这意味着许多聊天机器人无法提示用户澄清，当有一个无法解释的查询时，它们通常只会默认为网页结果。

为了解决这个特定问题，Google 的研究人员使其算法能够跟踪对话的上下文，这意味着它可以生成特定的答案。该模型使用一个处理对话中已经说过的内容的编码器和一个基于上下文创建响应的解码器。该模型是在特定和非特定数据上训练的。特定数据是与前一条语句密切相关的词。如 Google 文章所解释的：

“例如，如果 A 说，‘我爱打网球，’而 B 回应，‘那很好，’那么这句话应该被标记为‘不具体’。这种回应可以在几十种不同的上下文中使用。但如果 B 回应，‘我也是，我无法满足罗杰·费德勒！’，那么它被标记为‘具体’，因为它与讨论的内容密切相关。

用于训练模型的数据由对话中的七个“回合”组成。在训练期间，模型有 2.6 亿个参数，检查 341 GB 的文本数据以寻找模式，数据集比用于训练 GPT-2 模型的数据集大约大 8.5 倍由 OpenAI 创建。

Google 报告了 Meena 在 Sensibleness 和 Specificity Average (SSA) 指标上的表现。SSA 是 Google 研究人员设计的一个指标，旨在量化对话实体能够以对话进行的方式回复具体、相关响应的能力。

SSA 得分是通过测试模型对固定数量的提示并跟踪模型给出的合理响应的数量来计算的。模型的得分是基于模型能够给出的合理/具体响应的百分比得出的。泛型响应会被处罚。根据 Google 的说法，平均一个人在 SSA 上的得分约为 86%，而 Meena 能够得分 79%。另一个著名的 AI 模型是 Pandora Bots 创建的代理，它赢得了 Loebner Prize，以表彰其 AI 机器人实现了复杂的人类般对话。Pandora Bots 代理在 SSA 测试中获得了大约 56% 的分数。

Microsoft 和 Amazon 也正在尝试创建更灵活和自然的聊天机器人。Microsoft 已经尝试在聊天机器人中创建多回合对话两年了，收购了语义机器，一家 AI 初创公司，以改进 Cortana。Amazon最近举办了 Alexa Prize 挑战赛，该挑战赛鼓励参与者设计一个能够进行大约 20 分钟对话的机器人。

Daniel Nelson

博客作者和程序员，专攻 Machine Learning 和 Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。

Unite.AI

Google 的新 Meena 聊天机器人可以进行关于几乎任何事情的合理和具体的对话

You may like