人类语言加速机器人学习

发布时间 2022 年 12 月 29 日

亚历克斯麦克法兰

图片：普林斯顿大学

普林斯顿大学的一组研究人员发现，对工具的人类语言描述可以加速模拟机械臂的学习，该机械臂可以举起和使用各种工具。

这项新研究支持这样的观点，即人工智能训练可以使自主机器人在新情况下更具适应能力，从而提高其有效性和安全性。

通过在机器人的训练过程中添加工具形式和功能的描述，机器人操作新工具的能力得到了提高。

ATLA 训练方法

Anirudha Majumdar 是普林斯顿大学机械与航空航天工程系助理教授，也是智能机器人运动实验室的负责人。

“语言形式的额外信息可以帮助机器人更快地学习使用工具，”马宗达尔说。

该团队查询语言模型 GPT-3 以获取工具描述。在尝试了各种提示后，他们决定使用“以详细且科学的方式描述[工具]的[特征]”，该特征是工具的形状或用途。

Karthik Narasimhan 是计算机科学助理教授，也是该研究的合著者。 Narasimhan 也是普林斯顿大学自然语言处理 (NLP) 小组的首席教员，并作为 OpenAI 的访问研究科学家为原始 GPT 语言模型做出了贡献。

Narasimhan 说：“因为这些语言模型是在互联网上训练的，从某种意义上说，你可以将其视为比使用众包或抓取特定网站来获取工具描述更有效、更全面地检索信息的不同方式。”

该团队为他们的模拟机器人学习实验选择了一套包含 27 个工具的训练集，工具范围从斧头到橡胶扫帚。机械臂被赋予四种不同的任务：推动工具、举起工具、用它沿着桌子扫动圆柱体，或者将钉子锤入孔中。

然后，该团队通过使用有或没有语言信息的机器学习方法制定了一套策略。这些策略的性能是通过对九个具有配对描述的工具的单独测试进行比较的。

这种方法被称为元学习，可以提高机器人学习每个连续任务的能力。

Narasimhan 表示，机器人不仅学习使用每种工具，而且“尝试学习理解这一百种不同工具中每种工具的描述，因此当它看到第 101 个工具时，它会更快地学习使用新工具。 ”

在大多数实验中，语言信息为机器人使用新工具的能力提供了显着的优势。

Allen Z. Ren 是一名博士。 Majumdar 小组的学生和该研究论文的主要作者。

“通过语言训练，它学会了抓住撬棍的长端，并利用曲面更好地限制瓶子的运动，”任说。 “如果没有语言，它就会抓住曲面上的撬棍，更难控制。”

Majumdar 补充道：“总体目标是让机器人系统——特别是那些使用机器学习训练的机器人系统——推广到新的环境。”