机器人

麻省理工学院研究人员将机器人运动数据与语言模型相结合以提高任务执行效率

发布于 2024年3月27日

更新于 2026年5月22日

作者

Alex McFarland

家庭机器人越来越多地通过模仿学习被教导执行复杂任务，这是一种机器人被编程为复制人类展示的动作的过程。虽然机器人已经证明自己是优秀的模仿者，但它们经常难以适应任务执行过程中遇到的干扰或意外情况。没有明确的编程来处理这些偏差，机器人被迫从头开始任务。为了解决这个挑战，麻省理工学院的工程师正在开发一种新的方法，该方法旨在让机器人在面临意外情况时具有常识，使它们能够适应并继续执行任务，而无需手动干预。

新的方法

麻省理工学院的研究人员开发了一种方法，将机器人运动数据与大型语言模型（LLM）的“常识知识”相结合。通过连接这两个元素，该方法使机器人能够逻辑地将给定的家庭任务分解为子任务，并在每个子任务中物理地适应干扰。这使机器人能够继续执行任务，而无需从头开始，并消除了工程师需要显式编程来处理每个可能的故障的必要性。

作为麻省理工学院电气工程和计算机科学系的研究生，Yanwei Wang解释说：“使用我们的方法，机器人可以自我纠正执行错误并提高整体任务成功率。”

为了演示他们的新方法，研究人员使用了一个简单的家务：从一个碗中舀出弹珠并将它们倒入另一个碗中。传统上，工程师会将机器人通过连续的轨迹移动，经常提供多个人类示范让机器人模仿。然而，Wang指出，“人类示范是一条长的、连续的轨迹。”该团队意识到，虽然人类可能一次性演示一个任务，但该任务依赖于一系列子任务。例如，机器人必须先伸手到碗中，然后才能舀起弹珠，并且必须在移动到空碗之前舀起弹珠。

如果机器人在任何这些子任务中犯错，其唯一的选择是停止并从头开始，除非工程师显式标记每个子任务并编程或收集新的示范让机器人从故障中恢复。Wang强调说，“那种规划非常繁琐。”这就是研究人员的新方法发挥作用的地方。通过利用LLM的力量，机器人可以自动识别任务中涉及的子任务，并确定潜在的恢复操作以应对干扰。这消除了工程师需要手动编程机器人来处理每个可能的故障场景的必要性，使机器人在执行家庭任务时更加适应性和高效。

大型语言模型的作用

LLM在麻省理工学院研究人员的新方法中发挥着至关重要的作用。这些深度学习模型处理大量的文本，建立词语、句子和段落之间的联系。通过这些联系，LLM可以根据学习的模式生成新句子，基本上理解最后一个词或短语可能的后续词或短语。

研究人员意识到，LLM的这种能力可以被利用来自动识别任务中的子任务和潜在的恢复操作以应对干扰。通过将LLM的“常识知识”与机器人运动数据相结合，新方法使机器人能够逻辑地将任务分解为子任务并适应意外情况。这一LLM和机器人技术的集成有可能彻底改变家庭机器人的编程和训练方式，使它们更加适应性和能够处理现实世界的挑战。

随着机器人技术的不断进步，像LLM这样的AI技术的集成将变得越来越重要。麻省理工学院研究人员的方法是创建能够不仅模仿人类动作而且理解任务逻辑和结构的家庭机器人的一大步。这一理解将是开发能够在复杂的现实世界环境中自主高效运行的机器人的关键。

向更智能、更适应性的家庭机器人未来迈进

通过使机器人能够自我纠正执行错误并提高整体任务成功率，该方法解决了机器人编程中的一个主要挑战：适应现实世界情况的能力。

这一研究的影响远远超出了简单的弹珠任务。随着家庭机器人变得更加普遍，它们将需要能够处理动态、非结构化环境中的广泛任务。将任务分解为子任务、理解底层逻辑和适应干扰的能力将是这些机器人高效运行的必备条件。

此外，LLM和机器人技术的集成展示了AI技术改变机器人编程和训练方式的潜力。随着这些技术的不断进步，我们可以期待看到更多智能、适应性和自主的机器人出现在我们的家庭和工作场所中。

麻省理工学院研究人员的工作是创建能够真正理解和应对现实世界复杂性的家庭机器人的一个关键步骤。随着这一方法被改进和应用于更广泛的任务，它有可能改变我们生活和工作的方式，使我们的生活更加轻松和高效。

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。

Unite.AI

麻省理工学院研究人员将机器人运动数据与语言模型相结合以提高任务执行效率

新的方法

大型语言模型的作用

向更智能、更适应性的家庭机器人未来迈进

发现更多