新的 AI 系统将改变机器人在现实世界中的适应

发布于 2024年8月13日

更新于 2026年5月21日

作者

Alex McFarland

机器人领域长期以来一直面临着一个重大挑战：训练机器人在动态的现实世界环境中有效地工作。虽然机器人在结构化的环境中，如装配线，表现出色，但教导它们在家和公共空间等不可预测的环境中导航却被证明是一个艰巨的任务。主要障碍是什么？缺乏多样化的现实世界数据来训练这些机器。

在华盛顿大学的一项新发展中，研究人员推出了两种创新的人工智能系统，这些系统可能会改变机器人在复杂的现实世界场景中的训练方式。这些系统利用视频和照片数据的力量来创建现实的模拟环境用于机器人训练。

RialTo：为机器人训练创建数字孪生

第一种系统，名为 RialTo，引入了一种新颖的方法来创建机器人的训练环境。RialTo 允许用户使用智能手机生成“数字孪生”——物理空间的虚拟复制品。

华盛顿大学计算机科学与工程学院的助理教授 Abhishek Gupta 博士和研究的共同首席作者解释了这个过程：“用户可以快速使用智能手机扫描一个空间来记录其几何形状。RialTo 然后创建一个空间的‘数字孪生’模拟。”

这种数字孪生不仅仅是一个静态的 3D 模型。用户可以与模拟进行交互，定义空间中不同对象的功能。例如，他们可以演示如何打开抽屉或操作电器。这一交互对于机器人训练至关重要。

一旦创建了数字孪生，虚拟机器人就可以在此模拟环境中反复练习任务。通过强化学习的过程，机器人学会有效地执行任务，即使考虑到潜在的干扰或环境变化。

RialTo 的美妙之处在于其将虚拟学习转移到物理世界的能力。Gupta 指出，“机器人可以将这种学习转移到物理环境中，在那里它几乎与在真实厨房中训练的机器人一样准确。”

虽然 RialTo 专注于创建特定环境的高精度模拟，但第二种系统 URDFormer 采取了更广泛的方法。URDFormer 旨在快速、廉价地生成大量通用的模拟。

华盛顿大学博士生和 URDFormer 研究的首席作者 Zoey Chen 描述了该系统的独特方法：“URDFormer 扫描互联网图像，并将它们与现有的模型配对，例如厨房抽屉和橱柜的移动方式。然后，它从初始的真实世界图像中预测一个模拟。”

这种方法使研究人员能够快速生成数百个不同的模拟环境。虽然这些模拟可能不如 RialTo 创建的模拟那么精确，但它们提供了一个关键优势：规模。训练机器人在各种场景中的能力可以显著提高它们在不同现实世界情况下的适应性。

Chen 强调了这种方法的重要性，特别是在家环境中：“家是独特的，且不断变化。有多样化的物体、任务、楼层计划和人员通过它们。这是人工智能对机器人学家真正有用的地方。”

通过利用互联网图像来创建这些模拟，URDFormer 大大减少了生成训练环境所需的成本和时间。这可能会加速开发能够在多样化现实世界环境中工作的机器人的过程。

RialTo 和 URDFormer 的引入代表了机器人训练的一个重大飞跃。这些系统有可能显著降低为机器人准备现实世界环境的成本，使该技术更加容易被研究人员、开发人员，甚至最终用户所访问。

Gupta 博士强调了这种技术的民主化潜力：“如果你可以让机器人仅通过使用手机扫描你的家就能工作，那么这就民主化了该技术。”这种可访问性可能会加速家用机器人的发展和采用，让我们更接近一个未来，家用机器人像智能手机一样普遍。

对家用机器人的影响尤其令人兴奋。由于家是机器人最具挑战性的环境之一，具有多样性和不断变化的特点，这些新训练方法可能会带来突破。通过使机器人能够学习和适应个别家庭布局和日常生活，我们可能会看到一代真正有用的家庭助手，它们能够执行广泛的任务。

虽然 RialTo 和 URDFormer 从不同的角度解决机器人训练的挑战，但它们并非相互排斥。事实上，这些系统可以协同工作，提供更全面的机器人训练计划。

“这两种方法可以互相补充，”Gupta 博士解释道。“URDFormer 对于预训练数百种场景非常有用。RialTo 特别适用于预训练机器人后，将其部署在某人的家中，并使其达到 95% 的成功率。”

这种互补方法允许进行两阶段的训练过程。首先，机器人可以使用 URDFormer 快速生成的模拟环境进行广泛的训练。这一广泛的接触有助于机器人对不同环境和任务发展出一般的理解。然后，对于特定的部署，RialTo 可以用于创建机器人将要操作的确切环境的高精度模拟，从而使其技能得到细化。

展望未来，研究人员正在探索进一步增强这些训练方法的途径。Gupta 博士提到了未来的研究方向：“在未来，RialTo 团队希望在人们的家中部署其系统（它主要是在实验室中测试的）。”这种现实世界的测试对于完善该系统和确保其在多样化家庭环境中的有效性至关重要。

尽管取得了令人乐观的进展，机器人训练领域仍然存在挑战。研究人员面临的一个关键问题是如何有效地结合现实世界数据和模拟数据。

Gupta 博士承认这一挑战：“我们仍然需要弄清楚如何最佳地结合直接在现实世界中收集的数据（这很昂贵）和在模拟中收集的数据（便宜，但略有错误）。”目标是找到一种平衡，利用模拟的成本效益同时保持现实世界数据的准确性。

对机器人行业的潜在影响是显著的。这些新训练方法可能会加速更具能力和适应性的机器人的发展，可能会在家用机器人、医疗保健等领域取得突破。

此外，随着这些训练方法变得更加成熟和易于访问，我们可能会看到机器人行业的转变。较小的公司，甚至个人开发者，都可能拥有训练复杂机器人的工具，这可能会导致创新机器人应用的激增。

未来展望令人兴奋，潜在应用范围远远超出了当前的用例。随着机器人变得更加擅长于在现实世界环境中导航和交互，我们可能会看到它们承担家庭、办公室、医院和公共空间中日益复杂的任务。

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。