机器人2 years ago
新型AI系统变革机器人对现实世界空间的适应方式
机器人技术领域长期以来一直面临着一个重大挑战:训练机器人在动态的现实世界环境中有效运作。虽然机器人在装配线等结构化环境中表现出色,但教会它们驾驭家庭和公共空间中不可预测的特性已被证明是一项艰巨的任务。主要障碍是什么?是训练这些机器所需的各种真实世界数据的稀缺。在华盛顿大学的一项新进展中,研究人员公布了两种创新的AI系统,它们有可能彻底改变机器人为复杂现实场景进行训练的方式。这些系统利用视频和照片数据的力量,为机器人训练创建逼真的模拟环境。RialTo:为机器人训练创建数字孪生第一个系统名为RialTo,它引入了一种为机器人创建训练环境的新方法。RialTo允许用户仅使用智能手机就能生成一个”数字孪生”——物理空间的虚拟复制品。华盛顿大学保罗·G·艾伦计算机科学与工程学院助理教授、该研究的共同资深作者Abhishek Gupta博士解释了这一过程:”用户可以用智能手机快速扫描一个空间以记录其几何结构。然后,RialTo会创建该空间的’数字孪生’模拟。”这个数字孪生不仅仅是一个静态的3D模型。用户可以与该模拟进行交互,定义空间中不同物体的功能。例如,他们可以演示抽屉如何打开或电器如何操作。这种交互性对于机器人训练至关重要。一旦数字孪生创建完成,虚拟机器人就可以在这个模拟环境中反复练习任务。通过一个称为强化学习的过程,机器人学会有效地执行任务,甚至能考虑到环境中可能出现的干扰或变化。RialTo的精妙之处在于其将这种虚拟学习转移到物理世界的能力。Gupta指出:”然后,机器人可以将这种学习转移到物理环境中,其准确度几乎与在真实厨房中训练的机器人相当。”URDFormer:从互联网图像生成模拟虽然RialTo专注于创建特定环境的高度精确模拟,但第二个系统URDFormer则采取了更广泛的方法。URDFormer旨在快速且经济高效地生成大量通用模拟。华盛顿大学博士生、URDFormer研究的主要作者Zoey Chen描述了该系统的独特方法:”URDFormer扫描互联网上的图像,并将其与现有模型(例如,关于厨房抽屉和橱柜可能如何移动的模型)配对。然后,它根据初始的真实世界图像预测出一个模拟。”这种方法使研究人员能够快速生成数百种不同的模拟环境。虽然这些模拟可能不如RialTo创建的那么精确,但它们提供了一个关键优势:规模。让机器人在各种场景下进行训练的能力,可以显著增强其对不同现实情况的适应性。Chen强调了这种方法的重要性,特别是对于家庭环境:”家庭是独特且不断变化的。其中的物体、任务、平面布局以及在其中活动的人都具有多样性。这正是AI对机器人专家真正有用的地方。”通过利用互联网图像创建这些模拟,URDFormer极大地减少了生成训练环境所需的成本和时间。这有可能加速能够在多样化现实环境中运行的机器人的开发。 普及机器人训练RialTo和URDFormer的推出,代表了向普及机器人训练迈出的重要一步。这些系统有可能大幅降低为机器人在现实环境中运行做准备的相关成本,使该技术对研究人员、开发人员乃至最终用户都更加易于获取。Gupta博士强调了这项技术的普及潜力:”如果你能仅用手机扫描一下你的房子,就能让一个机器人在里面工作,那就普及了这项技术。”这种可及性可以加速家用机器人的开发和采用,使我们更接近一个家用机器人像智能手机一样普遍的未来。这对家用机器人的影响尤其令人兴奋。由于家庭因其多样性和不断变化的特性而成为对机器人最具挑战性的环境之一,这些新的训练方法可能成为改变游戏规则的关键。通过使机器人能够学习和适应各个家庭的布局和日常习惯,我们可能会看到新一代真正有用的家庭助手,能够执行广泛的任务。互补方法:预训练与特定部署虽然RialTo和URDFormer从不同角度应对机器人训练的挑战,但它们并非互斥。事实上,这些系统可以协同工作,为机器人提供更全面的训练方案。“这两种方法可以相互补充,”Gupta博士解释道。”URDFormer对于在数百种场景上进行预训练非常有用。RialTo在你已经对机器人进行了预训练,现在想将其部署到某人的家中并希望其成功率可能达到95%时特别有用。”这种互补方法允许进行两阶段的训练过程。首先,可以使用URDFormer快速生成的模拟让机器人接触各种场景。这种广泛的接触有助于机器人对不同环境和任务形成一般性理解。然后,对于特定部署,可以使用RialTo创建机器人将要运行的确切环境的高度精确模拟,从而对其技能进行微调。展望未来,研究人员正在探索如何进一步增强这些训练方法。Gupta博士提到了未来的研究方向:”展望未来,RialTo团队希望将其系统部署在人们的家中(目前主要在实验室进行测试)。”这种现实世界的测试对于完善系统并确保其在多样化家庭环境中的有效性至关重要。挑战与未来前景尽管取得了有希望的进展,但机器人训练领域仍然存在挑战。研究人员正在努力解决的关键问题之一是如何有效地结合现实世界和模拟数据。Gupta博士承认这一挑战:”我们仍然必须找出如何最好地结合直接在现实世界中收集的数据(这很昂贵)与在模拟中收集的数据(这很便宜,但略有偏差)。”目标是找到最佳平衡点,既能利用模拟的成本效益,又能保持现实世界数据提供的准确性。这对机器人行业的潜在影响是巨大的。这些新的训练方法可以加速开发能力更强、适应性更高的机器人,有可能在从家庭协助到医疗保健等各个领域带来突破。此外,随着这些训练方法变得更加完善和易于获取,我们可能会看到机器人行业的转变。较小的公司甚至个人开发者都可能拥有训练复杂机器人的工具,这有可能引发机器人创新应用的繁荣。未来前景令人兴奋,潜在应用远远超出当前的使用案例。随着机器人变得更擅长在现实世界中导航和交互,我们可能会看到它们在家庭、办公室、医院和公共空间中承担日益复杂的任务。