Connect with us

机器人

机器人如何学习求助

mm

在不断演变的机器人世界中,普林斯顿大学和谷歌之间的开创性合作脱颖而出。来自这些著名机构的工程师们开发了一种创新方法,教会机器人一种至关重要的技能:认识到何时需要帮助以及如何寻求帮助。这一发展标志着机器人领域的一个重大飞跃,弥合了自主运行和人机交互之间的差距。

机器人朝着更智能和独立的方向发展的过程中,始终受到一个重大挑战的阻碍:人类语言的复杂性和模糊性。与计算机代码的二元清晰度不同,人类语言充满了细微差别和微妙之处,使其成为机器人的迷宫。例如,一个简单的命令“捡起碗”可以成为一个复杂的任务,当多个碗存在时。机器人,能够感知环境并响应语言,经常在面对这种语言不确定性时陷入困境。

量化不确定性

为了应对这一挑战,普林斯顿和谷歌团队引入了一种新方法,量化人类语言的“模糊性”。这种技术本质上是测量语言命令中的不确定性水平,并使用此指标来指导机器人行为。在命令可能导致多种解释的情况下,机器人现在可以衡量不确定性水平并决定何时寻求进一步的澄清。例如,在一个有多个碗的环境中,较高的不确定性程度将促使机器人询问哪个碗需要捡起,从而避免潜在的错误或低效率。

这种方法不仅赋予机器人更好的语言理解能力,还提高了它们在任务执行中的安全性和效率。通过集成大型语言模型(LLM),如ChatGPT背后的模型,研究人员在使机器人行为更密切地符合人类的期望和需求方面迈出了重要一步。

大型语言模型的作用

大型语言模型的集成在这一新方法中发挥着至关重要的作用。LLM在处理和解释人类语言方面至关重要。在这种情况下,它们用于评估和测量给予机器人的语言命令中的不确定性。

然而,依赖LLM并非没有挑战。正如研究团队指出的,LLM的输出有时可能不可靠。

普林斯顿大学助理教授Anirudha Majumdar强调了这种平衡的重要性:

“盲目遵循LLM生成的计划可能会导致机器人以不安全或不可靠的方式行事,因此我们需要我们的LLM机器人知道何时不知道。”

这凸显了采取细致入微的方法的必要性,即将LLM用作指导工具,而不是万能的决策者。

实践应用和测试

这种方法的实用性已在各种场景中得到测试,展示了其多样性和有效性。其中一个测试涉及一个机械臂,负责将玩具食物归类到不同的类别中。这个简单的设置证明了机器人在处理明确选择的任务时的有效性。

图片:普林斯顿大学

在另一个实验中,一个机械臂安装在一个带有轮子的平台上,位于办公室厨房中。这里,机器人面临着真正的挑战,例如在多个选项中识别正确的物品以放入微波炉中。

通过这些测试,机器人成功展示了它们使用量化不确定性来做出决定或寻求澄清的能力,从而验证了这种方法的实用性。

未来影响和研究

展望未来,这项研究的影响远远超出了当前的应用。由Majumdar和研究生Allen Ren领导的团队正在探索如何将这种方法应用于机器人感知和人工智能中的更复杂问题。这包括机器人需要结合视觉和语言信息来做出决定的场景,进一步弥合机器人理解和人类交互之间的差距。

正在进行的研究旨在不仅提高机器人执行任务的准确性,还要使机器人能够以类似人类认知的方式导航世界。这项研究可能为开发更高效、更安全、更能满足人类环境中细微需求的机器人铺平道路。

您可以在 这里 找到已发表的研究。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。