机器人与物理 AI

新方法使人类能够帮助机器人“看到”周围环境

mm

莱斯大学的一组工程师开发了一种新方法,使人类能够帮助机器人“看到”周围环境并完成各种任务。

这种新策略被称为贝叶斯学习在黑暗中(BLIND),这是一个解决机器人在有盲点的环境中运动规划问题的新颖解决方案。

研究由计算机科学家Lydi Kavraki和Vaibhav Unhelkar领导,并由Rice大学George R. Brown工程学院的Carlos Quintero-Peña和Constantinos Chamzas共同领导。它在电气和电子工程师学会的机器人和自动化国际会议上发表。

人类在循环中

根据研究,算法保持人类在循环中以“增强机器人感知,并且,重要的是,防止执行不安全的运动。”

该团队将贝叶斯逆强化学习与成熟的运动规划技术相结合,以帮助具有许多移动部件的机器人。

为了测试BLIND,一台具有七个关节的机械臂的机器人被要求从桌子上抓取一个小圆柱体,然后将其移动到另一个地方。然而,机器人必须先绕过一个障碍。

“如果你有更多的关节,给机器人的指令就很复杂,”Quintero-Peña说。“如果你正在指挥一个人,你可以简单地说,‘抬起你的手。’”

然而,机器人需要特定的程序来描述每个关节在其轨迹中的运动,这在有障碍物阻挡其“视线”时变得更加重要。

 

学习“看到”障碍物

BLIND不会预先编程一个轨迹。相反,它在过程中插入一个人类来完善机器人算法建议的编排选项。

“BLIND允许我们获取人类头脑中的信息并在这个高自由度空间中计算我们的轨迹,”Quintero-Peña说。“我们使用一种称为批评的特定反馈方式,基本上是一种二进制反馈,人类被给予轨迹的标签。”

标签以连接的绿点出现,表示可能的路径。随着BLIND从一个点到另一个点,人类会批准或拒绝每个动作,完善路径并避开障碍物。

“这是一个容易使用的接口,因为我们可以说,‘我喜欢这个’或‘我不喜欢那个,’机器人使用这些信息来计划,”Chamzas说。机器人可以在被奖励其动作后执行其任务。

“这里最重要的事情之一是人类偏好很难用数学公式来描述,”Quintero-Peña说。“我们的工作通过整合人类偏好简化了人类-机器人关系。这就是我认为应用程序将从这项工作中获得最大的益处的地方。”

Kavraki曾与NASA的机器人Robonaut在国际空间站上合作过高级编程。

“这项工作完美地展示了如何通过一点但有针对性的人类干预来显著增强机器人在环境中执行复杂任务的能力,其中一些部分对机器人来说是完全未知的,但对人类来说是已知的,”Kavraki说。

“它展示了如何将人类-机器人交互的方法、我的同事Unhelkar教授的研究主题以及多年来在我的实验室开创的自动规划相结合,以提供可靠的解决方案,这些解决方案也尊重人类偏好。”

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。