人工智能
美军接近实现自主越野作战车辆

美国陆军作战能力开发司令部的陆军研究实验室和德克萨斯大学奥斯汀分校的研究人员开发了一种算法,这可能对自主车辆产生重大影响。使用此算法,自主地面车辆可以通过观察人类驾驶来改进自己的导航系统。
研究人员开发的方法称为自适应规划器参数学习演示(APPLD)。它在一辆陆军实验自主地面车辆上进行了测试。
该研究发表在 IEEE 机器人与自动化信札中。 该研究的标题为“APPLD:自适应规划器参数学习演示。”
APPLD
加勒特·沃内尔博士是一名陆军研究人员。
“使用像 APPLD 这样的方法,现有的士兵在现有的训练设施中将能够通过正常操作车辆来改进自主系统,”沃内尔说。“像这样的技术将是陆军计划设计和部署下一代自主作战车辆的重要贡献,这些车辆能够在越野部署环境中自主导航。”
为了开发新的系统,研究人员将演示算法和经典的自主导航系统相结合。这种方法的一个最好的特点是,它允许 APPLD 改进现有的系统,使其行为更像人类,而不是替换整个经典系统。
由于此原因,部署的系统能够保留优化、可解释性和安全性等特点,这些特点存在于经典导航系统中,同时也创建了一个更灵活的系统,可以适应新的环境。
“人类驾驶的一个演示,使用日常的 Xbox 无线控制器,允许 APPLD 学习如何根据特定的本地环境调整车辆的现有自主导航系统,”沃内尔说。“例如,当在狭窄的走廊中,人类驾驶员减速并谨慎驾驶。在观察到这种行为后,自主系统学习到也减少其最大速度并增加其计算预算,在类似的环境中。这最终使车辆能够在以前失败的其他狭窄走廊中成功自主导航。”
https://www.youtube.com/watch?v=u2xxPTZA0DY
结果表明,经过训练的 APPLD 系统可以更高效、更少错误地导航测试环境,甚至比训练它的人类还快。
彼得·斯通博士是德克萨斯大学奥斯汀分校机器人联合会的教授和主席。
“从机器学习的角度来看,APPLD 与所谓的端到端学习系统形成对比,这些系统试图从头开始学习整个导航系统,”斯通说。“这些方法往往需要大量数据,并可能导致行为不安全或不稳健。APPLD 利用控制系统中精心设计的部分,同时专注于参数调整过程,这通常是基于一个人的一种直觉。”
新的系统允许机器人领域的非专家训练和改进自主车辆导航。例如,任意数量的用户都可以提供系统改进所需的数据,而不是依赖一组专家工程师手动修改系统。
乔纳森·芬克博士是一名陆军研究人员。
“当前的自主导航系统通常必须为每个新部署环境手动重新调整,”芬克说。“这个过程非常困难——它必须由具有机器人专业知识的人完成,并且需要大量的试验和错误,直到找到正确的系统设置。相比之下,APPLD 通过观察人类驾驶来自动调整系统——任何人都可以做到这一点,如果他们有使用视频游戏控制器的经验。在部署期间,APPLD 也允许系统在环境变化时实时重新调整自己。”
军事用途
该系统将对陆军有用,陆军目前正在开发现代化的可选有人驾驶战斗车辆和机器人战斗车辆。目前,许多环境对于甚至是最好的自主导航系统来说都太复杂了。
肖雪博士是德克萨斯大学奥斯汀分校的博士后研究人员,也是论文的第一作者。
“除了对陆军的直接相关性之外,APPLD 还为传统工程方法和新兴机器学习技术之间的差距提供了桥梁,以创建强大的、适应性强的、多功能的移动机器人,在现实世界中,”肖说
APPLD 系统现在将在各种不同的户外环境中进行测试。研究团队还将研究是否可以使用其他传感器信息来帮助系统学习更复杂的行为。












