AI 模型与平台
美國軍方即將推出自主越野作戰車輛

美國陸軍作戰能力發展司令部的陸軍研究實驗室和德克薩斯大學奧斯汀分校的研究人員開發了一個可能對自主車輛產生重大影響的算法。使用此算法,自主地面車輛可以通過觀察人類駕駛來改善自己的導航系統。
研究人員開發的方法稱為自適應規劃參數學習演示(APPLD)。它在陸軍實驗自主地面車輛上進行了測試。
研究結果發表在 IEEE 機器人和自動化信件。該工作的標題是“APPLD:自適應規劃參數學習演示。”
APPLD
加勒特·沃內爾博士是一名陸軍研究人員。
“使用APPLD等方法,目前的士兵在現有的訓練設施中可以通過正常操作車輛來改善自主系統,”沃內爾說。“這種技術將是陸軍設計和部署下一代自主作戰車輛的重要貢獻,這些車輛可以在越野部署環境中自主導航。”
為了開發這個新系統,研究人員結合了從演示中學習的機器學習算法和經典的自主導航系統。這種方法的一個最佳特點是它允許APPLD改善現有的系統,使其行為更像人類,而不是替換整個經典系統。
由於這個原因,部署的系統可以保留經典導航系統中存在的最佳性、可解釋性和安全性,並創建一個更靈活的系統,可以適應新的環境。
“一次人類駕駛的演示,使用普通的Xbox無線控制器,就可以讓APPLD學習如何根據特定的局部環境調整車輛的現有自主導航系統,”沃內爾說。“例如,在狹窄的走廊中,人類駕駛員會減速並小心駕駛。在觀察到這種行為後,自主系統學習到也會在類似的環境中減少最大速度並增加計算預算。這最終使車輛能夠在以前無法成功導航的其他狹窄走廊中自主導航。”
https://www.youtube.com/watch?v=u2xxPTZA0DY
結果表明,訓練好的APPLD系統可以比經典系統更高效、更少錯誤地導航測試環境。另外,它還可以比訓練它的人類駕駛員更快地導航環境。
彼得·斯通博士是德克薩斯大學奧斯汀分校機器人聯盟的教授和主席。
“從機器學習的角度來看,APPLD與所謂的端到端學習系統不同,後者試圖從頭學習整個導航系統,”斯通說。“這些方法往往需要大量數據,可能會導致行為不安全或不強健。APPLD利用控制系統中精心設計的部分,並專注於參數調整過程,這通常是基於單個人的直覺。”
這個新系統允許非機器人學專家訓練和改善自主車輛的導航。例如,無數用戶可以提供數據讓系統改善自己,而不是依靠一組機器人學專家手動修改系統。
約拿單·芬克博士是一名陸軍研究人員。
“當前自主導航系統通常需要手動調整以適應新的部署環境,”芬克說。“這個過程非常困難——它需要由具有機器人學專業訓練的人員完成,並需要大量試錯,直到找到正確的系統設置。相比之下,APPLD通過觀察人類駕駛系統來調整系統——這是任何人都可以做到的,如果他們有使用視頻遊戲控制器的經驗。在部署期間,APPLD還允許系統在實時環境中重新調整自己。”
軍事用途
這個系統對於陸軍來說是有用的,陸軍目前正在開發現代化的選擇性有人駕駛戰鬥車輛和機器人戰鬥車輛。目前,許多環境對於甚至是最好的自主導航系統來說都太複雜了。
雪蘇·肖博士是德克薩斯大學奧斯汀分校的博士後研究人員和論文的第一作者。
“除了對陸軍的直接相關性之外,APPLD還創造了機會,結合傳統的工程方法和新興的機器學習技術,創造出強健、適應性和多功能的移動機器人,在現實世界中,”肖說。
APPLD系統現在將在各種不同的戶外環境中進行測試。研究人員還將研究是否可以使用額外的傳感器信息來幫助系統學習更複雜的行為。












