인공지능

미국 군대, 자율 주행 오프로드 전투 차량 개발에 한 걸음 더近

Published August 21, 2020

Updated April 28, 2026

Alex McFarland

미국 육군 전투 능력 개발 사령부(Army Combat Capabilities Development Command)의 육군 연구소(Army Research Laboratory)와 텍사스 오스틴 대학교(University of Texas at Austin)의 연구자들은 자율 주행 차량에 큰 영향을 미칠 수 있는 알고리즘을 개발했다. 이 알고리즘을 통해 자율 주행 지상 차량은 인간의 운전을 관찰함으로써 자신의 내비게이션 시스템을 개선할 수 있다.

연구자들이 개발한 접근 방법은 시연을 통한 적응형 계획자 매개변수 학습(Adaptive Planner Parameter Learning from Demonstration, APPLD)이라고 불린다. 이것은 육군의 실험 자율 주행 지상 차량에서 테스트되었다.

이 연구는 IEEE Robotics and Automation Letters에 발표되었으며, 제목은 “APPLD: Adaptive Planner Parameter Learning From Demonstration”이다.

APPLD

개리엇 워넬 박사(Dr. Garrett Warnell)는 육군 연구자이다.

“APPLD와 같은 접근 방법을 사용하면, 현재의 훈련 시설에서 훈련받은 군인들이 단순히 차량을 운전함으로써 자율 시스템의 개선을 기여할 수 있다”고 워넬은 말했다. “이러한 기술은 육군이 차세대 전투 차량을 설계하고 개발하는 데 중요한 기여가 될 것이다. 이 차량은 오프로드 환경에서 자율적으로 내비게이션할 수 있을 것이다.”

새로운 시스템을 개발하기 위해, 연구자들은 시연을 통한 기계 학습 알고리즘과 고전적인 자율 주행 내비게이션 시스템을 결합했다. 이 접근 방법의 가장 좋은 특징은 APPLD가 기존 시스템을 개선하여 인간과 같은 행동을 하도록 하는데 있다. 기존의 고전적인 시스템을 완전히 대체하는 것이 아니다.

이로 인해, 배포된 시스템은 기존의 고전적인 내비게이션 시스템에서 최적성, 설명 가능성, 안전성과 같은 기능을 유지하면서도, 새로운 환경에 적응할 수 있는 더 유연한 시스템을 만들 수 있다.

“인간의 운전을 단 한 번 관찰함으로써, APPLD는 차량의 기존 자율 주행 내비게이션 시스템을 특정한 지역 환경에 따라 다르게 조정할 수 있다”고 워넬은 말했다. “예를 들어, 좁은 복도에서 인간 운전자는 속도를 줄이고 조심스럽게 운전했다. 이러한 행동을 관찰한 후, 자율 시스템은 유사한 환경에서 최대 속도를 줄이고 계산 예산을 증가시킴으로써 성공적으로 내비게이션할 수 있었다.”

https://www.youtube.com/watch?v=u2xxPTZA0DY

결과는 훈련된 APPLD 시스템이 테스트 환경을 더 효율적으로 그리고 오류가 적게 내비게이션할 수 있음을 보여주었다. 또한, 이는 훈련에 사용된 인간보다 더 빠르게 내비게이션할 수 있었다.

피터 스톤 박사(Dr. Peter Stone)는 텍사스 오스틴 대학교의 로봇트 연구소 소장이다.

“기계 학습의 관점에서, APPLD는 처음부터 전체 내비게이션 시스템을 학습하려고 하는 엔드투엔드 학습 시스템과 대조된다”고 스톤은 말했다. “이러한 접근 방법은 많은 데이터를 요구하며, 안전하지도 않고, 강력하지도 않은 행동을 유도할 수 있다. APPLD는 신중하게 설계된 제어 시스템의 부분을 활용하며, 기계 학습 노력을 매개변수 조정 과정에 집중한다. 이는 종종 한 사람의 직관에 따라 수행된다.”

새로운 시스템은 로봇트 분야의 비전문가들이 자율 주행 차량의 내비게이션을 훈련하고 개선할 수 있도록 한다. 예를 들어, 무제한의 사용자가 시스템을 개선하기 위해 필요한 데이터를 제공할 수 있다. 이는 전문 로봇트 엔지니어들이 수동으로 시스템을 수정하는 것에 의존하는 것보다 더 효율적이다.

조나단 핑크 박사(Dr. Jonathan Fink)는 육군 연구자이다.

“현재의 자율 주행 내비게이션 시스템은 일반적으로 새로운 배치 환경에 대해 수동으로 조정해야 한다”고 핑크는 말했다. “이 과정은 매우 어렵다. 로봇트에 대한 광범위한 훈련을 받은 사람에 의해 수행되어야 하며, 올바른 시스템 설정을 찾을 때까지 많은 시도와 오류가 필요하다. 반면, APPLD는 인간이 운전하는 것을 관찰함으로써 시스템을 자동으로 조정한다. 이는 비디오 게임 컨트롤러를 사용하는 경험을 가진 누구든지 할 수 있는 일이다. 배치 중에 APPLD는 또한 환경이 변경됨에 따라 시스템을 실시간으로 다시 조정할 수 있다.”