Sztuczna inteligencja
Amerykańskie wojsko zbliża się do autonomicznych pojazdów bojowych dla terenów nieutwardzonych

Naukowcy z U.S. Army Combat Capabilities Development Command’s Army Research Laboratory i Uniwersytetu Teksasu w Austin opracowali algorytm, który może mieć duże znaczenie dla autonomicznych pojazdów. Dzięki temu algorytmowi, autonomiczne pojazdy lądowe mogą poprawiać swoje systemy nawigacji, obserwując jazdę człowieka.
Podejście opracowane przez naukowców nazywa się adaptacyjnym planowaniem parametrów na podstawie demonstracji, czyli APPLD. Zostało ono przetestowane na eksperymentalnym autonomicznym pojeździe lądowym armii.
Badania zostały opublikowane w IEEE Robotics and Automation Letters. Praca nosi tytuł “APPLD: Adaptive Planner Parameter Learning From Demonstration.”
APPLD
Dr. Garrett Warnell jest naukowcem armii.
“Korzystając z podejść takich jak APPLD, obecni żołnierze w istniejących obiektach szkoleniowych będą mogli przyczynić się do poprawy systemów autonomicznych, po prostu operując swoimi pojazdami w normalny sposób,” powiedział Warnell. “Techniki takie jak te będą ważnym wkładem w plany armii dotyczące zaprojektowania i wdrożenia nowej generacji pojazdów bojowych, które będą wyposażone w nawigację autonomiczną w środowiskach terenowych.”
Aby opracować nowy system, naukowcy połączyli algorytmy uczenia maszynowego z demonstracji i klasyczne systemy nawigacji autonomicznej. Jedną z najlepszych cech tego podejścia jest to, że pozwala ono APPLD na poprawę istniejącego systemu, aby zachowywał się bardziej jak człowiek, zamiast zastępować cały klasyczny system.
Dzięki temu, wdrożony system jest w stanie zachować takie cechy, jak optymalność, wyjaśnialność i bezpieczeństwo, które są obecne w klasycznych systemach nawigacji, a jednocześnie tworzy bardziej elastyczny system, który może dostosować się do nowych środowisk.
“Jedna demonstracja jazdy człowieka, przeprowadzona przy użyciu zwykłego kontrolera Xbox, pozwoliła APPLD nauczyć się, jak dostosować istniejący system nawigacji autonomicznej w zależności od konkretnego środowiska lokalnego,” powiedział Warnell. “Na przykład, gdy w wąskim korytarzu, kierowca człowiek zwolnił i jechał ostrożnie. Po obserwacji tego zachowania, system autonomiczny nauczył się również zmniejszyć swoją maksymalną prędkość i zwiększyć swój budżet obliczeniowy w podobnych środowiskach. To ostatecznie pozwoliło pojazdowi na pomyślne nawigowanie autonomicznie w innych wąskich korytarzach, gdzie wcześniej nie powiodło się. “
https://www.youtube.com/watch?v=u2xxPTZA0DY
Wyniki wykazały, że wytrenowany system APPLD mógł nawigować w testowych środowiskach bardziej wydajnie i z mniejszą ilością błędów w porównaniu z klasycznym systemem. Co więcej, mógł również nawigować w środowisku szybciej niż człowiek odpowiedzialny za szkolenie.
Dr. Peter Stone jest profesorem i przewodniczącym Konsorcjum Robotyki na Uniwersytecie Teksasu w Austin.
“Z punktu widzenia uczenia maszynowego, APPLD różni się od tzw. systemów end-to-end, które próbują nauczyć się całego systemu nawigacji od podstaw,” powiedział Stone. “Podejścia te mają tendencję do wymagania dużej ilości danych i mogą prowadzić do zachowań, które nie są ani bezpieczne, ani niezawodne. APPLD wykorzystuje części systemu sterowania, które zostały starannie zaprojektowane, koncentrując się na procesie dostrajania parametrów, który często jest wykonywany na podstawie intuicji jednej osoby.”
Nowy system pozwala osobom niebędącym ekspertami w dziedzinie robotyki na szkolenie i poprawę nawigacji pojazdów autonomicznych. Na przykład, nieograniczona liczba użytkowników mogłaby dostarczyć dane niezbędne do poprawy systemu, zamiast polegać na grupie ekspertów inżynierów, którzy ręcznie modyfikują system.
Dr. Jonathan Fink jest naukowcem armii.
“Obecne systemy nawigacji autonomicznej zwykle muszą być dostosowywane ręcznie dla każdego nowego środowiska wdrożeniowego,” powiedział Fink. “Ten proces jest bardzo trudny – musi być wykonany przez osobę z rozległym przeszkoleniem w robotyce i wymaga dużo prób i błędów, aż do znalezienia odpowiednich ustawień systemu. W przeciwieństwie do tego, APPLD dostosowuje system automatycznie, obserwując jazdę człowieka – coś, co każdy może zrobić, jeśli ma doświadczenie z kontrolerem gry wideo. Podczas wdrożenia APPLD pozwala również systemowi na dostosowanie się w czasie rzeczywistym, gdy środowisko ulega zmianie.”
Użycie wojskowe
Ten system byłby przydatny dla armii, która obecnie pracuje nad rozwojem nowoczesnych, opcjonalnie sterowanych pojazdów bojowych i robotycznych pojazdów bojowych. Jak dotąd, wiele środowisk jest zbyt złożonych nawet dla najlepszych systemów nawigacji autonomicznej.
Dr Xuesu Xiao jest naukowcem w UT Austin i głównym autorem pracy.
“Ponadto, APPLD tworzy możliwość zbudowania mostu pomiędzy tradycyjnymi podejściami inżynierskimi a nowymi technikami uczenia maszynowego, w celu stworzenia wytrzymałych, adaptacyjnych i wszechstronnych robotów mobilnych w świecie rzeczywistym,” powiedział Xiao
System APPLD zostanie teraz przetestowany w różnych środowiskach zewnętrznych. Zespół naukowców sprawdzi również, czy dodatkowe informacje sensoryczne mogą pomóc systemom nauczyć się bardziej złożonych zachowań.












