Kunstig intelligens
Det amerikanske militær nærmer sig selvstændige off-road kampkjøretøjer

Forskere ved U.S. Army Combat Capabilities Development Command’s Army Research Laboratory og University of Texas at Austin har udviklet en algoritme, der kan have store konsekvenser for selvstændige køretøjer. Med algoritmen kan selvstændige køretøjer på jorden forbedre deres eget navigationsystem ved at iagttage en menneskelig kørsel.
Tilgangen, der er udviklet af forskerne, kaldes adaptiv planlægningsparameterlæring fra demonstration, eller APPLD. Det er testet på en eksperimentel selvstændig køretøj fra hæren.
Forskningen er offentliggjort i IEEE Robotics and Automation Letters. Arbejdet har titlen “APPLD: Adaptive Planner Parameter Learning From Demonstration.”
APPLD
Dr. Garrett Warnell er en forsker i hæren.
“Med tilgange som APPLD kan nuværende soldater i eksisterende træningsfaciliteter bidrage til forbedringer af selvstændige systemer ved blot at operere deres køretøjer som normalt,” sagde Warnell. “Teknikker som disse vil være en vigtig bidrag til hærens planer om at designe og udvikle næste generations kampkjøretøjer, der er udstyret til at navigere selvstændigt i off-road udsendelsesmiljøer.”
For at udvikle det nye system kombinerede forskerne maskinlæring fra demonstrationsalgoritmer og klassiske selvstændige navigationsystemer. En af de bedste funktioner ved denne tilgang er, at den tillader APPLD at forbedre et eksisterende system for at opføre sig mere som et menneske, i stedet for at erstatte det hele klassiske system.
På grund af dette kan det udrullede system fastholde funktioner som optimalitet, forklarbarhed og sikkerhed, der er til stede i klassiske navigationsystemer, samtidig med at det skaber et mere fleksibelt system, der kan tilpasse sig til nye miljøer.
“En enkelt demonstration af menneskelig kørsel, leveret ved hjælp af en hverdags Xbox trådløs controller, tillod APPLD at lære, hvordan man kan justere køretøjets eksisterende selvstændige navigationsystem forskelligt afhængigt af det specifikke lokale miljø,” sagde Warnell. “For eksempel, når det er i en snæver korridor, sænkede den menneskelige chauffør farten og kørte forsigtigt. Efter at have observeret dette adfærd, lærte det selvstændige system også at reducere sin maksimale hastighed og øge sin beregningsbudget i lignende miljøer. Dette tillod til sidst køretøjet at navigere selvstændigt i andre snævre korridorer, hvor det tidligere havde fejlet.”
https://www.youtube.com/watch?v=u2xxPTZA0DY
Resultaterne viste, at det trænede APPLD-system kunne navigere i testmiljøerne mere effektivt og med færre fejl sammenlignet med det klassiske system. Oven i købet kunne det også navigere i miljøet hurtigere end den menneskelige, der var ansvarlig for træningen.
Dr. Peter Stone er professor og formand for Robotics Consortium på UT Austin.
“Fra et maskinlæringsperspektiv kontrasterer APPLD med såkaldte end-to-end læringsystemer, der forsøger at lære det hele navigationsystem fra scratch,” sagde Stone. “Disse tilgange kræver ofte en masse data og kan føre til adfærd, der hverken er sikre eller robuste. APPLD udnytter de dele af kontrolsystemet, der er blevet omhyggeligt udviklet, samtidig med at det fokuserer sin maskinlæringsindsats på parameterjusteringsprocessen, der ofte udføres baseret på en enkelt persons intuition.”
Det nye system tillader ikke-eksperter på området for robotteknologi at træne og forbedre selvstændig køretøjsnavigation. For eksempel kunne en ubegrænset mængde af brugere levere de data, der er nødvendige for, at systemet kan forbedre sig selv, i stedet for at afhænge af en gruppe ekspertingeniører, der manuelt ændrer systemet.
Dr. Jonathan Fink er en forsker i hæren.
“Nuværende selvstændige navigationsystemer skal typisk genjusteres manuelt for hvert nyt udsendelsesmiljø,” sagde Fink. “Denne proces er ekstremt svær – den skal udføres af en person med omfattende træning i robotteknologi, og den kræver en masse trial og fejl, indtil de rigtige systemsindstillinger kan findes. I modsætning hertil justerer APPLD systemet automatisk ved at iagttage en menneskelig kørsel – noget, som alle kan gøre, hvis de har erfaring med en videospilcontroller. Under udsendelse tillader APPLD også systemet at genjustere sig selv i realtid, mens miljøet ændrer sig.”
Militær brug
Dette system vil være nyttigt for hæren, der for øjeblikket arbejder på at udvikle moderniserede valgfrit bemandede kampkjøretøjer og robotkampkjøretøjer. Som det er lige nu, er mange af miljøerne for komplekse for selv de bedste selvstændige navigationsystemer.
Dr. Xuesu Xiao er en postdoc-forsker på UT Austin og hovedforfatter af artiklen.
“Ud over den umiddelbare relevans for hæren skaber APPLD også muligheden for at brokke gabets mellem traditionelle ingeniørtilgange og fremvoksende maskinlærningsteknikker for at skabe robuste, adaptive og fleksible mobile robotter i den virkelige verden,” sagde Xiao
APPLD-systemet vil nu blive testet i forskellige udendørs miljøer. Forskerholdet vil også se, om yderligere sensorinformation kan hjælpe systemerne med at lære mere komplekse adfærd.












