Robotics
AI hjelper med å trene team med samarbeidende roboter og droner

Et team av forskere ved University of Illinois Grainger College of Engineering har utviklet en ny metode for å trene flere agenter som roboter og droner til å arbeide sammen med bruk av kunstig intelligens (AI). Agentene er avhengige av forsterkende læring, som er en av hovedtypene for maskinlæringsteknikker.
Desentralisert teknikk
Huy Tran er luftfartsingeniør ved universitetet.
"Det er lettere når agenter kan snakke med hverandre," sa Huy Tran. "Men vi ønsket å gjøre dette på en måte som er desentralisert, noe som betyr at de ikke snakker med hverandre. Vi fokuserte også på siteringer der det ikke er åpenbart hva de forskjellige rollene eller jobbene til agentene skal være.»
Ifølge Tran er dette scenariet mer komplekst fordi det ikke er klart hva en agent skal gjøre mot en annen agent.
"Det interessante spørsmålet er hvordan lærer vi å utføre en oppgave sammen over tid," sa han.
Forsterkende læringsteknikk
Teamet stolte på maskinlæringsteknikken kalt forsterkningslæring for å komme rundt dette problemet. Det gjorde dem i stand til å lage en hjelpefunksjon som forteller agenten når den gjør noe nyttig for teamet.
"Med lagmål er det vanskelig å vite hvem som bidro til seieren," fortsatte Tran. "Vi utviklet en maskinlæringsteknikk som lar oss identifisere når en individuell agent bidro til det globale teammålet. Hvis du ser på det i form av sport, kan en fotballspiller score, men vi vil også vite om handlinger fra andre lagkamerater som førte til målet, som assists. Det er vanskelig å forstå disse forsinkede effektene.»
Forskernes algoritmer identifiserer også når en agent eller robot gjør noe som går imot, eller ikke bidrar til målet.
"Det er ikke så mye roboten valgte å gjøre noe galt, bare noe som ikke er nyttig for sluttmålet," sa han.
Algoritmene ble testet ved hjelp av simulerte spill, for eksempel StarCraft.
"StarCraft kan være litt mer uforutsigbar - vi var glade for å se metoden vår fungere godt i dette miljøet også."
Denne typen algoritme kan brukes i ulike situasjoner i den virkelige verden, sier teamet. Noen av de potensielle bruksområdene inkluderer militær overvåking, roboter i et lager, trafikksignalkontroll, autonome kjøretøy som koordinerer leveranser og kontrollerer et elektrisk strømnett.
Teamet som utførte denne banebrytende forskningen inkluderte Seung Hyun Kim, Neale Van Stralen og Girish Chowdhary. Den ble presentert på den fagfellevurderte konferansen Autonomous Agents and Multi-Agent Systems.