Robotiikka
Tekoäly auttaa kouluttamaan joukkioita yhteistyössä toimivia robotti- ja drone-joukkueita

Illinoisin yliopiston Grainger College of Engineering -tutkijaryhmä on kehittänyt uuden menetelmän kouluttaa useita agentteja, kuten robotti- ja drone-joukkueita, työskentelemään yhdessä tekoälyn (AI) avulla. Agentit perustuvat vahvistusoppimiseen, joka on yksi tärkeimmistä koneoppimismenetelmistä.
Hajautettu tekniikka
Huy Tran on ilmailuteknikko yliopistossa.
“On helpompaa, kun agentit voivat puhua toistensa kanssa”, sanoi Huy Tran. “Mutta halusimme tehdä tämän hajautetulla tavalla, eli niin, että he eivät puhu toistensa kanssa. Keskityimme myös viittauksiin, joissa ei ole selvää, mitkä ovat agenttien eri roolit tai tehtävät.”
Tranin mukaan tämä skenaario on monimutkaisempi, koska ei ole selvää, mitä yksi agentti tulisi tekemään toista agenttia vastaan.
“Mielenkiintoinen kysymys on, miten opimme suorittamaan tehtävän yhdessä ajan myötä”, hän sanoi.
Vahvistusoppimismenetelmä
Tutkijaryhmä käytti koneoppimismenetelmää, jota kutsutaan vahvistusoppimiseksi, päästäkseen tämän ongelman yli. Se mahdollisti heille luoda hyötyfunktio, joka kertoo agentille, kun se tekee jotain hyödyllistä joukkueelle.
“Joukkueen tavoitteilla on vaikea tietää, kuka vaikutti voittoon”, Tran jatkoi. “Olemme kehittäneet koneoppimismenetelmän, joka mahdollistaa meille tunnistaa, kun yksittäinen agentti on vaikuttanut joukkueen globaaliin tavoitteeseen. Jos tarkastelet sitä urheilun näkökulmasta, yksi jalkapalloilija saattaa tehdä maalin, mutta haluamme myös tietää muista joukkuetoverien toimista, jotka johtivat maaliin, kuten syötöistä. On vaikea ymmärtää näitä viivästettyjä vaikutuksia.”
Tutkijoiden algoritmit tunnistavat myös, kun agentti tai robotti tekee jotain, mikä ei vaikuta tai ei edistä tavoitetta.
“Se ei ole niin, että robotti valitsi tehdä jotain väärää, vaan jotain, mikä ei ole hyödyllistä lopputavoitteelle”, hän sanoi.
Algoritmit testattiin simuloimalla pelejä, kuten StarCraft.
“StarCraft voi olla hieman enemmän arvaamaton – olimme innoissamme nähdessämme menetelmämme toimivan hyvin tässä ympäristössä.”
Tämänkaltaisia algoritmeja voidaan soveltaa moniin erilaisiin todellisiin tilanteisiin, tutkijaryhmä sanoo. Jotkut mahdollisista sovelluksista ovat sotilastiedustelu, robotit varastossa, liikenteen valvonta, itsestään toimivat ajoneuvot, jotka koordinoivat toimituksia, ja sähköverkon hallinta.
Tutkijaryhmään, joka toteutti tämän läpimurron, kuului Seung Hyun Kim, Neale Van Stralen ja Girish Chowdhary. Se esiteltiin Autonomous Agents and Multi-Agent Systems -tutkijakonferenssissa.












