Ohjelmistorobotiikka

Tekoäly auttaa kouluttamaan yhteistyörobottien ja droonien ryhmiä

Julkaistu

2 vuotta sitten

Heinäkuu 30, 2022

Illinoisin yliopiston Grainger College of Engineeringin tutkijaryhmä on kehittänyt uuden menetelmän, jolla koulutetaan useita agentteja, kuten robotteja ja droneja, toimimaan yhdessä tekoälyn (AI) kanssa. Agentit luottavat vahvistusoppimiseen, joka on yksi koneoppimistekniikoiden päätyypeistä.

Hajautettu tekniikka

Huy Tran on ilmailu-insinööri yliopistossa.

"On helpompaa, kun agentit voivat puhua toisilleen", sanoi Huy Tran. ”Mutta halusimme tehdä tämän hajautetusti, eli he eivät puhu toisilleen. Keskityimme myös lainauksiin, joissa ei ole selvää, mitä eri rooleja tai tehtäviä agenteilla tulisi olla.

Tranin mukaan tämä skenaario on monimutkaisempi, koska ei ole selvää, mitä yhden agentin pitäisi tehdä toista agenttia vastaan.

"Mielenkiintoinen kysymys on, kuinka opimme suorittamaan tehtävän yhdessä ajan myötä", hän sanoi.

Robottien kouluttaminen Capture the Flag -peliin

Training robots to play Capture the Flag

Watch this video on YouTube

Vahvistusoppimistekniikka

Tiimi luotti koneoppimistekniikkaan, jota kutsutaan vahvistusoppimiseksi, jotta tämä ongelma voidaan kiertää. Sen avulla he pystyivät luomaan aputoiminnon, joka kertoo agentille, kun se tekee jotain hyödyllistä tiimille.

"Joukkueen tavoitteilla on vaikea tietää, kuka vaikutti voittoon", Tran jatkoi. "Kehitimme koneoppimistekniikan, jonka avulla voimme tunnistaa, milloin yksittäinen agentti osallistui globaalin tiimitavoitteen saavuttamiseen. Jos tarkastellaan asiaa urheilullisesti, yksi jalkapalloilija voi tehdä maalin, mutta haluamme myös tietää muiden joukkuetovereiden maaliin johtaneista toimista, kuten syöttöpisteistä. Näitä viivästyneitä vaikutuksia on vaikea ymmärtää."

Tutkijoiden algoritmit tunnistavat myös, milloin agentti tai robotti tekee jotain, joka on vastoin tavoitetta tai ei edistä tavoitetta.

"Kyse ei ole niinkään siitä, että robotti päätti tehdä jotain väärin, vaan jotain, mikä ei ole hyödyllistä lopputavoitteen kannalta", hän sanoi.

Algoritmeja testattiin simuloiduilla peleillä, kuten StarCraftilla.

"StarCraft voi olla hieman arvaamattomampi – olimme innoissamme nähdessämme menetelmämme toimivan hyvin myös tässä ympäristössä."

Tämän tyyppinen algoritmi soveltuu erilaisiin reaalimaailman tilanteisiin, tiimi sanoo. Joitakin potentiaalisia sovelluksia ovat sotilaallinen valvonta, robotit varastossa, liikennevalojen ohjaus, toimituksia koordinoivat autonomiset ajoneuvot ja sähköverkon ohjaus.

Tämän läpimurtotutkimuksen suorittavaan tiimiin kuuluivat Seung Hyun Kim, Neale Van Stralen ja Girish Chowdhary. Se esiteltiin Autonomous Agents and Multi-Agent Systems -konferenssissa vertaisarvioinnissa.

Liittyvät aiheet:AI tekoäly Ohjelmistorobotiikka

Seuraavaksi

Uusi työkalu parantaa robottitarttujat valmistusta varten

Älä missaa

Oppimismenetelmän avulla robotit voivat oppia tarkkailemalla ihmisiä

Alex McFarland

Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.