tynkä Tekoälyt kilpailevat Minecraft-koneoppimiskilpailussa - Unite.AI
Liity verkostomme!

Tekoäly

Tekoälyt kilpailevat Minecraft-koneoppimiskilpailussa

mm
Päivitetty on

Ilmoittamat luontoPian järjestetään uusi tekoälykilpailu, MineRL-kilpailu, joka rohkaisee tekoälyinsinöörejä ja -koodaajia luomaan ohjelmia, jotka pystyvät oppimaan havainnoinnin ja esimerkin kautta. Näiden tekoälyjärjestelmien testitapaus on erittäin suosittu askartelu- ja selviytymisvideopeli Minecraft.

Tekoälyjärjestelmät ovat nähneet viime aikoina vaikuttavia saavutuksia videopeleissä. Äskettäin tekoäly voitti maailman parhaat ihmispelaajat strategiapelissä StarCraft II. StarCraft II:lla on kuitenkin määriteltävissä olevia tavoitteita, jotka on helpompi jakaa yhtenäisiksi vaiheiksi, joita tekoäly voi käyttää harjoitteluun. Paljon vaikeampi tehtävä on AI oppia navigoimaan suuressa, avoimen maailman hiekkalaatikkopelissä, kuten Minecraftissa. Tutkijat pyrkivät auttamaan tekoälyohjelmia oppimaan havainnoinnin ja esimerkin kautta, ja onnistuessaan he voivat vähentää merkittävästi tekoälyohjelman kouluttamiseen tarvittavaa prosessointitehoa.

Kilpailun osallistujilla on neljä päivää aikaa luoda tekoäly, jota testataan Minecraftin kanssa ja joka ottaa jopa kahdeksan miljoonaa askelta harjoitellakseen tekoälyään. Tekoälyn tavoitteena on löytää timantti pelistä kaivamalla. Kahdeksan miljoonaa harjoitusvaihetta on paljon lyhyempi aikajakso kuin tehokkaiden tekoälymallien kouluttamiseen nykyään tarvittava aika, joten kilpailun osallistujien on suunniteltava menetelmiä, jotka parantavat huomattavasti nykyisiä harjoitusmenetelmiä.

Osallistujien käyttämät lähestymistavat perustuvat eräänlaiseen oppimiseen, jota kutsutaan jäljitelmäoppimiseksi. Jäljitelmäoppiminen eroaa vahvistusoppimisesta, joka on suosittu menetelmä kehittyneiden järjestelmien, kuten tehtaiden robottiaseiden tai StarCraft II:n ihmispelaajien päihittämiseen kykenevien tekoälyjen kouluttamisessa. Vahvistusoppimisalgoritmien ensisijainen haittapuoli on se, että ne vaativat valtavan tietokoneen prosessointitehoa harjoitellakseen satoja tai jopa tuhansia tietokoneita, jotka on kytketty toisiinsa oppiakseen. Sitä vastoin jäljitelmäoppiminen on paljon tehokkaampi ja laskennallisesti halvempi koulutusmenetelmä. Oppimisalgoritmit pyrkivät jäljittelemään sitä, miten ihmiset oppivat havainnoinnin avulla.

William Guss, Carnegie Mellonin yliopiston syväoppimisen teorian tohtorikandidaatti, selitti Naturelle, että tekoälyn saaminen tutkimaan ja oppimaan malleja ympäristössä on äärimmäisen vaikea tehtävä, mutta jäljitelmäoppiminen tarjoaa tekoälylle tiedon perustan tai hyvää. aikaisemmat oletukset ympäristöstä. Tämä voi tehdä tekoälyn kouluttamisesta paljon nopeampaa kuin vahvistusoppiminen.

Minecraft toimii erityisen hyödyllisenä harjoitusympäristönä useista syistä. Yksi syy on se, että Minecraft antaa pelaajille mahdollisuuden käyttää yksinkertaisia ​​rakennuspalikoita monimutkaisten rakenteiden ja esineiden luomiseen, ja näiden rakenteiden luomiseen tarvittavat monet vaiheet toimivat konkreettisina edistyksen merkkeinä, joita tutkijat voivat käyttää mittareina. Minecraft on myös erittäin suosittu, ja tämän vuoksi harjoitustietojen kerääminen on suhteellisen helppoa. MineRL-kilpailun järjestäjät rekrytoivat monia Minecraft-pelaajia esittelemään erilaisia ​​tehtäviä, kuten työkalujen luomista ja lohkojen jarruttamista. Tiedon luomisen joukkolähteenä tutkijat pystyivät tallentamaan 60 miljoonaa esimerkkiä toiminnoista, joita pelissä voitaisiin tehdä. Tutkijat antoivat kilpailujoukkueille noin 1000 tuntia videota.

Käytä ihmisten keräämää tietoa, sanoo Rohin Shah, Ph.D. Kalifornian yliopiston Berkeley tietojenkäsittelytieteen kandidaatti selitti Naturelle, että tämä kilpailu on todennäköisesti ensimmäinen, joka keskittyy ihmisten jo tuottaman tiedon hyödyntämiseen tekoälyn koulutuksen nopeuttamiseksi.

Guss ja muut tutkijat toivovat, että kilpailulla voisi olla tuloksia, jotka ulottuvat Minecraftin ulkopuolelle, mikä saa aikaan parempia jäljitelmäoppimisalgoritmeja ja innostaa useampia ihmisiä harkitsemaan jäljitelmäoppimista kannattavana tekoälyn koulutuksen muotona. Tutkimus voisi mahdollisesti auttaa luomaan tekoälyjä, jotka pystyvät paremmin olemaan vuorovaikutuksessa ihmisten kanssa monimutkaisissa, muuttuvissa ympäristöissä.