Kunstig intelligens
AI-er skal konkurrere i Minecraft-maskinlæringskonkurransen

Ifølge Nature, skal det snart være en ny AI-konkurransen, MineRL-konkurransen, som skal oppmuntre AI-ingeniører og kodere til å lage programmer som kan lære gjennom observasjon og eksempel. Testcasen for disse AI-systemene vil være det svært populære crafting- og overlevelsesspillet Minecraft.
Kunstig intelligens-systemer har hatt noen imponerende prestasjoner når det gjelder videospill nylig. Nettopp nylig slo en AI ut de beste menneskelige spillerne i verden i strategispillet StarCraft II. Imidlertid har StarCraft II definerte mål som er lettere å bryte ned i koherente trinn som en AI kan bruke til å trene. En mye vanskeligere oppgave er å lære en AI å navigere i et stort, åpent verden-sandkassespill som Minecraft. Forskerne har som mål å hjelpe AI-programmer til å lære gjennom observasjon og eksempel, og hvis de er suksessfulle, kan de betydelig redusere mengden prosesseringskraft som trengs for å trene et kunstig intelligensprogram.
Deltagerne i konkurransen vil ha fire dager til å lage en AI som skal testes med Minecraft, og som kan ta opp til åtte millioner steg for å trene deres AI. Målet for AI-en er å finne en diamant i spillet ved å grave. Åtte millioner steg med trening er en mye kortere tidsperiode enn den tiden som trengs for å trene kraftige AI-modeller i dag, så deltagerne i konkurransen må utvikle metoder som drastisk forbedrer nåværende treningsmetoder.
Tilnærmingene som brukes av deltagerne er basert på en type læring som kalles imitasjonslæring. Imitasjonslæring står i kontrast med forsterkningslæring, som er en populær metode for å trene sofistikerte systemer som robotarmene i fabrikker eller AI-ene som kan slå menneskelige spillere i StarCraft II. Hovedulemperen med forsterkningslæringsalgoritmer er at de krever enorme mengder datamaskinkraft for å trene, og avhenger av hundrevis eller selv tusenvis av datamaskiner koblet sammen for å lære. Imitasjonslæring er derimot en mye mer effektiv og mindre datamaskinkrevende metode for å trene. Imitasjonslæring salgoritmer forsøker å etterligne hvordan mennesker lærer gjennom observasjon.
William Guss, en PhD-kandidat i dyptlærings-teori ved Carnegie Mellon University, forklarte til Nature at å få en AI til å utforske og lære mønster i en omgivelse er en usedvanlig vanskelig oppgave, men imitasjonslæring gir AI-en en basis for kunnskap, eller gode forutsetninger, om omgivelsen. Dette kan gjøre trening av en AI mye raskere i sammenligning med forsterkningslæring.
Minecraft tjener som en spesielt nyttig treningsmiljø av flere grunner. En grunn er at Minecraft tillater spillere å bruke enkle byggeklosser til å lage komplekse strukturer og gjenstander, og de mange stegene som trengs for å lage disse struktene tjener som fysiske markører for fremgang som forskerne kan bruke som målinger. Minecraft er også ekstremt populært, og på grunn av dette, er det relativt lett å samle inn treningsdata. Arrangørene av MineRL-konkurransen rekrutterte mange Minecraft-spillere til å demonstrere en rekke oppgaver som å lage verktøy og bryte apart blokker. Ved å crowdsourcet genereringen av data, kunne forskerne fange 60 millioner eksempler på handlinger som kunne tas i spillet. Forskerne ga omtrent 1000 timer med video til konkurranselagene.
Bruk kunnskapen som mennesker har bygget opp, sier Rohin Shah, PhD-kandidat i datavitenskap ved University of California, Berkeley, forklarte til Nature at denne konkurransen sannsynligvis er den første som fokuserer på å bruke kunnskapen som mennesker allerede har generert for å akselerere trening av AI.
Guss og de andre forskerne er håpefulle om at konkurransen kan ha resultater med implikasjoner utenfor Minecraft, og kan gi opphav til bedre imitasjonslæringsalgoritmer og inspirere flere mennesker til å vurdere imitasjonslæring som en livskraftig form for å trene en AI. Forskningen kan potensielt hjelpe med å skape AI-er som er bedre i stand til å samhandle med mennesker i komplekse, endrende miljøer.










