Kunstig intelligens
AI’er skal konkurrere i Minecraft-maskinlæringskonkurrence

Som rapporteret af Nature, finder en ny AI-konkurrence snart sted, MineRL-konkurrencen, som vil opmuntre AI-ingeniører og kodere til at skabe programmer, der kan lære gennem observation og eksempel. Testfaldet for disse AI-systemer vil være det meget populære crafting- og overlevelsesspil Minecraft.
Kunstig intelligenssystemer har set nogle imponerende bedrifter, når det kommer til videospil. Lige for nylig besejrede en AI de bedste menneskelige spillere i verden i strategispillet StarCraft II. Men StarCraft II har definerbare mål, der er nemmere at bryde ned i koherente trin, som en AI kan bruge til træning. En langt sværere opgave er for en AI at lære at navigere i et stort, åbent verden-sandkassespil som Minecraft. Forskerne sigter mod at hjælpe AI-programmer med at lære gennem observation og eksempel, og hvis de er succesfulde, kan de betydeligt reducere mængden af proceskraft, der er nødvendig for at træne et kunstigt intelligensprogram.
Deltagerne i konkurrencen vil have fire dage til at skabe en AI, der vil blive testet med Minecraft, og som kan tage op til otte millioner trin for at træne deres AI. Målet for AI’en er at finde en diamant inden for spillet ved at grave. Otte millioner træningstrin er en langt kortere tidsramme end den mængde tid, der er nødvendig for at træne kraftfulde AI-modeller i dag, så deltagerne i konkurrencen må udvikle metoder, der kan forbedre nuværende træningsmetoder betydeligt.
Tilgangene, der bruges af deltagerne, er baseret på en type læring kaldet imitation learning. Imitation learning står i modsætning til forstærkninglæring, som er en populær metode til træning af avancerede systemer som robotarme i fabrikker eller AI’er, der kan besejre menneskelige spillere i StarCraft II. Det primære problem med forstærkninglæring er, at de kræver enorme mængder computerproceskraft for at træne, og afhænger af hundredvis eller endda tusindvis af computere, der er forbundet til at lære. Imitation learning-algoritmer forsøger at efterligne, hvordan mennesker lærer gennem observation.
William Guss, en ph.d.-stipendiat i dyb-læringsteori ved Carnegie Mellon University, forklarede til Nature, at det at få en AI til at udforske og lære mønstre i en omgang er en utrolig svær opgave, men imitation learning giver AI’en en grundlæggende viden eller gode forudgående antagelser om omgangen. Dette kan gøre træning af en AI meget hurtigere i forhold til forstærkninglæring.
Minecraft fungerer som en særlig nyttig træningsmiljø af flere grunde. En grund er, at Minecraft tillader spillere at bruge simple byggeblokke til at skabe komplekse strukturer og genstande, og de mange trin, der er nødvendige for at skabe disse strukturer, fungerer som konkrete markører for fremgang, som forskerne kan bruge som metrik. Minecraft er også ekstremt populært, og på grund af dette er det relativt let at indsamle træningsdata. Arrangørerne af MineRL-konkurrencen rekrutterede mange Minecraft-spillere til at demonstrere en række opgaver som at skabe værktøjer og bryde blokke fra hinanden. Ved at crowdsourcere generationen af data kunne forskerne fange 60 millioner eksempler på handlinger, der kunne udføres i spillet. Forskerne gav omkring 1000 timer af video til konkurrenceteams.
At bruge den viden, som mennesker har opbygget, siger Rohin Shah, ph.d.-stipendiat i datalogi ved University of California, Berkeley, til Nature, at denne konkurrence sandsynligvis er den første, der fokuserer på at bruge den viden, som mennesker allerede har genereret, til at fremskynde træningen af AI.
Guss og de andre forskere er optimistiske om, at konkurrencen kunne have resultater med implikationer ud over Minecraft, og give anledning til bedre imitation learning-algoritmer og inspirere flere mennesker til at overveje imitation learning som en gyldig form for træning af en AI. Forskningen kunne potentielt hjælpe med at skabe AI’er, der er bedre i stand til at interagere med mennesker i komplekse, skiftende omgivelser.










