Kunstmatige intelligentie
AI’s Zullen Meedoen Aan Minecraft Machine Learning Competitie

Zoals gerapporteerd door Nature, zal er binnenkort een nieuwe AI-competitie plaatsvinden, de MineRL-competitie, die AI-ingenieurs en programmeurs zal aanmoedigen om programma’s te creëren die in staat zijn om te leren door observatie en voorbeeld. Het testgeval voor deze AI-systemen zal het zeer populaire crafting- en survival-videospel Minecraft zijn.
Kunstmatige intelligentiesystemen hebben onlangs enkele indrukwekkende prestaties geleverd op het gebied van videospellen. Nog maar recentelijk versloeg een AI de beste menselijke spelers ter wereld in het strategie-spel StarCraft II. Echter, StarCraft II heeft definieerbare doelen die gemakkelijker zijn om te breken in coherente stappen die een AI kan gebruiken om te trainen. Een veel moeilijkere taak is om een AI te leren hoe hij moet navigeren in een grote, open-world sandbox-spel zoals Minecraft. Onderzoekers proberen om AI-programma’s te leren door observatie en voorbeeld, en als ze succesvol zijn, kunnen ze het benodigde verwerkingsvermogen voor het trainen van een kunstmatig intelligentieprogramma aanzienlijk verminderen.
De deelnemers aan de competitie zullen vier dagen hebben om een AI te creëren die zal worden getest met Minecraft, met maximaal acht miljoen stappen om hun AI te trainen. Het doel van de AI is om een diamant te vinden in het spel door te graven. Acht miljoen trainingsstappen is een veel kortere tijdspanne dan de tijd die nodig is om krachtige AI-modellen te trainen, dus de deelnemers aan de competitie moeten methoden ontwikkelen die de huidige trainingsmethoden aanzienlijk verbeteren.
De benaderingen die worden gebruikt door de deelnemers zijn gebaseerd op een type leren dat imitatie leren wordt genoemd. Imitatie leren staat in contrast met versterking leren, dat een populaire methode is voor het trainen van geavanceerde systemen zoals robotarmen in fabrieken of AI’s die menselijke spelers kunnen verslaan in StarCraft II. Het primaire nadeel van versterking leren algoritmen is het feit dat ze immense computerverwerkingskracht nodig hebben om te trainen, waarbij honderden of zelfs duizenden computers met elkaar zijn verbonden om te leren. In tegenstelling tot imitatie leren, is imitatie leren een veel efficiëntere en minder computationeel dure methode van trainen. Imitatie leren algoritmen proberen te imiteren hoe mensen leren door observatie.
William Guss, een PhD-kandidaat in diepe leren theorie aan de Carnegie Mellon University, legde aan Nature uit dat het krijgen van een AI om te verkennen en patronen te leren in een omgeving een enorm moeilijke taak is, maar imitatie leren geeft de AI een basis van kennis, of goede aannamen, over de omgeving. Dit kan het trainen van een AI veel sneller maken in vergelijking met versterking leren.
Minecraft dient als een bijzonder nuttige trainingsomgeving om meerdere redenen. Een reden is dat Minecraft spelers toelaat om eenvoudige bouwblokken te gebruiken om complexe structuren en items te creëren, en de vele stappen die nodig zijn om deze structuren te creëren dienen als tastbare markers van vooruitgang die onderzoekers kunnen gebruiken als metrics. Minecraft is ook extreem populair, en vanwege dit, is het relatief gemakkelijk om trainingsgegevens te verzamelen. De organisatoren van de MineRL-competitie hebben veel Minecraft-spelers gerekruteerd om een verscheidenheid aan taken te demonstreren, zoals het creëren van tools en het breken van blokken. Door het crowdsourcen van gegegensgeneratie, konden onderzoekers 60 miljoen voorbeelden van acties die in het spel konden worden genomen, verzamelen. De onderzoekers gaven ongeveer 1000 uur aan video aan de competitieteams.
Gebruik de kennis die mensen hebben opgebouwd, zegt Rohin Shah, PhD-kandidaat in computerwetenschappen aan de University of California, Berkeley, tegen Nature dat deze competitie waarschijnlijk de eerste is die zich richt op het gebruik van de kennis die mensen al hebben gegenereerd om het trainen van AI te versnellen.
Guss en de andere onderzoekers zijn hoopvol dat de wedstrijd resultaten kan opleveren met implicaties die verder gaan dan Minecraft, waardoor betere imitatie leren algoritmen ontstaan en meer mensen ertoe aanzetten om imitatie leren te overwegen als een haalbare vorm van trainen van AI. Het onderzoek kan mogelijk helpen bij het creëren van AI’s die beter in staat zijn om met mensen te communiceren in complexe, veranderende omgevingen.










