mozzicone L'intelligenza artificiale lotta per padroneggiare Minecraft attraverso l'apprendimento per imitazione - Unite.AI
Seguici sui social

Intelligenza Artificiale

L'intelligenza artificiale lotta per padroneggiare Minecraft attraverso l'apprendimento per imitazione

mm
aggiornato on

Negli ultimi mesi, Microsoft e altre società di ricerca sull'apprendimento automatico hanno sfidato team di sviluppatori di intelligenza artificiale a creare un sistema di intelligenza artificiale in grado di giocare a Minecraft e trovare un diamante all'interno del gioco. Come riportato dalla BBC, mentre le piattaforme AI sono riuscite a dominare gli scacchi e andare, ma ha faticato a padroneggiare un compito in Minecraft.

La sfida AI basata su Minecraft di Microsoft si chiamava MineRL e i risultati della competizione sono stati formalmente annunciati alla recente conferenza NeurIPS. L'intenzione del concorso era quella di addestrare un'intelligenza artificiale attraverso un approccio di "apprendimento per imitazione". L'apprendimento per imitazione è un metodo in cui un'intelligenza artificiale viene addestrata attraverso l'uso dell'osservazione. L'apprendimento per imitazione intende consentire ai sistemi di intelligenza artificiale di apprendere le azioni osservando gli esseri umani che compiono tali azioni, apprendendo attraverso l'atto dell'osservazione. L'apprendimento per imitazione, rispetto all'apprendimento per rinforzo, è un modo molto meno costoso dal punto di vista computazionale e sostanzialmente più efficiente di addestrare un'intelligenza artificiale.

L'apprendimento per rinforzo spesso richiede molti computer potenti collegati in rete insieme e centinaia o migliaia di ore di formazione per diventare efficaci in un'attività. Al contrario, un'intelligenza artificiale addestrata con un metodo di apprendimento per imitazione può essere addestrata molto più rapidamente, poiché l'IA ha già una base di conoscenza con cui lavorare per gentile concessione degli operatori umani che l'hanno proceduto.

L'apprendimento per imitazione ha applicazioni pratiche nell'addestramento di un'intelligenza artificiale in cui l'IA non può esplorare in sicurezza finché non scopre le azioni corrette. Tali scenari includerebbero l'addestramento di un veicolo autonomo poiché l'auto non può essere autorizzata a vagare per una strada fino a quando non ha appreso i comportamenti desiderati. L'utilizzo dei dati di un dimostratore umano per addestrare il veicolo potrebbe potenzialmente rendere il processo più rapido e sicuro.

L'atto di trovare un diamante in Minecraft richiede l'esecuzione di molti passaggi in sequenza, come abbattere alberi per creare strumenti, esplorare le grotte che contengono i diamanti e trovare effettivamente un diamante all'interno della grotta. Nonostante la complessità del compito, un giocatore umano che abbia familiarità con il gioco dovrebbe essere in grado di ottenere un diamante in circa 20 minuti.

Oltre 660 diversi agenti IA sono stati presentati alla competizione, ma nessuno degli IA è riuscito a trovare un diamante. I dati forniti per addestrare l'IA erano un set di dati contenente oltre 60 milioni di frame di gameplay raccolti da molti giocatori umani. Le posizioni dei diamanti vengono randomizzate quando viene avviata un'istanza del gioco, quindi ciò significa che le IA non possono semplicemente guardare dove i giocatori umani hanno trovato i diamanti. In altre parole, le IA devono comprendere come i concetti, come la creazione di strumenti, l'utilizzo di strumenti, l'esplorazione e la ricerca di risorse, siano collegati tra loro.

Nonostante il fatto che nessuno degli agenti di intelligenza artificiale sia riuscito a trovare un diamante, il team organizzativo era comunque soddisfatto dei risultati della competizione e molto era stato appreso dall'esperimento. La ricerca condotta dai team di intelligenza artificiale può aiutare a far progredire il campo dell'IA, trovando alternative alle strategie di apprendimento per rinforzo.

L'apprendimento per rinforzo spesso offre prestazioni superiori rispetto all'apprendimento per imitazione, con un notevole successo dell'apprendimento per rinforzo che è AlphaGo di DeepMind. Tuttavia, come notato in precedenza, l'apprendimento per rinforzo richiede enormi risorse di calcolo, limitandone l'utilizzo da parte di organizzazioni che non possono permettersi processori informatici su larga scala.

William Guss, PhD Student presso la Carnegie Mellon University e capo organizzatore del concorso, spiegato alla BBC che il concorso MineRL aveva lo scopo di indagare alternative all'IA computazionalmente pesante. Guss ha detto:

"... Lanciare enormi quantità di calcolo ai problemi non è necessariamente il modo giusto per noi di spingere lo stato dell'arte come campo... Funziona direttamente contro la democratizzazione dell'accesso a questi sistemi di apprendimento per rinforzo e lascia la capacità di addestrare agenti in ambienti complessi a aziende con ampie aree di calcolo".