Seguici sui social

Una nuova tecnica consente all'IA di comprendere intuitivamente alcuni aspetti della fisica

Intelligenza Artificiale

Una nuova tecnica consente all'IA di comprendere intuitivamente alcuni aspetti della fisica

mm

L'intelligenza artificiale è in grado da tempo di sviluppare una comprensione della fisica attraverso l'apprendimento per rinforzo, ma una nuova tecnica sviluppato dai ricercatori del MIT potrebbe aiutare gli ingegneri a progettare modelli che dimostrino una comprensione intuitiva della fisica.

La ricerca psicologica ha dimostrato che, in una certa misura, gli esseri umani hanno una comprensione intuitiva delle leggi della fisica. I bambini hanno aspettative su come gli oggetti dovrebbero interagire e muoversi, e le violazioni di queste aspettative faranno reagire i bambini con sorpresa. La ricerca condotta dal team del MIT ha il potenziale non solo per promuovere nuove applicazioni dell'intelligenza artificiale, ma anche per aiutare gli psicologi a capire come i bambini percepiscono e imparano a conoscere il mondo.

Il modello progettato dal team del MIT si chiama ADEPT e funziona facendo previsioni su come dovrebbero comportarsi gli oggetti in uno spazio fisico. Il modello osserva gli oggetti e tiene traccia di una metrica di "sorpresa" mentre lo fa. Se accade qualcosa di inaspettato, il modello risponde aumentando il suo valore di sorpresa. Azioni inaspettate e apparentemente impossibili come un oggetto che si teletrasporta o svaniscono tutti insieme vedranno un drammatico aumento della sorpresa.

L'obiettivo del team di ricerca era quello di far sì che il loro modello registrasse gli stessi livelli di sorpresa che gli esseri umani registrano quando vedono gli oggetti comportarsi in modi non plausibili.

ADEPT ha due componenti principali, un motore fisico e un modulo grafico inverso. Il motore fisico è responsabile della previsione di come si muoverà un oggetto, prevedendo una futura rappresentazione di un oggetto, da una gamma di possibili stati. Nel frattempo, il modulo di grafica inversa è responsabile della creazione delle rappresentazioni degli oggetti che verranno inserite nel motore fisico.

Il modulo grafico inverso tiene traccia di diversi attributi come velocità, forma e orientamento di un oggetto, estraendo queste informazioni dai fotogrammi dei video. Il modulo grafico inverso si concentra solo sui dettagli più salienti, ignorando i dettagli che non aiuteranno il motore fisico a interpretare l'oggetto e prevedere nuovi stati. Concentrandosi solo sui dettagli più importanti, il modello è in grado di generalizzare meglio a nuovi oggetti. Il motore fisico quindi prende queste descrizioni degli oggetti e simula un comportamento fisico più complesso, come la fluidità o la rigidità, al fine di fare previsioni su come dovrebbe comportarsi l'oggetto.

Dopo che si verifica questo processo di acquisizione, il modello osserva l'effettivo fotogramma successivo nel video, che utilizza per ricalcolare la sua distribuzione di probabilità rispetto ai possibili comportamenti dell'oggetto. La sorpresa è inversamente proporzionale alla probabilità che si verifichi un evento, registrando una grande sorpresa solo quando c'è una grande discrepanza tra ciò che il modello ritiene dovrebbe accadere dopo e ciò che effettivamente accade dopo.

Il team di ricerca aveva bisogno di un modo per confrontare la sorpresa del loro modello con la sorpresa delle persone che osservano lo stesso comportamento dell'oggetto. Nella psicologia dello sviluppo, i ricercatori spesso testano i bambini mostrando loro due diversi video. In un video viene presentato un oggetto che si comporta come ci si aspetterebbe da oggetti nel mondo reale, non un gioco spontaneo che svanisce o si teletrasporta. Nell'altro video e l'oggetto viola in qualche modo le leggi della fisica. Il team di ricerca ha preso questi stessi concetti di base e ha chiesto a 60 adulti di guardare 64 video diversi di comportamenti fisici sia attesi che inaspettati. Ai partecipanti è stato quindi chiesto di valutare la loro sorpresa in vari momenti del video su una scala da 1 a 100.

L'analisi delle prestazioni del modello ha dimostrato che si comportava piuttosto bene nei video in cui un oggetto veniva spostato dietro un muro e scompariva quando il muro veniva rimosso, in genere eguagliando i livelli di sorpresa degli esseri umani in questi casi. Il modello sembrava essere sorpreso anche nei video in cui gli esseri umani non mostravano sorpresa, ma presumibilmente avrebbero dovuto. Ad esempio, affinché un oggetto si muovesse dietro un muro a una data velocità e uscisse immediatamente dall'altra parte del muro, doveva essersi teletrasportato o aver subito un notevole aumento di velocità.

Rispetto alle prestazioni delle reti neurali tradizionali che sono in grado di apprendere dall'osservazione ma non registrano esplicitamente la rappresentazione di un oggetto, i ricercatori hanno scoperto che la rete ADEPT era molto più precisa nel discriminare tra scene sorprendenti e non sorprendenti e che le prestazioni di ADEPT erano allineate con reazioni umane più da vicino.

Il team di ricerca del MIT mira a fare più ricerche e ottenere informazioni più approfondite su come i bambini osservano il mondo che li circonda e imparano da queste osservazioni, incorporando le loro scoperte in nuove versioni del modello ADEPT.

Blogger e programmatore con specialità in machine Learning e Deep Learning temi. Daniel spera di aiutare gli altri a usare il potere dell'intelligenza artificiale per il bene sociale.