Intelligenza artificiale

Nuova Tecnica Consente all’Intelligenza Artificiale di Comprendere Intuitivamente alcune Leggi della Fisica

Published December 6, 2019

Updated April 28, 2026

Daniel Nelson

L’intelligenza artificiale è stata in grado di sviluppare una comprensione della fisica attraverso l’apprendimento per rinforzo da algún tempo, ma una nuova tecnica sviluppata da ricercatori al MIT potrebbe aiutare gli ingegneri a progettare modelli che dimostrano una comprensione intuitiva della fisica.

La ricerca psicologica ha dimostrato che, in una certa misura, gli esseri umani hanno una comprensione intuitiva delle leggi della fisica. I bambini hanno aspettative su come gli oggetti dovrebbero interagire e muoversi, e le violazioni di queste aspettative faranno reagire i bambini con sorpresa. La ricerca condotta dal team del MIT ha il potenziale non solo di guidare nuove applicazioni dell’intelligenza artificiale, ma anche di aiutare gli psicologi a comprendere come i bambini percepiscono e imparano il mondo.

Il modello progettato dal team del MIT si chiama ADEPT, e funziona facendo previsioni su come gli oggetti dovrebbero comportarsi in uno spazio fisico. Il modello osserva gli oggetti e tiene traccia di una metrica di “sorpresa” mentre lo fa. Se succede qualcosa di inaspettato, il modello risponde aumentando il suo valore di sorpresa. Azioni inaspettate e apparentemente impossibili come un oggetto che si teletrasporta o scompare completamente vedranno un aumento drammatico della sorpresa.

L’obiettivo del team di ricerca era quello di far registrare al loro modello gli stessi livelli di sorpresa che gli esseri umani registrano quando vedono oggetti che si comportano in modi implausibili.

ADEPT ha due componenti principali, un motore fisico e un modulo di grafica inversa. Il motore fisico è responsabile della previsione di come un oggetto si muoverà, prevedendo una rappresentazione futura di un oggetto, da un range di stati possibili. Nel frattempo, il modulo di grafica inversa è responsabile della creazione delle rappresentazioni degli oggetti che saranno alimentate nel motore fisico.

Il modulo di grafica inversa tiene traccia di diversi attributi come la velocità, la forma e l’orientamento di un oggetto, estraendo queste informazioni da frame di video. Il modulo di grafica inversa si concentra solo sui dettagli più salienti, ignorando i dettagli che non aiuteranno il motore fisico a interpretare l’oggetto e a prevedere nuovi stati. Concentrandosi solo sui dettagli più importanti, il modello è in grado di generalizzare meglio a nuovi oggetti. Il motore fisico prende poi queste descrizioni di oggetti e simula comportamenti fisici più complessi, come la fluidità o la rigidità, per fare previsioni su come l’oggetto dovrebbe comportarsi.

Dopo che questo processo di intake si verifica, il modello osserva il frame successivo effettivo nel video, che utilizza per ricalcolare la sua distribuzione di probabilità rispetto ai comportamenti possibili degli oggetti. La sorpresa è inversamente proporzionale alla probabilità che un evento si verifichi, registrando una grande sorpresa solo quando c’è un grande mismatch tra ciò che il modello crede debba accadere dopo e ciò che accade effettivamente dopo.

Il team di ricerca aveva bisogno di un modo per confrontare la sorpresa del loro modello con la sorpresa delle persone che osservavano lo stesso comportamento degli oggetti. Nella psicologia dello sviluppo, i ricercatori spesso testano i bambini mostrando loro due diversi video. In un video, un oggetto è presentato che si comporta come ci si aspetterebbe che gli oggetti si comportino nel mondo reale, senza sparire o teletrasportarsi spontaneamente. Nell’altro video, un oggetto viola le leggi della fisica in qualche modo. Il team di ricerca ha preso questi stessi concetti di base e ha fatto guardare 60 adulti 64 diversi video di comportamento fisico atteso e inatteso. I partecipanti sono stati poi chiesti di valutare la loro sorpresa in vari momenti del video su una scala da 1 a 100.

L’analisi delle prestazioni del modello ha dimostrato che si è comportato molto bene nei video in cui un oggetto è stato mosso dietro un muro e scomparso quando il muro è stato rimosso, corrispondendo generalmente ai livelli di sorpresa umana in questi casi. Il modello è anche apparso sorpreso da video in cui gli esseri umani non hanno dimostrato sorpresa ma avrebbero dovuto farlo. Ad esempio, affinché un oggetto possa muoversi dietro un muro a una data velocità e uscire immediatamente dall’altro lato del muro, deve aver teletrasportato o subito un aumento drammatico di velocità.

Quando confrontato con le prestazioni delle reti neurali tradizionali che sono in grado di imparare dall’osservazione ma non registrano esplicitamente la rappresentazione di un oggetto, i ricercatori hanno trovato che la rete ADEPT era molto più precisa nel discriminare tra scene sorprendenti e non sorprendenti e che le prestazioni di ADEPT si allineavano più strettamente con le reazioni umane.

Il team di ricerca del MIT sta cercando di fare ulteriori ricerche e di ottenere una comprensione più profonda di come i bambini osservino il mondo intorno a loro e imparino da queste osservazioni, incorporando i loro risultati in nuove versioni del modello ADEPT.

Daniel Nelson

Blogger e programmatore con specializzazioni in Machine Learning e Deep Learning argomenti. Daniel spera di aiutare gli altri a utilizzare il potere dell'AI per il bene sociale.

Unite.AI

Nuova Tecnica Consente all’Intelligenza Artificiale di Comprendere Intuitivamente alcune Leggi della Fisica

You may like