Connect with us

Inteligencia artificial

Nueva Técnica Permite a la IA Entender Intuitivamente Algunos Aspectos de la Física

mm

La inteligencia artificial ha podido desarrollar una comprensión de la física a través del aprendizaje por refuerzo desde hace algún tiempo, pero una nueva técnica desarrollada por investigadores en MIT podría ayudar a los ingenieros a diseñar modelos que demuestran una comprensión intuitiva de la física.

La investigación psicológica ha demostrado que, en cierta medida, los humanos tienen una comprensión intuitiva de las leyes de la física. Los bebés tienen expectativas de cómo deben interactuar y moverse los objetos, y las violaciones de estas expectativas harán que los bebés reaccionen con sorpresa. La investigación realizada por el equipo de MIT tiene el potencial de no solo impulsar nuevas aplicaciones de la inteligencia artificial, sino también ayudar a los psicólogos a entender cómo los bebés perciben y aprenden sobre el mundo.

El modelo diseñado por el equipo de MIT se llama ADEPT, y funciona haciendo predicciones sobre cómo deben comportarse los objetos en un espacio físico. El modelo observa los objetos y mantiene un seguimiento de una métrica de “sorpresa” a medida que lo hace. Si algo inesperado sucede, el modelo responde aumentando su valor de sorpresa. Acciones inesperadas y aparentemente imposibles, como la teleportación o la desaparición de un objeto, verán un aumento dramático en la sorpresa.

El objetivo del equipo de investigación era lograr que su modelo registre los mismos niveles de sorpresa que los humanos registran cuando ven objetos que se comportan de manera poco plausible.

ADEPT tiene dos componentes principales, un motor de física y un módulo de gráficos inversos. El motor de física es responsable de predecir cómo se moverá un objeto, prediciendo una representación futura de un objeto, a partir de un rango de estados posibles. Mientras tanto, el módulo de gráficos inversos es responsable de crear las representaciones de los objetos que se alimentarán al motor de física.

El módulo de gráficos inversos rastrea varios atributos diferentes, como la velocidad, la forma y la orientación de un objeto, extrayendo esta información de fotogramas de videos. El módulo de gráficos inversos solo se centra en los detalles más destacados, ignorando los detalles que no ayudarán al motor de física a interpretar el objeto y predecir nuevos estados. Al centrarse solo en los detalles más importantes, el modelo puede generalizar mejor a nuevos objetos. El motor de física luego toma estas descripciones de objetos y simula comportamientos físicos más complejos, como la fluidez o la rigidez, para hacer predicciones sobre cómo debe comportarse el objeto.

Después de que ocurre este proceso de ingesta, el modelo observa el fotograma real siguiente en el video, que utiliza para recalcular su distribución de probabilidad con respecto a los posibles comportamientos del objeto. La sorpresa es inversamente proporcional a la probabilidad de que un evento deba ocurrir, solo registrando una gran sorpresa cuando hay una discrepancia importante entre lo que el modelo cree que debe suceder a continuación y lo que realmente sucede a continuación.

El equipo de investigación necesitaba alguna forma de comparar la sorpresa de su modelo con la sorpresa de las personas que observan el mismo comportamiento del objeto. En la psicología del desarrollo, los investigadores a menudo prueban a los bebés mostrándoles dos videos diferentes. En un video, se presenta un objeto que se comporta como se esperaría que los objetos se comporten en el mundo real, sin desaparecer o teleportarse espontáneamente. En el otro video, un objeto viola las leyes de la física de alguna manera. El equipo de investigación tomó estos mismos conceptos básicos y les pidió a 60 adultos que vieran 64 videos diferentes de comportamiento físico esperado y no esperado. A los participantes se les pidió que calificaran su sorpresa en varios momentos del video en una escala del 1 al 100.

El análisis del rendimiento del modelo demostró que se desempeñó bastante bien en videos donde un objeto se movía detrás de una pared y desaparecía cuando se retiraba la pared, coincidiendo generalmente con los niveles de sorpresa de los humanos en estos casos. El modelo también parecía sorprenderse por videos donde los humanos no demostraron sorpresa pero podrían haberlo hecho. Por ejemplo, para que un objeto se mueva detrás de una pared a una velocidad determinada y salga inmediatamente al otro lado de la pared, debe haberse teleportado o haber experimentado un aumento dramático en la velocidad.

Al comparar el rendimiento del modelo con el de redes neuronales tradicionales que pueden aprender de la observación pero no registran explícitamente la representación de un objeto, los investigadores encontraron que la red ADEPT fue mucho más precisa para discriminar entre escenas sorprendentes y no sorprendentes, y que el rendimiento de ADEPT se alineó más estrechamente con las reacciones humanas.

El equipo de investigación de MIT tiene como objetivo realizar más investigaciones y obtener una comprensión más profunda de cómo los bebés observan el mundo que los rodea y aprenden de estas observaciones, incorporando sus hallazgos en nuevas versiones del modelo ADEPT.

Bloguero y programador con especialidades en Machine Learning y Deep Learning temas. Daniel espera ayudar a otros a utilizar el poder de la IA para el bien social.