Connect with us

Avanzando la IA Encarnada: Cómo Meta Está Llevando el Tacto y la Destreza Humanos a la IA

Robótica

Avanzando la IA Encarnada: Cómo Meta Está Llevando el Tacto y la Destreza Humanos a la IA

mm

La IA ha avanzado mucho en la percepción visual y el procesamiento del lenguaje. Sin embargo, estas habilidades no son suficientes para construir sistemas que puedan interactuar con el mundo físico. Los humanos manejan objetos o hacen movimientos controlados utilizando el sentido del tacto. Sentimos la textura, sentimos la temperatura y medimos el peso para guiar cada acción con precisión. Esta retroalimentación táctil nos permite manipular artículos frágiles, usar herramientas con control y realizar tareas intrincadas suavemente.

Meta, conocida por su trabajo en realidad virtual y aumentada, ahora se enfrenta al desafío de crear una IA que pueda interactuar con el mundo físico de manera similar a un humano. A través de su iniciativa FAIR Robotics, Meta está desarrollando herramientas y marcos de código abierto para mejorar el sentido del tacto y la agilidad física de los robots. Estos esfuerzos podrían llevar al desarrollo de la IA encarnada: sistemas que no solo ven, sino que también pueden sentir y manipular objetos como lo hacen los humanos.

¿Qué es la IA Encarnada?

La IA encarnada combina la interacción física con la inteligencia artificial, lo que permite a las máquinas sentir, responder y interactuar de manera natural con su entorno. En lugar de solo “ver” o “escuchar” entradas, permite que los sistemas de IA “sientan” y “actúen” en el mundo. Piense en un robot que pueda sentir la presión que aplica a un objeto, ajustar su agarre y moverse con agilidad. La IA encarnada mueve la IA desde las pantallas y los altavoces hacia el mundo físico, lo que la hace capaz de manipular objetos, realizar tareas y interactuar de manera más significativa con las personas.

Por ejemplo, un robot construido sobre la IA encarnada podría ayudar a una persona mayor a recoger artículos frágiles sin dañarlos. En la atención médica, podría ayudar a los médicos sosteniendo instrumentos con precisión durante la cirugía. Este potencial se extiende mucho más allá de los brazos robóticos en laboratorios o brazos automatizados en fábricas; se trata de crear máquinas que entiendan y respondan a su entorno físico en tiempo real.

El Enfoque de Meta Hacia la IA Encarnada

Meta se centra en tres áreas clave para acercar la IA encarnada al tacto humano. Primero, la empresa está desarrollando tecnologías de detección táctil avanzadas que permiten a las máquinas detectar cosas como la presión, la textura y la temperatura. Segundo, Meta está creando modelos de percepción del tacto que permiten a la IA entender y reaccionar a estas señales. Por último, Meta está construyendo una plataforma de desarrollo táctil que integra múltiples sensores con estos modelos de percepción, ofreciendo un sistema completo para construir una IA habilitada para el tacto. Aquí está cómo Meta está impulsando el progreso en la IA encarnada en cada una de estas áreas.

Meta Digit 360: Detección Táctil de Nivel Humano

Meta ha introducido Digit 360 fingertip, una tecnología de detección táctil diseñada para dar a la IA encarnada un sentido del tacto similar al humano. Con más de 18 características de detección, puede detectar vibraciones, calor y incluso productos químicos en las superficies. Equipado con un chip de IA, el fingertip procesa los datos del tacto instantáneamente, lo que permite respuestas rápidas a entradas como el calor de una estufa o la punzada de una aguja. Esta tecnología actúa como un “sistema nervioso periférico” dentro de la IA encarnada, simulando respuestas reflejas similares a las reacciones humanas. Meta ha desarrollado este fingertip con un sistema óptico único que contiene más de 8 millones de taxels que pueden capturar el tacto desde todos los ángulos. Siente detalles pequeños, hasta fuerzas tan pequeñas como un millinewton, lo que da a la IA encarnada una sensibilidad finamente ajustada a su entorno.

Meta Sparsh: La Base para la Percepción Táctil

Meta está mejorando las capacidades de percepción del tacto para ayudar a la IA a entender y responder a las sensaciones físicas. Nombrado después de la palabra sánscrita para “tacto”, Sparsh actúa como un “cerebro del tacto” para la IA encarnada. El modelo permite a las máquinas interpretar señales táctiles complejas como la presión y el agarre.

Una de las características destacadas de Sparsh es su versatilidad. Los sistemas táctiles tradicionales emplean modelos separados para cada tarea, dependiendo en gran medida de los datos etiquetados y sensores específicos. Sparsh cambia completamente este enfoque. Como un modelo de propósito general, se adapta a varios sensores y tareas. Aprende patrones de tacto utilizando aprendizaje auto-supervisado (SSL) en una base de datos masiva de más de 460,000 imágenes táctiles, sin necesidad de datos etiquetados.

Meta también ha introducido TacBench, una nueva referencia con seis tareas basadas en el tacto para evaluar las capacidades de Sparsh. Meta afirma que Sparsh superó a los modelos tradicionales en un 95,1%, especialmente en escenarios de baja cantidad de datos. Versiones de Sparsh construidas sobre las arquitecturas I-JEPA y DINO de Meta han demostrado habilidades notables en tareas como la estimación de fuerza, la detección de resbalones y la manipulación compleja.

Meta Digit Plexus: Una Plataforma para el Desarrollo de Sistemas Táctiles

Meta ha introducido Digit Plexus para integrar tecnologías de detección y modelos de percepción táctil para crear un sistema de IA encarnada. La plataforma combina sensores de fingertip y palma dentro de una mano robótica para permitir respuestas táctiles más coordinadas. Esta configuración permite a la IA encarnada procesar la retroalimentación sensorial y ajustar sus acciones en tiempo real, como lo hace una mano humana al moverse y reaccionar.

Al estandarizar la retroalimentación táctil en toda la mano, Digit Plexus mejora la precisión y el control de la IA encarnada. Este desarrollo es especialmente vital en campos como la fabricación y la atención médica, donde el manejo cuidadoso es esencial. La plataforma vincula sensores como el fingertip y ReSkin a un sistema de control, simplificando la recopilación de datos, el control y el análisis, todo a través de un solo cable.

Meta está lanzando los diseños de software y hardware para Digit Plexus a la comunidad de código abierto. El objetivo es fomentar la colaboración y acelerar la investigación en la IA encarnada, impulsando la innovación y el progreso en estos campos.

Promoviendo la Investigación y el Desarrollo de la IA Encarnada

Meta está avanzando no solo en la tecnología, sino también en los recursos para promover la investigación y el desarrollo de la IA encarnada. Una de las iniciativas clave es el desarrollo de referencias para evaluar los modelos de IA. Una de estas referencias, PARTNR (Planning And Reasoning Tasks in humaN-Robot collaboration), evalúa cómo los modelos de IA interactúan con los humanos durante las tareas domésticas. Utilizando el simulador Habitat 3.0, PARTNR proporciona un entorno realista donde los robots asisten con tareas como la limpieza y la cocina. Con más de 100,000 tareas basadas en el lenguaje, apunta a acelerar el progreso en la IA encarnada.

Además de las iniciativas internas, Meta está colaborando con organizaciones como GelSight Inc. y Wonik Robotics para acelerar la adopción de tecnologías de detección táctil. GelSight distribuirá sensores Digit 360, mientras que Wonik Robotics fabricará la Allegro Hand, que integra la tecnología Digit Plexus. Al hacer que estas tecnologías estén disponibles a través de plataformas de código abierto y asociaciones, Meta está ayudando a crear un ecosistema que podría llevar a innovaciones en la atención médica, la fabricación y la asistencia doméstica.

En Resumen

Meta está avanzando en la IA encarnada, llevándola más allá de la vista y el sonido para incluir el sentido del tacto. Con innovaciones como Digit 360 y Sparsh, los sistemas de IA están ganando la capacidad de sentir y responder a su entorno con precisión. Al compartir estas tecnologías con la comunidad de código abierto y asociarse con organizaciones clave, Meta está ayudando a acelerar el desarrollo de la detección táctil. Este progreso podría llevar a avances en campos como la atención médica, la fabricación y la asistencia en el hogar, lo que hace que la IA sea más capaz y receptiva en tareas del mundo real.

El Dr. Tehseen Zia es un profesor asociado titular en la Universidad COMSATS de Islamabad, con un doctorado en Inteligencia Artificial de la Universidad Técnica de Viena, Austria. Especializado en Inteligencia Artificial, Aprendizaje Automático, Ciencia de Datos y Visión por Computadora, ha hecho contribuciones significativas con publicaciones en revistas científicas reputadas. El Dr. Tehseen también ha liderado varios proyectos industriales como investigador principal y ha servido como consultor de Inteligencia Artificial.