Connect with us

Pensar fuera de la caja para impulsar la innovación en IA

Líderes de opinión

Pensar fuera de la caja para impulsar la innovación en IA

mm

Para muchos de nosotros que innovamos en el espacio de IA, estamos trabajando en un territorio inexplorado. Dado lo rápido que las empresas de IA están desarrollando nuevas tecnologías, uno podría dar por sentado el trabajo incansable que se realiza detrás de escena. Pero en un campo como XR, donde la misión es borrar las líneas entre el mundo real y el digital — no hay mucha data histórica o investigación en la que apoyarse; por lo que debemos pensar fuera de la caja.

Mientras que es más conveniente confiar en la sabiduría convencional de aprendizaje automático y prácticas comprobadas, esto a menudo no es posible (o la solución completa) en campos emergentes. Para resolver problemas que nunca se han resuelto antes, deben abordarse de nuevas maneras.

Es un desafío que te obliga a recordar por qué entraste en el campo de la ingeniería, la ciencia de datos o el desarrollo de productos en primer lugar: una pasión por el descubrimiento. Lo experimento todos los días en mi papel en Ultraleap, donde desarrollamos software que puede rastrear y responder a los movimientos de la mano humana en un entorno de realidad mixta. Gran parte de lo que creíamos saber sobre el entrenamiento de modelos de aprendizaje automático se invierte en nuestro trabajo, ya que la mano humana — junto con los objetos y entornos que encuentra — es extremadamente impredecible.

A continuación, se presentan algunos enfoques que mi equipo y yo hemos adoptado para reinventar la experimentación y la ciencia de datos para llevar la interacción intuitiva al mundo digital, que es precisa y se siente tan natural como lo sería en el mundo real.

Innovar dentro de los límites

Cuando se innova en un espacio naciente, a menudo se enfrentan restricciones que parecen estar en conflicto entre sí. Mi equipo se encarga de capturar las complejidades de los movimientos de la mano y los dedos, y cómo las manos y los dedos interactúan con el mundo que los rodea. Todo esto se empaqueta en modelos de seguimiento de manos que aún caben en el hardware de XR con cálculo restringido. Esto significa que nuestros modelos — aunque sofisticados y complejos — deben ocupar significativamente menos almacenamiento y consumir significativamente menos energía (en una proporción de 1/100,000) que los grandes LLM que dominan los titulares. Nos presenta un desafío emocionante, que requiere experimentación y evaluación implacables de nuestros modelos en su aplicación en el mundo real.

Pero las innumerables pruebas y experimentos valen la pena: crear un modelo poderoso que aún entrega un bajo costo de inferencia, consumo de energía y latencia es una maravilla que se puede aplicar en la informática de borde incluso fuera del espacio de XR.

Las restricciones con las que nos encontramos al experimentar también afectarán a otras industrias. Algunas empresas tendrán desafíos únicos debido a las sutilezas en sus dominios de aplicación, mientras que otras pueden tener datos limitados para trabajar debido a que se encuentran en un nicho de mercado que los grandes jugadores de la tecnología no han tocado.

Mientras que las soluciones de un tamaño que se adapta a todos pueden ser suficientes para algunas tareas, muchos dominios de aplicación necesitan resolver problemas reales y desafiantes específicos de su tarea. Por ejemplo, las líneas de montaje automotriz implementan modelos de ML para la inspección de defectos. Estos modelos tienen que lidiar con imágenes de muy alta resolución que se necesitan para identificar pequeños defectos en una gran superficie de un automóvil. En este caso, la aplicación exige un alto rendimiento, pero el problema a resolver es cómo lograr un bajo ritmo de cuadros, pero una resolución alta, modelo.

Evaluación de arquitecturas de modelos para impulsar la innovación

Un conjunto de datos bueno es la fuerza impulsora detrás de cualquier avance exitoso de IA. Pero, ¿qué hace que un conjunto de datos sea “bueno” para un objetivo en particular? Y cuando se resuelven problemas que nunca se han resuelto antes, ¿cómo se puede confiar en que los datos existentes serán relevantes? No podemos asumir que las métricas que son buenas para algunas tareas de ML se traducen en el rendimiento de una tarea empresarial específica. Aquí es donde se nos llama a ir en contra de las “verdades” comúnmente aceptadas de ML y, en cambio, explorar activamente cómo etiquetamos, limpiamos y aplicamos tanto datos simulados como del mundo real.

Por naturaleza, nuestro dominio es desafiante para evaluar y requiere aseguramiento de calidad manual – realizado a mano. No solo estamos mirando las métricas de calidad de nuestros datos. Iteramos en nuestros conjuntos de datos y fuentes de datos y los evaluamos en función de las cualidades de los modelos que producen en el mundo real. Cuando reevaluamos cómo calificamos y clasificamos nuestros datos, a menudo encontramos conjuntos de datos o tendencias que de otra manera habríamos pasado por alto. Ahora, con esos conjuntos de datos, y los innumerables experimentos que nos mostraron qué datos no confiar, hemos desbloqueado una nueva avenida que nos faltaba antes.

La última plataforma de seguimiento de manos de Ultraleap, Hyperion, es un gran ejemplo de esto. Los avances en nuestros conjuntos de datos nos ayudaron a desarrollar un seguimiento de manos más sofisticado que puede rastrear microgestos, así como movimientos de la mano, incluso cuando el usuario sostiene un objeto.

 Un pequeño paso atrás, un gran salto adelante

Mientras que el ritmo de la innovación aparentemente nunca se desacelera, podemos. Estamos en el negocio de experimentar, aprender, desarrollar y, cuando tomamos el tiempo para hacer solo eso, a menudo creamos algo de mucho más valor que cuando vamos según el libro y nos apresuramos a lanzar la próxima innovación tecnológica. No hay sustituto para los avances que ocurren cuando exploramos nuestras anotaciones de datos, cuestionamos nuestras fuentes de datos y redefinimos las métricas de calidad en sí. Y la única forma en que podemos hacer esto es experimentando en el dominio de aplicación real con el rendimiento del modelo medido contra la tarea. En lugar de ver los requisitos y las restricciones poco comunes como limitaciones, podemos tomar estos desafíos y convertirlos en oportunidades para la innovación y, en última instancia, una ventaja competitiva.

Iain Wallace es el Director de Investigación de Aprendizaje Automático y Seguimiento en Ultraleap, un líder global en visión por computadora y aprendizaje automático. Él es un científico de la computación fascinado por la investigación y el desarrollo de sistemas de inteligencia artificial enfocados en aplicaciones. En Ultraleap, Iain lidera su equipo de investigación de seguimiento de manos para habilitar nuevas interacciones en AR, VR, MR, fuera de casa y en cualquier otro lugar donde interactúe con el mundo digital. Obtuvo su MEng en Sistemas y Ingeniería de Software de Computadora en la Universidad de York y su Ph.D. en Informática (Inteligencia Artificial) de la Universidad de Edimburgo.