Inteligencia artificial

Lumai Presenta Servidor de Inteligencia Artificial Óptica para Potenciar la Próxima Era de Inferencia

mm

Lumai ha anunciado lo que describe como un gran paso adelante en la infraestructura de inteligencia artificial: un sistema de computación óptica capaz de ejecutar modelos de lenguaje grande de parámetros de billones en tiempo real. El nuevo sistema, llamado Iris Nova, señala un cambio alejándose de la procesación tradicional basada en silicio hacia un enfoque fundamentalmente diferente construido sobre la luz.

El anuncio llega en un momento en que la industria de la inteligencia artificial está transitando rápidamente de la formación de modelos a la implementación a gran escala, lo que ejerce una presión sin precedentes sobre la infraestructura de cómputo existente.

Más allá de las Limitaciones del Silicio

Durante años, el progreso de la inteligencia artificial ha dependido en gran medida de los avances en los chips de silicio, particularmente GPU. Pero ese modelo está comenzando a mostrar signos de tensión. El consumo de energía está aumentando bruscamente, y los aumentos de rendimiento están volviéndose más difíciles de lograr sin aumentar significativamente los costos y los requisitos energéticos.

El enfoque de Lumai reemplaza electrones con fotones. En lugar de realizar cálculos a través de señales eléctricas, su sistema utiliza la luz para procesar los datos. Esto permite un paralelismo masivo, donde millones de operaciones pueden ocurrir simultáneamente en un espacio tridimensional en lugar de a través de superficies planas de silicio.

Según la empresa, esta arquitectura puede entregar un rendimiento significativamente mayor mientras reduce el consumo de energía hasta un 90% en comparación con los sistemas convencionales.

La Creciente Presión sobre los Centros de Datos

El momento de este lanzamiento refleja desafíos más amplios de la industria. Las cargas de trabajo de inteligencia artificial están expandiéndose rápidamente, particularmente en inferencia, que implica ejecutar modelos entrenados en aplicaciones del mundo real.

Los centros de datos están cada vez más limitados por la disponibilidad de energía. La demanda global de energía para centros de datos se espera que doble para fines de la década, lo que obliga a los operadores a explorar soluciones no convencionales como la generación de energía dedicada y fuentes de energía alternativas.

Al mismo tiempo, escalar el hardware tradicional se está volviendo menos eficiente. Cada nueva generación de silicio ofrece mejoras incrementales pero a menudo requiere mucha más energía y enfriamiento.

Lumai está posicionando la computación óptica como una forma de sortear estas limitaciones por completo en lugar de mejorarlas de manera incremental.

Cómo Funciona Iris Nova

El sistema Iris Nova utiliza una arquitectura híbrida que combina componentes ópticos y digitales. El motor óptico maneja las operaciones matemáticas básicas que alimentan los modelos de inteligencia artificial, mientras que los sistemas digitales convencionales gestionan las funciones de software y control.

Diseño que permite que el sistema se integre en entornos de centros de datos existentes sin requerir una revisión completa de la infraestructura.

Un área donde el sistema está particularmente optimizado es la etapa de “prefill” de la inferencia, donde los modelos procesan grandes cantidades de datos de entrada antes de generar respuestas. Al acelerar esta etapa, el sistema apunta a mejorar el rendimiento general y la eficiencia.

Lumai informa que Iris Nova puede ejecutar modelos como Llama 8B y 70B en tiempo real, lo que sugiere que es capaz de manejar cargas de trabajo a escala de producción en lugar de solo casos de uso experimentales.

Un Cambio hacia la Era de la Inferencia

El lanzamiento refleja un cambio más amplio en las prioridades de la inteligencia artificial. Mientras que la formación de modelos cada vez más grandes ha dominado los titulares, el impacto real de la inteligencia artificial ahora se define por la inferencia: cómo se pueden desplegar y escalar esos modelos de manera eficiente.

Este cambio está exponiendo cuellos de botella que eran menos visibles durante la fase de formación. Las cargas de trabajo de inferencia son continuas, sensibles a la latencia y consumen mucha energía, lo que hace que la eficiencia sea un factor crítico.

El sistema de Lumai está diseñado específicamente para esta fase, centrándose en el rendimiento por vatio en lugar del puro poder de cómputo.

Acceso Temprano y Implicaciones de la Industria

El servidor Iris Nova ya está disponible para su evaluación por parte de los hiperscalers, empresas y instituciones de investigación. Se espera que sigan más sistemas de la familia Iris, incluidos Aura y Tetra, lo que ampliará las opciones de rendimiento y despliegue.

Si la computación óptica puede cumplir con sus promesas a gran escala, podría cambiar la economía de la infraestructura de inteligencia artificial. Un menor consumo de energía y una mayor eficiencia no solo reducirían los costos operativos, sino que también abordarían las crecientes preocupaciones sobre el impacto ambiental de la inteligencia artificial.

Mientras que aún se desconoce cuán rápido se adoptará la tecnología, el anuncio de Lumai destaca una dirección clara: el futuro del cómputo de inteligencia artificial puede que no se base solo en el silicio.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.