Entrevistas
Dr. Xianxin Guo, CEO y cofundador de Lumai – Serie de entrevistas

Dr. Xianxin Guo, CEO y cofundador de Lumai, es un físico y emprendedor de tecnología profunda especializado en computación óptica y hardware de inteligencia artificial, con un doctorado en física cuántica y óptica no lineal de la Universidad de Ciencia y Tecnología de Hong Kong. Anteriormente, ocupó puestos de investigación, incluyendo una posición de postdoctorado en la Universidad de Calgary y una beca de investigación 1851 en la Universidad de Oxford, donde contribuyó a avances en fotónica y aceleración de inteligencia artificial. Ascendiendo en Lumai desde jefe de investigación a CEO, es el inventor principal detrás de la tecnología central de la empresa y aporta más de una década de experiencia en la intersección de la física, el aprendizaje automático y los sistemas de computación avanzada.
Lumai es una empresa spinout de la Universidad de Oxford que desarrolla procesadores de inteligencia artificial de próxima generación basados en computación óptica 3D, utilizando la luz en lugar de electricidad para realizar cálculos de inteligencia artificial clave. Su tecnología está diseñada para acelerar las operaciones de matrices que subyacen a los modelos de inteligencia artificial modernos, lo que permite velocidades de procesamiento significativamente más rápidas mientras se reduce el consumo de energía en comparación con las GPU tradicionales basadas en silicio. Al integrar la computación óptica en entornos de centros de datos existentes, Lumai pretende permitir un despliegue de inteligencia artificial más escalable y rentable, abordando las limitaciones crecientes en torno al poder de cálculo y el consumo de energía en los sistemas de inteligencia artificial a gran escala.
Comenzó su carrera en física cuántica y óptica no lineal, y más tarde se convirtió en becario de investigación 1851 en la Universidad de Oxford antes de cofundar Lumai a partir de su investigación. ¿Cuál fue el momento crucial en el que se dio cuenta de que la computación óptica podría pasar de la teoría académica a una empresa comercialmente viable?
Durante mi tiempo en la Universidad de Oxford, estábamos explorando cómo las propiedades de la luz en el espacio libre podían utilizarse para resolver el tipo de operaciones de matrices que subyacen al aprendizaje automático. Al mismo tiempo, las limitaciones del hardware convencional para la inteligencia artificial se estaban volviendo más importantes. La convergencia de estos desafíos que habíamos resuelto en nuestra investigación y la necesidad de un cálculo más eficiente nos dio la confianza de que podríamos tomar nuestras ideas y resolver problemas del mundo real.
Hemos avanzado mucho desde esa investigación inicial – en Lumai, hemos construido ahora el primer sistema de computación óptica del mundo capaz de ejecutar modelos de lenguaje grande de parámetros en tiempo real.
Lumai está abordando uno de los cuellos de botella más grandes en la inteligencia artificial hoy en día, los límites de energía y escalabilidad de la computación basada en silicio. ¿Qué limitaciones específicas en las arquitecturas tradicionales lo llevaron hacia un enfoque fundamentalmente diferente utilizando la luz?
Lo que nos impulsó fue la trayectoria limitada de las soluciones de silicio. Con el silicio, se ven ganancias incrementales, pero vienen con aumentos desproporcionados en potencia y complejidad. La limitación de la escalabilidad del silicio se debe principalmente a la física: las frecuencias no están aumentando, y la cantidad de transistores que se pueden conmutar está limitada por los térmicos. Las corrientes de fuga siguen siendo un problema. Se estima que el silicio solo contribuye a un aumento del 25% anual en el rendimiento.
En ese punto, tiene sentido preguntar si un medio físico diferente podría manejar esas operaciones de manera más natural, en lugar de seguir empujando a los electrones con más fuerza.
Su trabajo se centra en la computación óptica y el aprendizaje automático. ¿Cómo cambia fundamentalmente el uso de fotones en lugar de electrones la forma en que ocurre la computación a nivel de hardware?
Con los electrones, la computación es inherentemente secuencial y con pérdidas – se conmutan transistores, se mueve carga, se genera calor. Cada operación tiene un costo térmico, y ese costo se acumula.
Los fotones se comportan de manera muy diferente. La luz viaja sin las mismas pérdidas resistivas, y críticamente, al utilizar las propiedades de la luz, se pueden ejecutar enormes cantidades de operaciones de matrices en paralelo simplemente estructurando cómo interactúan los haces de luz a través de un medio físico. La computación ocurre en la propagación de la luz en sí, no en la conmutación de miles de millones de puertas.
La tecnología de Lumai aprovecha el procesamiento óptico 3D y el paralelismo espacial masivo. ¿Puede explicar cómo esta arquitectura permite mejoras tan dramáticas en el rendimiento y la eficiencia en comparación con las GPU?
El objetivo es realizar la multiplicación de matrices densas de la manera más eficiente y rápida posible en un solo ciclo. El enfoque de Lumai hace exactamente esto al utilizar la luz en un volumen tridimensional, realizando millones de operaciones simultáneamente.
Simplemente no se puede lograr ese nivel de paralelismo en estructuras 2D, donde las operaciones se procesan a través de cientos de núcleos que requieren un movimiento constante de datos. Es este paralelismo inherente – combinado con el hecho de que una vez que se está en el dominio de la luz, las operaciones se pueden realizar sin consumir energía – lo que impulsa tanto la mejora del rendimiento como la reducción dramática de la energía por token.
Muchas empresas de infraestructura de inteligencia artificial todavía se centran en el entrenamiento, mientras que Lumai se centra en la inferencia. ¿Por qué cree que la inferencia es el desafío definitorio de esta próxima fase de la inteligencia artificial?
La inferencia es donde la inteligencia artificial realmente hace algo útil – cada consulta respondida, cada tarea de agente completada, cada documento generado. Ahora hemos entrado en la era de la inferencia, y la demanda está creciendo a un ritmo que el hardware enfocado en el entrenamiento nunca estuvo diseñado para absorber.
La economía también es diferente: la inferencia se ejecuta continuamente, en millones de usuarios. El costo por token se convierte en la métrica definitoria, y es allí donde el muro de energía golpea con más fuerza.
Lo que hace que la inferencia sea particularmente adecuada para la computación óptica es que la etapa de prellenado es intensiva en cálculo. En esta etapa de prellenado de inferencia desagregada, se procesa el contexto completo antes de generar una respuesta. Esto se ajusta casi perfectamente a nuestro motor óptico, y es donde nos hemos centrado primero.
Una de las desafíos de larga data en la computación óptica ha sido la estabilidad y la escalabilidad. ¿Cuáles fueron los avances técnicos clave que permitieron a Lumai superar estas barreras?
El desafío nunca fue demostrar que la óptica podría realizar cálculos – los investigadores habían demostrado que en principio durante años. El desafío era hacer que funcionara a escala, fuera del laboratorio.
Dos cosas importaron más. Primero, utilizamos los mismos componentes que ya se utilizan en los centros de datos de hoy en día para la comunicación y la red. No hay materiales exóticos, no hay cadena de suministro especulativa. Segundo, tomamos una decisión arquitectónica deliberada de utilizar un diseño híbrido, combinando el motor de tensor óptico con el procesamiento digital para el control del sistema y el software.
Su sistema utiliza un enfoque híbrido que combina componentes ópticos y digitales. ¿Qué tan importante es este equilibrio para hacer que la computación óptica sea práctica para el despliegue en centros de datos del mundo real?
Es fundamental. La computación óptica no significa reemplazar todo con luz. Los sistemas digitales son extraordinariamente buenos en el control, la secuenciación y la interfaz con el ecosistema de software que la industria ha construido durante décadas. Nuestro motor óptico sobresale en las operaciones matemáticas centrales que dominan el cálculo de inferencia. La arquitectura híbrida permite que cada componente haga lo que hace mejor.
Desde el punto de vista de la implementación, esto importa enormemente. Lumai Iris se integra en la infraestructura de centros de datos existente, utiliza interfaces estándar y ejecuta modelos reales, incluidos Llama 8B y 70B hoy en día.
Con el anuncio de la familia de servidores Lumai Iris, particularmente el servidor Iris Nova, ¿qué significa lograr la inferencia en tiempo real en modelos de parámetros de mil millones para el futuro de la infraestructura de inteligencia artificial?
Significa que la computación óptica ha cruzado de la investigación a la realidad. Ejecutar modelos de parámetros de mil millones en tiempo real es el punto de referencia que la industria necesitaba. La familia de servidores Lumai Iris consta de tres servidores: Nova, Aura y Tetra. Lumai Iris Nova, el primer servidor de la familia, está disponible para evaluación ahora, y ya estamos comprometidos con socios que quieren ponerlo a trabajar contra cargas de trabajo de inferencia reales.
Más ampliamente, significa que la trayectoria de la infraestructura de inteligencia artificial está a punto de cambiar. La suposición ha sido que escalar la inferencia significa comprar más GPU, consumir más energía, construir centros de datos más grandes. Lumai Iris Nova muestra que hay otro camino – uno que entrega un rendimiento dramáticamente mayor por kilovatio y una estructura de costos fundamentalmente diferente por token. A medida que la familia de servidores Lumai Iris se desarrolle, las implicaciones para cómo los hiperscalers y las empresas piensan en la compra de cálculo serán significativas.
El comunicado de prensa destaca una reducción de hasta el 90% en el consumo de energía en comparación con los sistemas tradicionales. ¿Qué tan significativo es este avance en el contexto de las crecientes limitaciones de energía que enfrentan los centros de datos globales?
La limitación de energía es el desafío de infraestructura definitorio de la era de la inteligencia artificial – la capacidad de energía ya es un factor limitante en los planes de despliegue y hemos golpeado el llamado muro de energía.
En este contexto, una reducción del 90% en el consumo de energía cambia la economía fundamental y la viabilidad de la inteligencia artificial a escala. Un solo sistema de Lumai puede reemplazar decenas de GPU consumidoras de energía, lo que se traduce en un cambio significativo en lo que se puede lograr dentro de un determinado límite de energía.
Hay una dimensión de costo: los costos de construcción de centros de datos reflejan la capacidad de energía, por lo que un centro de datos de baja potencia cuesta menos de construir. La reducción del consumo de energía reduce directamente el costo por token – lo que en última instancia hace que la inteligencia artificial sea viable económicamente a la escala hacia la que se dirige la industria.
Mirando hacia adelante, a medida que la industria comienza a hablar de una era post-silicio, ¿cómo ve la evolución de la computación óptica en la próxima década, y qué papel desempeñará Lumai en la configuración de esta transición?
La era post-silicio ya está comenzando, y está sucediendo al mismo tiempo que el cambio a la era de la inferencia y la continua demanda de más rendimiento a un costo por token más bajo. El silicio, por supuesto, seguirá desempeñando un papel, pero la suposición de que cada generación de mejora del cálculo proviene de la mejora de los nodos de silicio ya no es creíble a la tasa que la inteligencia artificial exige. Vemos la computación óptica siendo utilizada en partes clave de la pila donde se necesita un procesamiento paralelo y de alto rendimiento.
Para Lumai, la hoja de ruta es seguir empujando la densidad, la eficiencia y la capacidad de la computación óptica y desplegarla en centros de datos. La visión es un mundo donde el costo de energía de la inteligencia disminuye y donde un centro de datos de escala megavatio puede generar el mismo volumen de tokens que una instalación de escala gigavatio hoy en día.
That futuro no es una especulación lejana. Hemos construido el primer sistema que demuestra que la computación óptica funciona a escala. Todo lo que sigue es ingeniería.
Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar Lumai.












