Líderes de opinión

Domesticar a la bestia: Cómo los reguladores de voltaje integrados están resolviendo la crisis de energía de la IA

mm

La inteligencia artificial es voraz. Desde entrenar modelos de lenguaje masivos hasta alimentar inferencia en tiempo real en la nube, las demandas computacionales de la IA están aumentando vertiginosamente. Este apetito insaciable ha creado una crisis secundaria que amenaza con frenar el progreso: un hambre insostenible de energía eléctrica. Los centros de datos, las catedrales modernas de la computación, están en camino de consumir una fracción significativa de la electricidad del mundo, con las cargas de trabajo de la IA siendo un factor principal. Según la Agencia Internacional de Energía (IEA), los centros de datos consumieron aproximadamente el 2% de la electricidad global en 2022, y esta cifra se prevé que aumente dramáticamente.

Este problema de energía no se trata solo de facturas de electricidad masivas y de impacto ambiental; es un cuello de botella fundamental de ingeniería. Los propios procesadores que alimentan la IA, las GPU, TPU y ASIC personalizados, están alcanzando un muro térmico. No puedes simplemente seguir agregando más transistores a un chip si no puedes entregar energía de manera limpia y eficiente sin que el chip se sobrecaliente. El desafío no radica solo en generar energía, sino en entregarla de manera efectiva en los últimos milímetros antes de que llegue al silicio. Pero ahora, una pequeña pieza de tecnología conocida como Regulador de Voltaje Integrado (IVR) está redefiniendo fundamentalmente el futuro de la computación de alto rendimiento.

El problema de la “última pulgada” en la entrega de energía

Para entender la innovación del IVR, es necesario entender primero el método tradicional de alimentar un chip de alto rendimiento. Un procesador moderno tiene miles de millones de transistores que se encienden y se apagan miles de millones de veces por segundo. Estas operaciones requieren una fuente de alimentación de CC precisa, estable y de baja tensión. Sin embargo, la energía que proviene de la pared es de alta tensión en CA. El viaje desde la toma de corriente hasta el silicio implica una cadena compleja de conversión y regulación conocida como la Red de Entrega de Energía (PDN).

Normalmente, este proceso implica varias etapas. La energía se convierte y se reduce en la placa base del servidor, y la conversión final y crítica se maneja mediante un componente llamado Regulador de Voltaje (VR). Estos VR suelen ser componentes discretos voluminosos, una colección de controladores, etapas de potencia y grandes inductores de bobina que se encuentran en la placa base que rodea el zócalo del procesador.

Este enfoque tradicional tiene varios defectos críticos en la era de la IA:

  1. Energía desperdiciada: La energía debe viajar desde estos VR fuera del chip a través de la placa base y del empaquetado del chip. Cada milímetro de este camino introduce resistencia, lo que lleva a una pérdida de energía significativa (pérdida de I2R). Esta energía perdida se disipa como calor, que luego debe ser eliminado por sistemas de enfriamiento aún más consumidores de energía.
  2. Tiempo de respuesta lento: Cuando un procesador cambia repentinamente de un estado de inactividad a un estado de carga completa (un escenario común en las cargas de trabajo de la IA llamado carga de transitorio), requiere un aumento masivo e instantáneo de corriente. Los VR fuera del chip pueden ser demasiado lentos para responder, lo que provoca una caída temporal de tensión, o “caída”. Para compensar, los ingenieros deben diseñar todo el sistema para funcionar a una tensión de línea de base más alta, lo que desperdicia aún más energía.
  3. Restricciones de espacio: Estos componentes fuera del chip voluminosos consumen un valioso espacio en la placa base, espacio que podría usarse para más canales de memoria, interconexiones más rápidas u otras características que mejoran el rendimiento. Este “terreno de playa” alrededor del procesador es uno de los más valiosos en la electrónica.

Potencia en el chip y magnetismo de película delgada

Los avances recientes en la tecnología de magnetismo de película delgada permiten ahora fabricar inductores de alto rendimiento directamente en un chip o sustrato de paquete utilizando técnicas de fabricación de semiconductores. Estos inductores microscópicos y de alta eficiencia permiten que todo el regulador de voltaje se encuentre a solo micrómetros de los circuitos que alimenta.

Este cambio de ubicación ofrece varias ventajas:

  • Pérdida de energía reducida: Acortar la ruta de entrega de energía de pulgadas a micrómetros reduce significativamente la energía perdida durante la transmisión, lo que mejora la eficiencia general del sistema.
  • Gestión de energía granular: Múltiples dominios de energía de ultra-baja tensión independientes pueden suministrar exactamente lo que cada núcleo o bloque funcional necesita, cuando lo necesita, y apagarse instantáneamente cuando no lo necesita.
  • Respuesta casi instantánea: Los IVR en el paquete responden a las cargas transitorias en nanosegundos, eliminando virtualmente la caída de tensión y permitiendo tensiones de funcionamiento más bajas y eficientes sin sacrificar el rendimiento.
  • Diseño simplificado y huella más pequeña: Eliminar los reguladores de voltaje de la placa base libera espacio en la placa, simplifica el diseño y admite arquitecturas más densas y de mayor rendimiento.

Re-arquitecturando el futuro del hardware de la IA

Los beneficios de los IVR abordan directamente los mayores desafíos que enfrentan los diseñadores de hardware de la IA. Para las empresas que desarrollan la próxima generación de GPU y aceleradores de la IA, la gestión de energía integrada no es solo una “característica deseable”; es una tecnología habilitadora.

Técnicas avanzadas de empaquetado de semiconductores como chiplets y apilamiento 3D se consideran el camino hacia el futuro ahora que la escalada tradicional de la Ley de Moore se está ralentizando. Estas técnicas implican ensamblar múltiples dies más pequeños y especializados en un solo paquete poderoso. Como explica el líder de la industria TSMC con su tecnología CoWoS, este enfoque requiere una estrategia de entrega de energía sofisticada. Los IVR, incluidos los fabricados por Ferric, están perfectamente adaptados para este paradigma, proporcionando la energía granular y eficiente necesaria para gestionar estos sistemas complejos y heterogéneos.

Desafíos y conclusión

El camino hacia la adopción generalizada no está exento de obstáculos. Integrar nuevos materiales y procesos en el ecosistema de fabricación de semiconductores altamente conservador y complejo es una tarea monumental.

Sin embargo, la necesidad de una solución es innegable. La trayectoria actual de consumo de energía en la IA es insostenible. Simplemente hacer que los transistores sean más pequeños ya no es suficiente; se requiere una re-arquitectura holística de todo el sistema, desde el software hasta la entrega de energía. El trabajo de empresas como Ferric representa una parte crítica de ese rompecabezas. Al domar a la bestia de la energía en su fuente, no solo están creando un componente más eficiente, sino que también están allanando el camino para la próxima generación de la IA y la computación de alto rendimiento.

El viaje de la innovación en hardware es uno de superar cuellos de botella. Durante décadas, el enfoque se centró en la velocidad de cálculo y la densidad de transistores. Hoy en día, el cuello de botella más apremiante es la energía. Las empresas que resuelvan este desafío definirán el panorama de la computación en los años venideros.

¿Qué crees que será el próximo cuello de botella importante en el diseño de hardware de la IA después de que se optimice la entrega de energía? ¿Cómo cambiarán los avances en la eficiencia energética la economía de la implementación de la IA a gran escala?

Noah Sturcken es el fundador y CEO de Ferric con más de 40 patentes emitidas y 15 publicaciones sobre Reguladores de Voltaje Integrados. Noah lidera Ferric con enfoque en desarrollo de negocios, marketing y desarrollo de nueva tecnología. Noah trabajó anteriormente en el laboratorio de investigación y desarrollo de AMD, donde desarrolló la tecnología de Regulador de Voltaje Integrado (IVR). Noah tiene un doctorado y una maestría en Ingeniería Eléctrica de la Universidad de Columbia y una licenciatura de la Universidad de Cornell summa cum laude.