Connect with us

Las Tres Generaciones de Enfriamiento de Centros de Datos: ¿Por Qué la Mayoría de los Operadores Están Construyendo Infraestructuras de Ayer?

Líderes de opinión

Las Tres Generaciones de Enfriamiento de Centros de Datos: ¿Por Qué la Mayoría de los Operadores Están Construyendo Infraestructuras de Ayer?

mm

Hace tres años, la industria de los centros de datos debatía si el enfriamiento líquido sería necesario algún día. Hace dos años, la mayoría de los operadores creían que el agua de una sola fase sería la solución. Hoy en día, los principales centros de datos están pasando a arquitecturas de enfriamiento de próxima generación, mientras que muchos nuevos proyectos están bloqueando sistemas que estarán obsoletos dentro de unos pocos años.

Esta divergencia está siendo impulsada por la física y las hojas de ruta de procesadores que ya son visibles hasta 2027. Juntas, están creando una división entre los operadores que entienden que el enfriamiento está entrando en una nueva era arquitectónica y aquellos que pronto pueden descubrir que han invertido cientos de millones en infraestructuras que no pueden soportar la próxima ola de procesadores de inteligencia artificial.

Las Tres Generaciones de Enfriamiento

El enfriamiento de los centros de datos ha progresado a través de tres eras arquitectónicas distintas, cada una definida por un nuevo conjunto de obstáculos que superar y por las densidades de rack que requieren apoyo económico.

  • Generación 1: Enfriamiento por Aire (2000-2023): Alcanzó un máximo de 10-15 kW por rack. La economía comenzó a descomponerse alrededor de 2020, ya que las cargas de trabajo de inteligencia artificial superaron los 20 kW. Para 2023, el enfriamiento por aire estaba en gran medida obsoleto para nuevos despliegues de alta densidad.

  • Generación 2: Líquido de una sola fase (2020-2027): El enfoque inicial de enfriamiento líquido. Utiliza agua o PG25 a altas tasas de flujo para eliminar el calor a través del cambio de temperatura. Viable desde 20-120 kW por rack, pero muestra signos de estrés por encima de 150 kW. Se espera que alcance sus límites prácticos para 2027, ya que los procesadores superan los 2.000 W.

  • Generación 3: Dos fases + Rechazo de calor avanzado (2024-2035+): Emplea refrigerantes que absorben el calor a través del cambio de fase en lugar del cambio de temperatura. Escalable desde 150 kW y mucho más allá por rack. Permite nuevas estrategias de rechazo de calor desde el chip hasta la atmósfera. Ya se está desplegando en los principales centros de datos y se espera que domine para 2027-2028.

Cada transición marca un punto de ruptura: cuando la física y la economía alcanzan su techo simultáneamente.

El Problema Físico de la Generación 2

Los despliegues iniciales de la Generación 2 están comenzando a revelar los límites del enfriamiento de una sola fase.

Los sistemas basados en agua requieren tasas de flujo equivalentes a aproximadamente 1,5 litros por minuto por kilovatio. Un rack de 120 kW necesita alrededor de 180 litros por minuto; a 250 kW, eso aumenta a 375 litros por minuto a través de placas frías con orificios medidos en milímetros.

En la GTC de este año, los racks conectados a líneas del tamaño de mangueras de incendio hicieron visible el desafío. Las altas tasas de flujo crean problemas en cascada. El agua mezclada con glicol oxida las estructuras microacanaladas, y la corrosión se ve agravada por las velocidades de flujo que erosionan las aletas debilitadas. Las demandas de mantenimiento han sorprendido a muchos operadores: cambios de filtro mensuales en lugar de trimestrales o dos veces al año, monitoreo constante de la química y “bolsas de suero” de glicol conectadas a los racks.

Las tasas de falla son igualmente preocupantes. Los datos de campo internos sugieren que aproximadamente el 4% de las GPU enfriadas por agua fallan durante un ciclo de vida de tres años debido a fugas. Con racks que contienen equipo valorado en $3-5 millones, esa pérdida rompe fundamentalmente la economía de la Generación 2.

Un análisis de una instalación de 10 MW por parte de Jacobs Engineering destaca otra ineficiencia. Los sistemas de una sola fase requieren temperaturas de agua más frías que los sistemas de la Generación 3. Las temperaturas de agua más frías exigidas por la Generación 2 aumentan tanto los requisitos de capacidad de enfriamiento como el consumo de energía.

Qué Diferencia a la Generación 3

La Generación 3 representa un verdadero cambio arquitectónico. Los refrigerantes de dos fases capturan el calor a través del cambio de fase, reduciendo las tasas de flujo en un factor de cuatro a nueve. La velocidad de fluido reducida reduce significativamente el estrés en la infraestructura, minimiza la erosión de la placa fría y elimina gran parte de la carga de mantenimiento que aqueja a la Generación 2.

Los refrigerantes también permiten nuevos diseños de rechazo de calor, como sistemas de refrigerante a CO₂ y refrigerante a refrigerante, que optimizan el enfriamiento desde el chip hasta la atmósfera. Estos diseños ya están en producción, demostrando la escalabilidad y la eficiencia económica de la Generación 3.

Cuando Jacobs Engineering, responsable de más del 80% de los diseños de MEP de centros de datos globales, creó modelos de referencia de 10 MW lado a lado, eliminaron el sesgo del proveedor de la comparación.

Hallazgos:

  • CapEx: $10,39 millones de una sola fase vs. $10,38 millones de dos fases

  • OpEx anual: $1,04 millones vs. $679.000 (reducción del 35%)

  • TCO de cinco años: $15,6 millones vs. $13,8 millones (ahorros del 12%)

La paridad de CapEx sorprendió a muchos que esperaban un precio premium por la tecnología de dos fases. Los sistemas actuales de dos fases requieren más CDU, pero los diseños de una sola fase necesitan manifold de fila complejos, detección de fugas robusta y filtración armónica, complejidades evitadas con las CDU actuales de dos fases. Las próximas CDU que llegarán en 2026 reducirán aún más los costos, lo que hace que la Generación 3 sea aún más económica para desplegar.

La ventaja de OpEx se debe a la termodinámica. Los sistemas de dos fases mantienen temperaturas de chip idénticas mientras utilizan agua de instalación más cálida, unos 8°C más alta en promedio. Cada grado ahorrado reduce el uso de energía anual en aproximadamente un 4%, lo que se traduce en la reducción del 35% de OpEx que Jacobs documentó en climas desde Phoenix hasta Estocolmo.

Los operadores con visión de futuro están dando un paso más allá, convirtiendo esa margen térmica en aproximadamente un 5% más de capacidad de cómputo dentro del mismo límite de energía. En un mundo donde cada GPU representa ingresos y la energía está limitada, esa ventaja se convierte en un diferenciador competitivo.

La Hoja de Ruta de Silicio Obliga a la Cuestión

El cambio a la Generación 3 no está siendo impulsado por los proveedores de enfriamiento, sino que está dictado por el diseño del procesador.

Las arquitecturas Rubin de NVIDIA se espera que superen los 2.000 W por procesador. El MI450 de AMD está en una trayectoria similar. Cada fabricante de chips importante está empaquetando más rendimiento en footprints más pequeños, lo que impulsa la densidad térmica hacia arriba.

El desafío clave es el flujo de calor, la concentración de calor medida en vatios por centímetro cuadrado. A medida que aumenta el flujo de calor, las soluciones de la Generación 2 alcanzan los límites físicos y económicos. Las tasas de flujo se vuelven destructivas, los deltas de temperatura insoportables y los costos del sistema insostenibles.

La Generación 3 fue diseñada para esta realidad. Los principales operadores ya están especificando racks de 250 kW con caminos claros a 1 MW+. Esperar a “ver qué gana” puede parecer conservador, pero es el enfoque más arriesgado. La hoja de ruta de silicio es fija; la física no se doblegará. La única decisión que queda es cuándo actuar.

El Dilema de los Campos Brownfield

Se están invirtiendo miles de millones en infraestructuras de la Generación 2 que estarán limitadas dentro de 36 meses. Las instalaciones diseñadas hoy en día alrededor del agua de una sola fase lucharán por soportar los procesadores de clase 2027. La retrocompatibilidad cuesta mucho más que construir con la Generación 3 hoy en día.

Para los sitios existentes, los sistemas de refrigerante a aire pueden servir como un puente, pero no son una solución a largo plazo. La dirección de la industria es clara: las arquitecturas de la Generación 3 anclarán la próxima década de nuevos proyectos.

Una Elección Generacional

Cada transición de enfriamiento ha parecido suficiente hasta que la siguiente generación la hizo obsoleta. Los operadores que adoptaron el enfriamiento líquido temprano, adoptándolo en 2020-2021 en lugar de 2023, ganaron casi dos años de ventaja en la implementación.

La misma inflexión está en marcha nuevamente. La física está probada. La economía está validada por el análisis independiente. Las hojas de ruta de procesadores hacen que la transición sea inevitable.

La pregunta no es si el cambio ocurrirá, sino si lo liderarás o serás forzado a ello una vez que la Generación 2 alcance sus límites.

Los centros de datos diseñados hoy en día operarán bien hasta la década de 2030. Construir con arquitecturas de la Generación 3 garantiza que sigan siendo viables para la era de la inteligencia artificial en lugar de convertirse en activos limitados antes de que incluso se estabilicen.

El futuro del enfriamiento de los centros de datos es una transformación generacional, y la Generación 3 ya está aquí.

Josh Claman es el CEO de Accelsius, fabricantes de tecnología de enfriamiento de dos fases directo al chip. Defensor del poder de la tecnología transformadora a lo largo de su carrera de 30 años, el Sr. Claman ha hecho crecer y reubicado negocios en Dell, NCR y AT&T.