Connect with us

Die drei Generationen der Rechenzentrumskühlung – Und warum die meisten Betreiber gestriges Infrastruktur bauen

Vordenker

Die drei Generationen der Rechenzentrumskühlung – Und warum die meisten Betreiber gestriges Infrastruktur bauen

mm

Vor drei Jahren debattierte die Rechenzentrumsindustrie, ob Flüssigkühlung jemals notwendig sein würde. Vor zwei Jahren glaubten die meisten Betreiber, dass Einphasenwasser die Lösung sein würde. Heute gehen führende Einrichtungen zu nächstgenerations Kühlarchitekturen über, während viele Neubauten Systeme verriegeln, die in wenigen Jahren veraltet sein werden.

Diese Divergenz wird durch Physik und Prozessor-Roadmaps angetrieben, die bereits bis 2027 sichtbar sind. Zusammen erzeugen sie eine Spaltung zwischen Betreibern, die verstehen, dass Kühlung eine neue architektonische Ära betritt, und denen, die bald entdecken könnten, dass sie hunderte Millionen in Infrastruktur investiert haben, die die nächste Welle von KI-Prozessoren nicht unterstützen kann.

Die drei Generationen der Kühlung

Rechenzentrumskühlung hat drei verschiedene architektonische Epochen durchlaufen, jede definiert durch ein neues Hindernis, das überwunden werden muss, und durch die Regaldichten, die wirtschaftliche Unterstützung erfordern.

  • Generation 1: Luftkühlung (2000–2023): Erreichte ihren Höhepunkt bei 10–15 kW pro Regal. Die Wirtschaftlichkeit begann um 2020 herum zusammenzubrechen, als KI-Workloads 20 kW überstiegen. Bis 2023 war Luftkühlung größtenteils für neue Hochleistungs-Einrichtungen veraltet.

  • Generation 2: Einphasen-Flüssigkeit (2020–2027): Der erste Flüssigkühlungsansatz. Verwendet Wasser oder PG25 bei hohen Flussraten, um Wärme durch Temperaturänderung zu entfernen. Praktikabel von 20–120 kW pro Regal, aber zeigt Belastungen über 150 kW. Erwartet, bis 2027 ihre praktischen Grenzen zu erreichen, wenn Prozessoren 2.000 W übersteigen.

  • Generation 3: Zwei-Phasen + Erweiterte Wärmeableitung (2024–2035+): Verwendet Kältemittel, die Wärme durch Phasenänderung anstelle von Temperaturänderung absorbieren. Skalierbar von 150 kW und weit darüber hinaus pro Regal. Ermöglicht neue Wärmeableitungsstrategien vom Chip zur Atmosphäre. Wird bereits von führenden Betreibern eingesetzt und erwartet, bis 2027–2028 zu dominieren.

Jeder Übergang markiert einen Bruchpunkt – wenn Physik und Wirtschaftlichkeit gleichzeitig ihre Decke erreichen.

Generation 2’s Physik-Problem

Die ersten Generation-2-Einrichtungen beginnen, die Grenzen der Einphasen-Kühlung aufzuzeigen.

Wasserbasierte Systeme erfordern Flussraten, die etwa 1,5 Litern pro Minute pro Kilowatt entsprechen. Ein 120-kW-Regal benötigt etwa 180 Liter pro Minute; bei 250 kW springt dies auf 375 Liter pro Minute durch Kaltplatten mit Öffnungen, die in Millimetern gemessen werden.

Auf der GTC in diesem Jahr machten Regale, die an Leitungen in der Größe von Feuerwehrschläuchen angeschlossen waren, die Herausforderung sichtbar. Hohe Flussraten erzeugen kaschierende Probleme. Wasser, das mit Glykol gemischt wird, oxidiert mikrogefältelte Strukturen, und Korrosion wird durch Flussgeschwindigkeiten verstärkt, die geschwächte Flossen abtragen. Wartungsanforderungen haben viele Betreiber überrascht: monatliche Filterwechsel anstelle von quartals- oder halbjährlichen, ständige Chemikalienüberwachung und Glykol-“Infusionsbeutel”, die an Regale angeschlossen sind.

Ausfallraten sind ebenso besorgniserregend. Interne Feldaten deuten darauf hin, dass etwa 4 % der wassergekühlten GPUs über einen Lebenszyklus von drei Jahren aufgrund von Lecks ausfallen. Bei Regalen, die Ausrüstung im Wert von 3–5 Millionen Dollar enthalten, bricht die Wirtschaftlichkeit von Generation 2 grundlegend zusammen.

Eine Analyse einer 10-MW-Anlage von Jacobs Engineering hebt eine weitere Ineffizienz hervor. Einphasen-Systeme erfordern kältere Wassertemperaturen als Generation-3-Systeme. Die kälteren Wassertemperaturen, die von Generation 2 gefordert werden, erhöhen sowohl die Anforderungen an die Kälteanlage als auch den Energieverbrauch.

Was Generation 3 abhebt

Generation 3 stellt eine wahre architektonische Veränderung dar. Zwei-Phasen-Kältemittel erfassen Wärme durch Phasenänderung, reduzieren Flussraten um einen Faktor von vier bis neun. Reduzierte Flüssigkeitsgeschwindigkeit reduziert erheblich die Infrastrukturbeanspruchung, minimiert die Kaltplatten-Erosion und eliminiert einen großen Teil der Wartungsbelastung, die Generation 2 plagt.

Kältemittel ermöglichen auch neue Wärmeableitungs-Designs – wie Kältemittel-zu-CO₂- und Kältemittel-zu-Kältemittel-Systeme –, die die Kühlung vom Chip bis zur Atmosphäre optimieren. Diese Designs sind bereits in Produktion und zeigen die Skalierbarkeit und wirtschaftliche Effizienz von Generation 3.

Als Jacobs Engineering – verantwortlich für mehr als 80 % der globalen Rechenzentrums-MEP-Designs – nebeneinanderliegende 10-MW-Referenzmodelle erstellte, wurde der Hersteller-Vorurteil aus dem Vergleich entfernt.

Ergebnisse:

  • CapEx: 10,39 Mio. $ Einphasen vs. 10,38 Mio. $ Zwei-Phasen

  • Jährlicher OpEx: 1,04 Mio. $ vs. 679.000 $ (35 % Reduzierung)

  • Fünf-Jahres-TCO: 15,6 Mio. $ vs. 13,8 Mio. $ (12 % Einsparung)

Die CapEx-Parität überraschte viele, die einen Aufpreis für Zwei-Phasen-Systeme erwartet hatten. Aktuelle Zwei-Phasen-Systeme erfordern mehr CDUs, aber Einphasen-Designs benötigen komplexe Reihen-Manifolds, robuste Leck-Erkennung und harmonische Filterung – Komplexitäten, die mit aktuellen Zwei-Phasen-CDUs vermieden werden. Next-Generation-CDUs, die 2026 ankommen werden, werden die Kosten weiter senken und Generation 3 noch wirtschaftlicher machen.

Der OpEx-Vorteil resultiert aus der Thermodynamik. Zwei-Phasen-Systeme halten identische Chip-Temperaturen bei, während sie wärmere Anlagenwasser verwenden – etwa 8 °C höher im Durchschnitt. Jeder Grad, der gespart wird, reduziert den jährlichen Energieverbrauch um etwa 4 %, was der 35 %igen OpEx-Reduzierung entspricht, die Jacobs in verschiedenen Klimazonen von Phoenix bis Stockholm dokumentierte.

Vorausschauende Betreiber gehen noch einen Schritt weiter und wandeln diesen thermischen Spielraum in etwa 5 % mehr Rechenleistung innerhalb des gleichen Leistungsrahmens um. In einer Welt, in der jeder GPU Einnahmen darstellt und Leistung begrenzt ist, wird dieser Vorteil zu einem Wettbewerbsunterschied.

Die Silizium-Roadmap erzwingt die Entscheidung

Der Wechsel zu Generation 3 wird nicht von Kühlungsherstellern angetrieben – er wird von Prozessordesign diktiert.

NVIDIA’s Rubin-Architekturen sollen 2.000 W pro Prozessor überschreiten. AMD’s MI450 befindet sich auf einer ähnlichen Flugbahn. Jeder große Chip-Hersteller packt mehr Leistung in kleinere Fußabdrücke, was die thermische Dichte scharf nach oben treibt.

Die Herausforderung ist die Wärme-Flux-Dichte – die Konzentration von Wärme, gemessen in Watt pro Quadratzentimeter. Wenn die Wärme-Flux-Dichte steigt, stoßen Generation-2-Lösungen an physikalische und wirtschaftliche Grenzen. Flussraten werden destruktiv, Temperatur-Deltas unhaltbar und Systemkosten unerschwinglich.

Generation 3 wurde für diese Realität gebaut. Führende Betreiber spezifizieren bereits 250-kW-Regale mit klaren Wegen zu 1 MW+. Zu warten, “um zu sehen, was gewinnt”, mag konservativ erscheinen, aber es ist der riskanteste Ansatz. Die Silizium-Roadmap ist festgelegt; Physik wird sich nicht beugen. Die einzige Entscheidung, die noch zu treffen ist, ist, wann zu handeln.

Das Brownfield-Dilemma

Milliarden werden gerade in Generation-2-Infrastruktur investiert, die innerhalb von 36 Monaten eingeschränkt sein wird. Einrichtungen, die heute um Einphasen-Wasser herum entworfen werden, werden Schwierigkeiten haben, 2027-Klassiker-Prozessoren zu unterstützen. Eine spätere Nachrüstung kostet viel mehr als der Bau mit Generation 3 heute.

Für bestehende Standorte können Kältemittel-zu-Luft-Systeme als Brücke dienen, aber sie sind keine langfristige Lösung. Die Richtung der Branche ist klar: Generation-3-Architekturen werden den nächsten Jahrzehnt Neubauten verankern.

Eine Generationen-Wahl

Jeder Kühl-Übergang sah ausreichend aus, bis die nächste Generation ihn veraltet machte. Betreiber, die Flüssigkühlung frühzeitig akzeptierten – sie 2020–2021 anstelle von 2023 einsetzten – gewannen fast zwei Jahre Vorsprung bei der Einrichtung.

Die gleiche Inflection ist erneut im Gange. Die Physik ist bewiesen. Die Wirtschaftlichkeit ist durch unabhängige Analyse validiert. Prozessor-Roadmaps machen den Übergang unvermeidlich.

Die Frage ist nicht, ob der Wandel eintreten wird – es ist, ob Sie ihn führen oder gezwungen werden, ihn vorzunehmen, sobald Generation 2 ihre Grenzen erreicht.

Rechenzentren, die heute entworfen werden, werden bis in die 2030er Jahre hinein betrieben. Der Bau mit Generation-3-Architekturen stellt sicher, dass sie für die KI-Ära geeignet bleiben, anstatt zu eingeschränkten Vermögenswerten zu werden, bevor sie sich sogar stabilisieren.

Die Zukunft der Rechenzentrums-Kühlung ist eine generationenübergreifende Transformation – und Generation 3 ist bereits hier.

Josh Claman ist der CEO von Accelsius, Hersteller von direkter-zu-Chip-, Zweiphasen-Kühltechnologie. Als Befürworter der Macht transformierender Technologie während seiner 30-jährigen Karriere hat Herr Claman Unternehmen bei Dell, NCR und AT&T gewachsen und neu positioniert.