Vordenker
Die drei Generationen von Rechenzentrumskühlung – Und warum die meisten Betreiber gestriges Infrastruktur bauen

Vor drei Jahren debattierte die Rechenzentrumsindustrie darüber, ob Flüssigkühlung jemals notwendig sein würde. Vor zwei Jahren glaubten die meisten Betreiber, dass Einphasen-Wasser die Lösung sein würde. Heute gehen führende Einrichtungen zu nächster Generationen von Kühlarchitekturen über, während viele Neubauten Systeme verankern, die in wenigen Jahren veraltet sein werden.
Diese Divergenz wird durch Physik und Prozessor-Roadmaps getrieben, die bereits bis 2027 sichtbar sind. Zusammen schaffen sie eine Spaltung zwischen Betreibern, die verstehen, dass Kühlung in eine neue architektonische Ära eintritt, und denen, die bald entdecken könnten, dass sie Hunderte von Millionen in Infrastruktur investiert haben, die die nächste Welle von AI-Prozessoren nicht unterstützen kann.
Die drei Generationen von Kühlung
Rechenzentrumskühlung hat drei verschiedene architektonische Epochen durchlaufen, jede definiert durch ein neues Hindernis, das überwunden werden muss, und durch die Regal-Dichten, die wirtschaftliche Unterstützung erfordern.
-
Generation 1: Luftkühlung (2000–2023): Erreichte 10–15 kW pro Regal. Die Wirtschaftlichkeit begann 2020 zusammenzubrechen, als AI-Workloads 20 kW überstiegen. Bis 2023 war Luftkühlung größtenteils für neue Hochleistungs-Einrichtungen veraltet.
-
Generation 2: Einphasen-Flüssigkeit (2020–2027): Der erste Flüssigkühlungsansatz. Verwendet Wasser oder PG25 bei hohen Flussraten, um Wärme durch Temperaturänderung zu entfernen. Geeignet von 20–120 kW pro Regal, aber zeigt über 150 kW Anzeichen von Überlastung. Erwartet, bis 2027 seine praktischen Grenzen zu erreichen, wenn Prozessoren 2.000 W überschreiten.
-
Generation 3: Zwei-Phasen + Erweiterte Wärmeableitung (2024–2035+): Verwendet Kältemittel, die Wärme durch Phasenänderung anstelle von Temperaturänderung absorbieren. Skalierbar von 150 kW und darüber hinaus pro Regal. Ermöglicht neue Wärmeableitungsstrategien von der Chip-Ebene bis zur Atmosphäre. Bereits von führenden Betreibern eingesetzt und erwartet, bis 2027–2028 zu dominieren.
Jeder Übergang markiert einen Wendepunkt – wenn Physik und Wirtschaftlichkeit gleichzeitig ihr Limit erreichen.
Generation 2s Physik-Problem
Die ersten Generation-2-Einrichtungen beginnen, die Grenzen der Einphasen-Kühlung aufzuzeigen.
Wasserbasierte Systeme erfordern Flussraten, die etwa 1,5 Litern pro Minute pro Kilowatt entsprechen. Ein 120-kW-Regal benötigt etwa 180 Liter pro Minute; bei 250 kW springt dies auf 375 Liter pro Minute durch Kaltplatten mit Öffnungen, die in Millimetern gemessen werden.
Auf der GTC in diesem Jahr wurden Regale mit Leitungen in der Größe von Feuerwehrschläuchen sichtbar, die die Herausforderung verdeutlichen. Hohe Flussraten schaffen eine Kaskade von Problemen. Wasser, das mit Glykol gemischt wird, oxidiert mikrogefältelte Strukturen, und Korrosion wird durch Flussgeschwindigkeiten verstärkt, die geschwächte Flossen erodieren. Wartungsanforderungen haben viele Betreiber überrascht: monatliche Filterwechsel anstelle von quartals- oder halbjährlichen, kontinuierliche Chemikalienüberwachung und Glykol-“Tropfen” an Regalen.
Ausfallraten sind ebenso besorgniserregend. Interne Feld Daten deuten darauf hin, dass etwa 4 % der wassergekühlten GPUs über einen Lebenszyklus von drei Jahren aufgrund von Lecks ausfallen. Mit Regalen, die 3–5 Millionen Dollar an Ausrüstung enthalten, bricht dies die Wirtschaftlichkeit von Generation 2 grundlegend.
Eine Analyse einer 10-MW-Anlage von Jacobs Engineering hebt eine weitere Ineffizienz hervor. Einphasen-Systeme erfordern kältere Wassertemperaturen als Generation-3-Systeme. Die kälteren Wassertemperaturen, die von Generation 2 gefordert werden, erhöhen sowohl die Anforderungen an die Kühlerleistung als auch den Energieverbrauch.
Was Generation 3 abhebt
Generation 3 stellt eine wahre architektonische Veränderung dar. Zwei-Phasen-Kältemittel absorbieren Wärme durch Phasenänderung, reduzieren Flussraten um einen Faktor von vier bis neun und verringern die Infrastrukturbeanspruchung erheblich, minimieren die Kaltplatten-Erosion und beseitigen einen großen Teil der Wartungsbelastung, die Generation 2 plagt.
Kältemittel ermöglichen auch neue Wärmeableitungs-Designs – wie Kältemittel-zu-CO₂- und Kältemittel-zu-Kältemittel-Systeme –, die die Kühlung von der Chip-Ebene bis zur Atmosphäre optimieren. Diese Designs sind bereits in Produktion und demonstrieren die Skalierbarkeit und wirtschaftliche Effizienz von Generation 3.
Als Jacobs Engineering – verantwortlich für mehr als 80 % der globalen Rechenzentrums-MEP-Designs – nebeneinander 10-MW-Referenzmodelle erstellte, entfernte sie den Hersteller-Vorurteil aus dem Vergleich.
Ergebnisse:
-
CapEx: 10,39 Mio. $ Einphasen vs. 10,38 Mio. $ Zwei-Phasen
-
Jährlicher OpEx: 1,04 Mio. $ vs. 679.000 $ (35 % Reduzierung)
-
Fünf-Jahres-TCO: 15,6 Mio. $ vs. 13,8 Mio. $ (12 % Einsparung)
Die CapEx-Parität überraschte viele, die mit einem Aufpreis für Zwei-Phasen gerechnet hatten. Aktuelle Zwei-Phasen-Systeme erfordern mehr CDUs, aber Einphasen-Designs benötigen komplexe Reihen-Manifalten, robuste Leck-Erkennung und harmonische Filterung – Komplexitäten, die mit aktuellen Zwei-Phasen-CDUs vermieden werden. Next-Generation-CDUs, die 2026 verfügbar sein werden, werden die Kosten weiter senken und Generation 3 noch wirtschaftlicher machen.
Der OpEx-Vorteil resultiert aus der Thermodynamik. Zwei-Phasen-Systeme halten identische Chip-Temperaturen bei, während sie wärmere Anlagenwasser verwenden – etwa 8 °C höher im Durchschnitt. Jeder Grad, der gespart wird, reduziert den jährlichen Energieverbrauch um etwa 4 %, was der 35 %igen OpEx-Reduzierung entspricht, die Jacobs in verschiedenen Klimazonen von Phoenix bis Stockholm dokumentierte.
Weitblickende Betreiber gehen noch einen Schritt weiter und wandeln diesen thermischen Spielraum in etwa 5 % mehr Rechenleistung innerhalb des gleichen Leistungsrahmens um. In einer Welt, in der jeder GPU Revenue darstellt und Leistung begrenzt ist, wird dieser Vorteil zu einem Wettbewerbsfaktor.
Die Silizium-Roadmap zwingt zur Entscheidung
Der Übergang zu Generation 3 wird nicht von Kühlungsherstellern getrieben – er wird von Prozessordesigns diktiert.
NVIDIAs Rubin-Architekturen sollen 2.000 W pro Prozessor überschreiten. AMDs MI450 befindet sich auf einer ähnlichen Flugbahn. Jeder große Chip-Hersteller packt mehr Leistung in kleinere Footprints, was die thermische Dichte scharf ansteigen lässt.
Die Herausforderung besteht darin, die Wärme-Flussdichte – die Konzentration von Wärme, gemessen in Watt pro Quadratzentimeter – zu bewältigen. Wenn die Wärme-Flussdichte steigt, stoßen Generation-2-Lösungen an physikalische und wirtschaftliche Grenzen. Flussraten werden destruktiv, Temperatur-Deltas unhaltbar und Systemkosten unerschwinglich.
Generation 3 wurde für diese Realität entwickelt. Führende Betreiber specifizieren bereits 250-kW-Regale mit klaren Pfaden zu 1 MW+. Zu warten, “um zu sehen, was sich durchsetzt”, mag konservativ erscheinen, aber es ist der riskanteste Ansatz. Die Silizium-Roadmap ist festgelegt; Physik wird sich nicht beugen. Die einzige Entscheidung, die noch zu treffen ist, ist, wann man handelt.
Das Brownfield-Dilemma
Milliarden werden gerade in Generation-2-Infrastruktur investiert, die innerhalb von 36 Monaten eingeschränkt sein wird. Anlagen, die heute um Einphasen-Wasser herum entworfen werden, werden Schwierigkeiten haben, 2027-Klassen-Prozessoren zu unterstützen. Nachträgliche Anpassungen sind teurer als der Bau mit Generation-3-Infrastruktur heute.
Für bestehende Standorte können Kältemittel-zu-Luft-Systeme als Brücke dienen, aber sie sind keine langfristige Lösung. Die Richtung der Branche ist klar: Generation-3-Architekturen werden das nächste Jahrzehnt neuer Bauten prägen.
Eine generationelle Wahl
Jeder Kühlübergang sah ausreichend aus, bis die nächste Generation ihn veraltete. Betreiber, die Flüssigkühlung frühzeitig angenommen haben – 2020–2021 anstelle von 2023 –, gewannen fast zwei Jahre Vorsprung bei der Einrichtung.
Die gleiche Wendung ist erneut im Gange. Die Physik ist bewiesen. Die Wirtschaftlichkeit ist durch unabhängige Analysen validiert. Prozessor-Roadmaps machen den Übergang unvermeidlich.
Die Frage ist nicht, ob der Wandel eintreten wird – es ist, ob man ihn führt oder gezwungen wird, ihn vorzunehmen, wenn Generation 2 ihre Grenzen erreicht.
Rechenzentren, die heute entworfen werden, werden bis in die 2030er Jahre hinein betrieben. Der Bau mit Generation-3-Architekturen stellt sicher, dass sie auch in der AI-Ära weiterhin lebensfähig bleiben, anstatt vor ihrer Stabilisierung zu eingeschränkten Vermögenswerten zu werden.
Die Zukunft der Rechenzentrumskühlung ist eine generationelle Transformation – und Generation 3 ist bereits da.












