Connect with us

Tři generace chlazení datových center – a proč většina provozovatelů buduje včerašní infrastrukturu

Myslitelé

Tři generace chlazení datových center – a proč většina provozovatelů buduje včerašní infrastrukturu

mm

Před třemi lety se v odvětví datových center diskutovalo, zda bude tekuté chlazení někdy nutné. Před dvěma lety většina provozovatelů věřila, že single-fázová voda bude řešením. Dnes vedoucí zařízení přecházejí na architektury chlazení nové generace, zatímco mnoho nových staveb uzamkne systémy, které budou zastaralé do několika let.

Tento rozpor je způsoben fyzikou a roadmapami procesorů, které jsou již viditelné do roku 2027. Společně vytvářejí rozkol mezi provozovateli, kteří chápou, že chlazení vstupuje do nové architektonické éry, a těmi, kteří možná brzy objeví, že investovali stovky milionů do infrastruktury, která nemůže podporovat příští vlnu procesorů AI.

Tři generace chlazení

Chlazení datových center prošlo třemi odlišnými architektonickými éрами, каждá definovaná novou sadou překážek, které je třeba překonat, a hustotou racků, která vyžaduje ekonomickou podporu.

  • Generace 1: Chlazení vzduchem (2000–2023): Dosáhlo maxima 10–15 kW na rack. Ekonomika začala selhávat kolem roku 2020, kdy AI úkoly překročily 20 kW. Do roku 2023 bylo chlazení vzduchem prakticky zastaralé pro nové nasazení s vysokou hustotou.

  • Generace 2: Single-fázová kapalina (2020–2027): První přístup k chlazení kapalinou. Používá vodu nebo PG25 při vysokém průtoku k odstranění tepla prostřednictvím změny teploty. Schopné od 20 do 120 kW na rack, ale začíná projevovat napětí nad 150 kW. Očekává se, že dosáhne svých praktických limitů do roku 2027, kdy procesory překročí 2 000 W.

  • Generace 3: Dvoufázová + pokročilé odstranění tepla (2024–2035+): Používá chladiva, která absorbují teplo prostřednictvím fázové změny, nikoli změny teploty. Škálovatelné od 150 kW a dále na rack. Umožňuje nové strategie odstranění tepla od čipu k atmosféře. Už jsou nasazovány vedoucími provozovateli a očekává se, že budou dominovat do roku 2027–2028.

Každá přechodná fáze představuje bod zlomu – kdy fyzika a ekonomika dosahují svého stropu současně.

Fyzikální problém generace 2

První vlna nasazení generace 2 začíná odhalovat limity single-fázového chlazení.

Systémy založené na vodě vyžadují průtoky odpovídající přibližně 1,5 litru za minutu na kilowatt. Rack o výkonu 120 kW potřebuje přibližně 180 litrů za minutu; při 250 kW se to zvýší na 375 litrů za minutu prostřednictvím studených desek s otvory měřenými v milimetrech.

Na GTC letošního roku byly vidět racky připojené k hadicím velikosti hasičských hadic, což zpřístupnilo výzvu. Vysoké průtoky vytvářejí kaskádové problémy. Voda smíchaná s glykolem oxiduje mikrořezané struktury a koroze je zesílena proudovými rychlostmi, které erodují oslabené výstupky. Nároky na údržbu překvapily mnoho provozovatelů: měsíční výměna filtrů místo čtvrtletních nebo pololetních, постоянné monitorování chemie a „IV sáčky“ připojené k rackům.

Rizikové sazby jsou stejně znepokojivé. Interní poleová data naznačují, že přibližně 4 % vodou chlazených GPU selžou během tříletého životního cyklu kvůli únikům. S racky, které drží zařízení v hodnotě 3–5 milionů dolarů, tato ztráta fundamentálně porušuje ekonomiku generace 2.

Analýza 10MW zařízení provedená Jacobs Engineering zdůrazňuje další neefektivitu. Single-fázové systémy vyžadují chladnější teploty vody než systémy generace 3. Chladnější teploty vody požadované generací 2 zvyšují jak požadavky na chladicí kapacitu, tak spotřebu energie.

Co odlišuje generaci 3

Generace 3 představuje skutečnou architektonickou změnu. Dvoufázová chladiva absorbují teplo prostřednictvím fázové změny, snižují tak průtoky o faktor čtyři až devět. Snížená rychlost proudění výrazně snižuje stres infrastruktury, minimalizuje erozi studených desek a eliminuje většinu údržbové zátěže, která sužuje generaci 2.

Chladiva také umožňují nové strategie odstranění tepla – jako je chladivo-CO₂ a chladivo-chladivo systémy – které optimalizují chlazení od čipu k atmosféře. Tyto systémy jsou již ve výrobě, демонстриrujíce škálovatelnost a ekonomickou efektivitu generace 3.

Když Jacobs Engineering – zodpovědný za více než 80 % globálních návrhů MEP pro datová centra – vytvořil souběžné 10MW referenční modely, odstranil tak vendorovou předpojatost ze srovnání.

Zjištění:

  • CapEx: 10,39 milionu dolarů pro single-fázovou vs. 10,38 milionu dolarů pro dvoufázovou

  • Roční OpEx: 1,04 milionu dolarů vs. 679 000 dolarů (snížení o 35 %)

  • Pětileté TCO: 15,6 milionu dolarů vs. 13,8 milionu dolarů (úspora 12 %)

Shoda v CapEx překvapila mnohé, kteří očekávali příplatek za dvoufázovou technologii. Současné dvoufázové systémy vyžadují více CDU, ale single-fázové návrhy potřebují komplexní řadové manifolds, robustní detekci úniků a harmonickou filtraci – složitosti, kterým se lze vyhnout pomocí současných dvoufázových CDU. Příští generace CDU, které budou k dispozici v roce 2026, dále sníží náklady, což učiní generaci 3 ještě ekonomičtější.

Výhoda OpEx pramení z termodynamiky. Dvoufázové systémy udržují stejné teploty čipu, zatímco používají teplejší vodní teploty zařízení – přibližně o 8 °C vyšší v průměru. Každý stupeň, který se ušetří, snižuje roční spotřebu energie přibližně o 4 %, což se překládá do 35% snížení OpEx, které Jacobs dokumentoval napříč klimaty od Phoenixu po Stockholm.

Progresivní provozovatelé jdou ještě dále, mění tuto tepelnou rezervu na přibližně 5 % více výpočetního výkonu v rámci stejného energetického obalu. Ve světě, kde každý GPU představuje příjmy a energie je omezená, tato výhoda se stává konkurenční diferenciací.

Siliconová roadmap nutí otázku

Přechod na generaci 3 není řízen chladicími dodavateli – je diktován návrhem procesoru.

NVIDIA Rubin architektury se očekává, že překročí 2 000 W na procesor. AMD MI450 je na podobné trajektorii. Každý hlavní výrobce čipů balí více výkonu do menších půdorysů, což strmě zvyšuje tepelnou hustotu.

Klíčová výzva spočívá v tepelném toku – koncentraci tepla měřené v wattech na čtvereční centimetr. Jak se tepelný tok zvyšuje, řešení generace 2 narazí na fyzické a ekonomické limity. Průtoky se stávají destruktivními, teplotní rozdíly neúnosnými a systémové náklady udržitelnými.

Generace 3 byla postavena pro tuto realitu. Vedoucí provozovatelé již specifikují racky o výkonu 250 kW s jasnou cestou k 1 MW+. Čekání, až „uvidíme, co vyhraje“, může vypadat konzervativně, ale je to nejrizikovější přístup. Siliconová roadmap je pevná; fyzika se neohýbá. Jediné rozhodnutí, které zbývá, je, kdy jednat.

Problém brownfield

Miliardy jsou nyní investovány do infrastruktury generace 2, která bude omezena do 36 měsíců. Zařízení navržená dnes kolem single-fázové vody budou mít potíže s podporou procesorů třídy 2027. Retrofits později stojí mnohem více než budování s generací 3 dnes.

Pro stávající lokality mohou systémy chladivo-vzduch sloužit jako most, ale nejsou dlouhodobým řešením. Směr odvětví je jasný: architektury generace 3 budou kotvívat příští dekádu nových staveb.

Generační volba

Každý přechod chlazení vypadal dostatečný, dokud další generace neučinila předchozí zastaralou. Provozovatelé, kteří přijali tekuté chlazení brzy – adoptovali je v letech 2020-2021 místo roku 2023 – získali téměř dva roky nasazení.

Stejná inflexe je opět na cestě. Fyzika je prokázána. Ekonomika je ověřena nezávislou analýzou. Roadmapy procesorů činí přechod nevyhnutelným.

Otázka není, zda se změna stane – je, zda povedete nebo budete nuceni do ní, až generace 2 dosáhne svých limitů.

Datová centra navržená dnes budou fungovat dobře do 30. let. Budování s architekturami generace 3 zajišťuje, že zůstanou životaschopná pro éru AI, místo aby se stala omezenými aktivy, než se dokonce stabilizují.

Budoucnost chlazení datových center je generační transformací – a generace 3 je již zde.

Josh Claman je CEO společnosti Accelsius, výrobce přímého chlazení na čip, dvoufázové chladicí technologie. Jako zastánce síly transformační technologie po celou svou 30letou kariéru pan Claman rozšiřoval a přepozicionoval podniky v Dell, NCR a AT&T.