Connect with us

De tre generasjonene av datakylning – og hvorfor de fleste operatører bygger yesterdagens infrastruktur

Tankeledere

De tre generasjonene av datakylning – og hvorfor de fleste operatører bygger yesterdagens infrastruktur

mm

For tre år siden debatterte dataklyngindustrien om væskekjøling noen gang ville være nødvendig. For to år siden trodde de fleste operatører at enkelfasevann ville være løsningen. I dag flytter ledende fasiliteter over til neste generasjons kjølearkitekturer, mens mange nye bygninger låser seg til systemer som vil bli foreldet innen få år.

Dette skille driver av fysikk og prosessorveier som allerede er synlige gjennom 2027. Sammen skaper de en splittelse mellom operatører som forstår at kjøling går inn i en ny arkitektonisk æra og de som kan oppdage at de har investert hundre millioner i infrastruktur som ikke kan støtte den neste bølgen av AI-prosessorer.

De tre generasjonene av kjøling

Dataklyngkjøling har gått gjennom tre distinkte arkitektoniske epoker, hver definert av en ny sett med hindringer som må overvinnes og av racktettheter som krever økonomisk støtte.

  • Generasjon 1: Luftkjøling (2000–2023): Peakede på 10–15 kW per rack. Økonomien begynte å bryte sammen rundt 2020 da AI-arbeidsbyrder oversteg 20 kW. Ved 2023 var luftkjøling stort sett foreldet for nye høyttetthetsutplasseringer.

  • Generasjon 2: Enkelfasevæske (2020–2027): Den første væskekjølingsmetoden. Bruker vann eller PG25 ved høye strømningshastigheter for å fjerne varme gjennom temperaturendring. Gjelder fra 20–120 kW per rack, men viser belastning over 150 kW. Forventes å nå sine praktiske grenser ved 2027 da prosessorer overstiger 2 000 W.

  • Generasjon 3: To-fase + avansert varmeavkjøling (2024–2035+): Anvender kjølemidler som absorberer varme gjennom fasendring i stedet for temperaturendring. Skalerbart fra 150 kW og langt utover per rack. Muliggjør nye varmeavkjølingsstrategier fra chip til atmosfære. Allerede i produksjon, og viser Generasjon 3 sin skalerbarhet og økonomiske effisiens.

Hver overgang markerer et brytningspunkt – når fysikk og økonomi når taket samtidig.

Generasjon 2s fysikkproblem

Første-generasjons Generasjon 2-utplasseringer begynner å avsløre grensene for enkelfasekjøling.

Vannbaserte systemer krever strømningshastigheter like stor som omtrent 1,5 liter per minutt per kilowatt. En 120 kW-rack trenger omtrent 180 liter per minutt; ved 250 kW hopper det til 375 liter per minutt gjennom kalde plater med åpninger målt i millimeter.

Ved GTC i år viste rack koblet til linjer like store som brannslanger utfordringen. Høye strømningshastigheter skaper kaskadeproblemer. Vann blandet med glykol oksiderer mikrofinnete strukturer, og korrosjon forverres av strømningshastigheter som eroderer svekkede finner. Vedlikeholdsbehovene har overrasket mange operatører: månedlige filterbytter i stedet for kvartalsvis eller to ganger om året, konstant kjemisk overvåking og glykol-“IV-pose” festet til rack.

Feilrater er like bekymringsfulle. Interne feltdata antyder omtrent 4% av vannkjølte GPU-er feiler over en treårs levetid på grunn av lekkasjer. Med rack som holder 3-5 millioner kroner verdt utstyr, bryter den tapet fundamentalt Generasjon 2s økonomi.

En 10 MW-analyse av Jacobs Engineering fremhever en annen ineffisiens. Enkelfase-systemer krever kaldere vannstemperaturer enn Generasjon 3-systemer. De kalde vannstemperaturer som kreves av Generasjon 2 øker både kjøleanleggsbehov og energiforbruk.

Hva setter Generasjon 3 apart

Generasjon 3 representerer en ekte arkitektonisk skift. To-fase kjølemidler fanger varme gjennom fasendring, reduserer strømningshastigheter med en faktor på fire til ni. Redusert væskehastighet reduserer betydelig infrastrukturstress, minimiserer kalde plate-erosjon og eliminerer mye av vedlikeholdsbyrden som plager Generasjon 2.

Kjølemidler muliggjør også nye varmeavkjølingsdesign – som kjølemiddel-til-CO₂ og kjølemiddel-til-kjølemiddel-systemer – som optimaliserer kjøling fra chip til atmosfære. Disse designene er allerede i produksjon, og demonstrerer Generasjon 3 sin skalerbarhet og økonomiske effisiens.

Da Jacobs Engineering – ansvarlig for mer enn 80% av globale dataklyng-MEP-design – lagde side-ved-side 10 MW-referansemodeller, fjernet de leverandørforutinntak fra sammenligningen.

Funn:

  • CapEx: 10,39 millioner dollar enkelfase vs. 10,38 millioner dollar to-fase

  • Årlig OpEx: 1,04 millioner dollar vs. 679 000 dollar (35% reduksjon)

  • Femårs TCO: 15,6 millioner dollar vs. 13,8 millioner dollar (12% besparelse)

CapEx-pariteten overrasket mange som forventet en premie for to-fase. Gjeldende to-fase-systemer krever mer CDU-er, men enkelfase-designer trenger komplekse radmanifolder, robust lekkasjedeteksjon og harmonisk filtrering – kompleksiteter som unngås med gjeldende to-fase CDU-er. Neste generasjons CDU-er som ankommer i 2026 vil ytterligere redusere kostnadene og gjøre Generasjon 3 enda mer økonomisk å utplassere.

OpEx-fordelen stammer fra termodynamikk. To-fase-systemer opprettholder identiske chip-temperaturer mens de bruker varmere anleggsvann – omtrent 8°C høyere i gjennomsnitt. Hver grad som spares kutter årlig energibruken med omtrent 4%, oversatt til 35% OpEx-reduksjon som Jacobs dokumenterte over klima fra Phoenix til Stockholm.

Fremtenkende operatører går et skritt videre, konverterer den termiske marginen til omtrent 5% mer beregningskapasitet innen samme effektområde. I en verden hvor hver GPU representerer inntekt og effekt er begrenset, blir denne fordelen en konkurranseforskjell.

Silikonveien tvinger spørsmålet

Skiftet til Generasjon 3 drives ikke av kjølevæskeleverandører – det dikteres av prosessordesign.

NVIDIAs Rubin-arkitekturer forventes å overstige 2 000 W per prosessor. AMDs MI450 er på en lignende bane. Hver større chipprodusent pakker mer ytelse inn i mindre fotavtrykk, driver termisk tetthet skarpt oppover.

Hovedutfordringen er varmefluks – konsentrasjonen av varme målt i watt per kvadratcentimeter. Mens varmefluksen øker, når Generasjon 2-løsningene fysiske og økonomiske grenser. Strømningshastigheter blir destruktive, temperaturdeltaer utilgjengelige og systemkostnader ubærlige.

Generasjon 3 var bygget for denne virkeligheten. Ledende operatører spesifiserer allerede 250 kW-rack med klare veier til 1 MW+. Å vente på å “se hva som vinner” kan føles konservativt, men det er den risikofylte tilnærmingen. Silikonveien er fast; fysikk vil ikke bøye. Det eneste valget igjen er når å handle.

Det brune felt-dilemmaet

Milliarder investeres nå i Generasjon 2-infrastruktur som vil bli begrenset innen 36 måneder. Anlegg designet i dag rundt enkelfasevann vil slite med å støtte 2027-klassens prosessorer. Å oppgradere senere koster langt mer enn å bygge med Generasjon 3 i dag.

For eksisterende steder kan kjølemiddel-til-luft-systemer fungere som en bro, men de er ikke en langvarig løsning. Industriens retning er klar: Generasjon 3-arkitekturer vil forankre den neste tiårs nye bygninger.

En generasjonsvalg

Hver kjøleovergang har sett ut til å være tilstrekkelig inntil den neste generasjonen gjorde den foreldet. Operatører som tidlig adopterte væskekjøling – adopterte det i 2020-2021 i stedet for 2023 – fikk en nesten toårig utplasseringsfordel.

Den samme infleksjonen er underveis igjen. Fysikken er bevist. Økonomien er validerert av uavhengig analyse. Prosessorveier gjør overgangen uunngåelig.

Spørsmålet er ikke om endringen vil skje – det er om du vil lede den eller bli tvunget inn i den når Generasjon 2 når grensene.

Dataklynger designet i dag vil fungere godt inn i 2030-årene. Bygging med Generasjon 3-arkitekturer sikrer at de forblir brukbare for AI-æraen i stedet for å bli begrensede aktiva før de stabiliseres.

Fremtiden for dataklyngkjøling er en generasjonsforvandling – og Generasjon 3 er allerede her.

Josh Claman er administrerende direktør i Accelsius, produsent av direkte-til-chip, to-fase kjølingsteknologi. En forkjemper for kraften av transformasjonsteknologi gjennom sin 30-årige karriere, har herr Claman vokst og omposisjonert bedrifter i Dell, NCR og AT&T.