Connect with us

Tankeledere

Beskytte dine AI-investeringer: Hvorfor kjølestrategi betyr mer enn noensinne

mm

Datacenters operatører gambler med millioner på foreldet kjøleteknologi. Samtalen om datacenters kjøling ikke bare endrer seg – det blir fullstendig omdefinert av AI-økonomien. Innsatsen har aldri vært høyere.

Den raske utviklingen av AI har endret datacenters økonomi på måter få kunne forutse. Når en enkelt hylling med AI-tjenere koster rundt 3 millioner dollar – like mye som et luksus hus – endrer risikoberegningen seg fundamentalt. Som Andreessen Horowitz medgrunnlegger Ben Horowitz nylig advarte, datacenters som finasier disse massive hardware-investeringene “kan bli fortapt svært raskt” hvis de ikke behandler sin infrastrukturstrategi med omsorg.

Denne nye virkeligheten krever en grundig omtenkning av kjøletilnærmingen. Mens tradisjonelle målinger som PUE og driftskostnader fortsatt er viktige, er de sekundære til å beskytte disse multi-millon-dollar hardware-investeringene. Den virkelige spørsmålet datacenters operatører bør stille seg er: Hvordan beskytter vi best vår AI-infrastrukturinvestering?

De skjulte risikoene med tradisjonell kjøling

Industriens historiske avhengighet av enkeltfase, vannbasert kjøling løsninger bærer økende uakseptable risikoer i AI-æraen. Mens det har tjent datacenters godt i mange år, har termiske kravene til AI-arbeidsbyrden presset denne teknologien beyond dens praktiske grenser. Årsaken er enkel fysikk: enkeltfase-systemer krever høyere strømningshastigheter for å håndtere dagens termiske belastninger, øker risikoen for lekkasjer og katastrofale feil.

Dette er ikke en hypotetisk risiko. En enkelt vannlekkasje kan øyeblikkelig ødelegge millioner i AI-hardware – hardware som ofte har måneder-lange erstattingsleveringstider i dagens marked med begrensede ressurser. Kostnaden av selv ett enkelt katastrofalt feil kan overstige en datacenters kjøleinfrastruktur-budsjett for hele året. Likevel fortsetter mange operatører å stole på disse systemene, effektivt gambler sin AI-investering på foreldet teknologi.

Ved Data Center World 2024, spurte Dr. Mohammad Tradat, NVIDIAs sjef for datacenter-mekanisk ingeniør, spurte, “Hvor lenge vil enkeltfase-kjøling leve? Det vil bli faset ut svært snart… og så vil behovet være for to-fase, kjølemiddel-basert kjøling.” Dette er ikke bare en voksende oppfatning – det blir en industrikonsensus bakket av fysikk og finansiell realitet.

En ny tilnærming til investeringsbeskyttelse

To-fase kjølingsteknologi, som bruker dielektriske kjølemidler i stedet for vann, endrer fundamentalt denne risikoequasjonen. Kostnaden av å implementere et to-fase kjølingssystem – typisk rundt 200 000 dollar per hylling – bør sees på som forsikring for å beskytte en 5 millioner dollar AI-hardware-investering. For å sette dette i perspektiv, det er en 4% premie for å beskytte din eiendom – betraktelig lavere enn forsikringsrater for andre multi-millon-dollar forretningsinvesteringer. Forretningscasen blir enda klarere når du tar med i beregningen de potensielle kostnadene av AI-trening-forstyrrelse og inaktiv infrastruktur under uventet nedtid.

For datacenters operatører og finansielle interessenter, beslutningen om å investere i to-fase kjøling bør vurderes gjennom linser av risikostyring og investeringsbeskyttelse. De relevante målinger bør inkludere ikke bare driftskostnader eller energieffektivitet, men også den totale verdien av hardware som beskyttes, kostnaden av potensielle feilscenarier, fremtidsikringen for neste-generasjons hardware og risikojustert avkastning på kjøleinvestering.

Ettersom AI fortsetter å drive opp tettheten og verdien av datacenter-infrastruktur, må industrien utvikle sin tilnærming til kjølestrategi. Spørsmålet er ikke om å gå over til to-fase kjøling, men når og hvordan å gjøre overgangen samtidig som man minimiserer risikoen for eksisterende operasjoner og investeringer.

Smart operatører gjør allerede denne overgangen, mens andre risikerer å lære en dyrekjøpt lekse. I en æra hvor en enkelt hylling koster mer enn mange datacenters årlige driftsbudsjett, å gambler på foreldet kjøleteknologi ikke bare er risikabelt – det er potensielt katastrofalt. Tiden til å handle er nå – før denne risikoen blir en realitet.

Josh Claman er administrerende direktør i Accelsius, produsent av direkte-til-chip, to-fase kjølingsteknologi. En forkjemper for kraften av transformasjonsteknologi gjennom sin 30-årige karriere, har herr Claman vokst og omposisjonert bedrifter i Dell, NCR og AT&T.