Connect with us

Protejarea investiției dvs. în IA: De ce strategia de răcire este mai importantă ca niciodată

Lideri de opinie

Protejarea investiției dvs. în IA: De ce strategia de răcire este mai importantă ca niciodată

mm

Operatorii de centre de date pariază milioane pe tehnologia de răcire învechită. Conversația despre răcirea centrelor de date nu se schimbă doar – este complet redefinită de economia IA. Mizele nu au fost niciodată mai mari.

Avansarea rapidă a IA a transformat economia centrelor de date în moduri pe care puțini le-au prevăzut. Când un singur raft de servere IA costă aproximativ 3 milioane de dolari – la fel ca o casă de lux – calculul riscului se schimbă fundamental. Așa cum a avertizat recent Ben Horowitz, co-fondator al Andreessen Horowitz, centrele de date care finantează aceste investiții masive în hardware “pot ajunge foarte repede în dificultate” dacă nu își gestionează cu atenție strategia de infrastructură.

Această nouă realitate cere o reevaluare fundamentală a abordărilor de răcire. În timp ce metricile tradiționale, cum ar fi PUE și costurile de operare, sunt încă importante, ele sunt secundare protejării acestor investiții de hardware de milioane de dolari. Întrebarea reală pe care ar trebui să o pună operatorii de centre de date este: Cum putem proteja cel mai bine investiția noastră în infrastructura IA?

Riscurile ascunse ale răcirii tradiționale

Dependența istorică a industriei de soluții de răcire cu apă, cu o singură fază, prezintă riscuri din ce în ce mai inacceptabile în era IA. Deși a servit bine centrele de date timp de ani, cerințele termice ale sarcinilor de lucru IA au depășit limitele practice ale acestei tehnologii. Motivul este simpla fizică: sistemele cu o singură fază necesită debite de curgere mai mari pentru a gestiona încărcăturile termice de astăzi, ceea ce crește riscul de scurgeri și eșecuri catastrofale.

Acesta nu este un risc ipotetic. O singură scurgere de apă poate distruge instantaneu milioane de dolari în hardware IA – hardware care are, adesea, timpi de înlocuire de luni în piața actuală cu constrângeri de aprovizionare. Costul unei singure eșecuri catastrofale poate depăși bugetul infrastructurii de răcire a unui centru de date pentru un an întreg. Cu toate acestea, mulți operatori continuă să se bazeze pe aceste sisteme, pariază efectiv investiția lor în IA pe tehnologie învechită.

La Data Center World 2024, Dr. Mohammad Tradat, managerul de inginerie mecanică a centrelor de date de la NVIDIA, a întrebat, “Cât timp va mai fi utilizată răcirea cu o singură fază? Va fi înlocuită foarte curând… și atunci va fi nevoie de răcire cu două faze, pe bază de refrigerent.” Acesta nu este doar un punct de vedere în creștere – este devenind un consens al industriei, susținut de fizică și realitate financiară.

O abordare nouă pentru protejarea investiției

Tehnologia de răcire cu două faze, care utilizează refrigerenți dielectrici în loc de apă, schimbă fundamental această ecuație de risc. Costul implementării unui sistem de răcire cu două faze – de obicei, în jur de 200.000 de dolari pe raft – ar trebui considerat ca o asigurare pentru protejarea unei investiții de 5 milioane de dolari în hardware IA. Pentru a pune acest lucru în perspectivă, aceasta este o primă de 4% pentru a proteja activele dvs. – considerabil mai mică decât ratele de asigurare pentru alte investiții comerciale de milioane de dolari. Cazul de afaceri devine și mai clar atunci când luați în considerare costurile potențiale ale întreruperii antrenamentului IA și ale infrastructurii inactive în timpul downtime-ului neplanificat.

Pentru operatorii de centre de date și stakeholderii financiari, decizia de a investi în răcirea cu două faze ar trebui evaluată prin prisma managementului riscului și protejării investiției. Metricile relevante ar trebui să includă nu numai costurile de operare sau eficiența energetică, ci și valoarea totală a hardware-ului protejat, costul potențial al scenariilor de eșec, valoarea de protejare pentru hardware-ul de generație următoare și rentabilitatea ajustată la risc a investiției în răcire.

Pe măsură ce IA continuă să crească densitatea și valoarea infrastructurii centrelor de date, industria trebuie să evolueze abordarea sa față de strategia de răcire. Întrebarea nu este dacă să treacă la răcirea cu două faze, ci când și cum să facă această tranziție, minimizând riscul pentru operațiunile și investițiile existente.

Operatorii inteligenți fac deja acest pas, în timp ce alții riscă să învețe o lecție scumpă. Într-o eră în care un singur raft costă mai mult decât bugetul anual de operare al multor centre de date, pariază pe tehnologia de răcire învechită nu este doar riscant – poate fi catastrofal. Momentul de a acționa este acum – înainte ca acest risc să devină realitate.

Josh Claman este CEO-ul Accelsius, producător de tehnologie de răcire direct-to-chip, cu două faze. Avocat al puterii tehnologiei transformative pe parcursul carierei sale de 30 de ani, domnul Claman a făcut să crească și să repoziționeze afaceri la Dell, NCR și AT&T.