Connect with us

Lideri de opinie

10 Întrebări Esențiale de Pus pentru a Asigura o Implementare Eficientă a Răcirii Centrelor de Date cu Inteligență Artificială

mm

Cu apariția inteligenței artificiale și a calculului de înaltă performanță, centrele de date se înmulțesc la o viteză record. De fapt, cantitatea de capacitate a centrelor de date în construcție la sfârșitul anului 2024 a depășit de două ori cantitatea de la sfârșitul anului 2023 (6.350 MW în construcție versus ~3.078 MW). În același timp, hardware-ul utilizat și sarcinile de lucru gestionate în aceste centre de date devin din ce în ce mai intensive.

În aceste condiții de schimbare rapidă, atât riscurile, cât și provocările sunt în creștere. Și cu centrele de date care cheltuie, în medie, până la 40% din bugetul lor energetic total pe răcire, managementul termic devine una dintre principalele provocări ale industriei. Pe de altă parte, operatorii de centre de date au mai multe opțiuni ca niciodată pentru a-și răci facilitățile în mod fiabil, eficient și rentabil.

Desigur, atunci când există opțiuni, există și decizii de luat. Așadar, atunci când luați în considerare propria implementare a centrului de date, iată 10 întrebări esențiale pe care trebuie să le răspundeți pentru a pune operațiunea în funcțiune rapid, asigurând în același timp eficiență, fiabilitate și durabilitate pe termen lung.

Întrebarea 1: Cât de repede pot pune sistemul de răcire online fără a compromite fiabilitatea?

În cursa armelor inteligenței artificiale, adevăratul diferențiator pentru succesul industriei nu este cine acumulează cele mai multe GPU-uri — ci cine le pune online cel mai repede. Timpul de la inițierea unei implementări până la punerea sa în funcțiune a devenit noul câmp de luptă, determinând cât de repede întreprinderile pot transforma investițiile în inteligență artificială în impact comercial. Liderii nu vor fi doar cei cu resurse de calcul masive, ci și cei care le deblochează primii, accelerând inovarea, veniturile și avantajul competitiv.

Dar grăbirea implementării răcirii poate avea efecte negative, ducând la ineficiențe, întreruperi sau retrofits costisitoare. Operatorii trebuie să se întrebe dacă sistemul lor ales poate fi implementat rapid și să reziste testului timpului. O strategie care echilibrează viteza de implementare cu robustețea oferă atât pregătirea imediată pentru piață, cât și reziliență pe termen lung.

Întrebarea 2: Care este metoda de răcire cea mai potrivită pentru nevoile proiectului meu?

Nu există o soluție unică pentru fiecare implementare a centrelor de date. Răcirea cu aer a fost mult timp standardul, dar ajunge rapid la limitele sale fizice în gestionarea hardware-ului avansat și a rafturilor de înaltă densitate, caracteristice centrelor de date cu inteligență artificială. Răcirea lichidă oferă o eficiență fără precedent la scară și o performanță viitoare pentru sarcinile de lucru din ce în ce mai solicitante. Abordările hibride pot completa golul, dar pe termen lung, centrele de date cu inteligență artificială vor depinde de soluții de răcire lichidă pentru a gestiona sarcinile de lucru din ce în ce mai intensive. Alegerea metodei corecte de răcire lichidă depinde, însă, de tipul de sarcină de lucru, de densitate, de locație și de alți factori.

Există două metode principale de răcire lichidă utilizate în prezent: direct-pe-chip (DTC) și răcire prin imersie. Deși DTC este în prezent mai comun, se așteaptă ca răcirea prin imersie să câștige teren pe măsură ce densitățile de putere ale cipurilor cresc. Sistemele DTC direcționează lichidul de răcire direct către componentele care generează căldură, cum ar fi CPU-urile și GPU-urile, prin plăci reci, oferind câștiguri rapide de eficiență cu modificări minime ale infrastructurii. Sistemele monofazice sunt mai simple și prietenoase cu retrofits, în timp ce sistemele bifazice utilizează agenți frigori pentru a atinge o performanță de transfer de căldură mai mare, cu o putere de pompare mai mică, dar cu o complexitate a sistemului mai mare. Răcirea prin imersie, pe de altă parte, scufundă servere întregi în fluide dielectrice — fie circulate (monofazice), fie fierte și condensate în interiorul unor tancuri etanșe (bifazice).

Care soluție este potrivită pentru mediul dvs. depinde de natura hardware-ului, a sarcinilor de lucru, a bugetului și a altor factori. Dar fiind conștienți de opțiunile disponibile este vital pentru viabilitatea pe termen lung a centrului dvs. de date cu inteligență artificială.

Întrebarea 3: Va susține sistemul meu de răcire sarcinile de lucru de azi și densitățile conduse de inteligență artificială de mâine?

Ce ne aduce la următoarea mare întrebare: va rezista sistemul meu testului timpului? Cererea de centre de date se accelerează dincolo de normele istorice. Cluster-urile de antrenament cu inteligență artificială, de exemplu, pot necesita de 10-20 de ori densitatea de putere a rafturilor tradiționale de întreprindere. Întrebarea pe care operatorii trebuie să o pună este dacă proiectarea sistemului lor de răcire poate gestiona densitățile viitoare fără a necesita o înlocuire completă.

Creșterea inteligenței artificiale, a calculului de înaltă performanță și a arhitecturilor de rafturi din ce în ce mai dense împinge răcirea cu aer la limitele sale. În Studiul Uptime Institute din 2024 privind sistemele de răcire, majoritatea operatorilor au declarat că răcirea cu aer devine impracticabilă și/sau prea scumpă la orice punct de peste ~20 kW pe raft. Cu toate acestea, raportarea actuală a industriei arată că rafturile cu inteligență artificială deja depășesc frecvent 100 kW pe raft. Și aceste cifre sunt în creștere. Nvidia a prezentat recent planurile pentru GPU-urile sale Rubin Ultra cu rafturi Kyber, care vor depăși 600.000 de wați pe raft până în 2027.

Știind că răcirea cu aer este pe cale de a deveni învechită în implementările centrelor de date cu inteligență artificială, operatorii pot opta pentru abordări hibride sau etapizate, în cazurile în care implementările complete de răcire lichidă nu sunt o opțiune. Din nou, având în vedere timpul și costul imens investit în aceste proiecte, viabilitatea pe termen lung este de cea mai mare importanță. Prin urmare, atunci când selectați soluții de răcire, asigurați-vă că acestea sunt pregătite pentru drumul lung.

Întrebarea 4: Care sunt implicațiile totale de cost pe durata întregului ciclu de viață?

În timp ce cheltuielile inițiale pot fi uluitoare în spațiul centrelor de date, cheltuielile de capital (CAPEX) reprezintă doar o parte a poveștii. Operatorii ar trebui să calculeze costul total de proprietate (TCO), incluzând cheltuielile de operare (OPEX) legate de consumul de energie, întreținere și retrofits, atunci când iau în considerare soluțiile lor de răcire. Un sistem care pare mai scump la început poate oferi economii pe termen lung prin eficiență energetică, reducerea timpului de întrerupere și creșterea duratei de viață. Strategia corectă de răcire nu este niciodată cea mai ieftină la început — ci cea care optimizează costurile pe durata ciclului de viață de 10-15 ani al facilității.

Rețineți că acestea nu sunt implementări pe termen scurt. Mai mult, cu cât obțineți mai multă viață din implementare, cu atât mai mult valoare veți obține. Gândindu-vă dincolo de CAPEX și concentrându-vă asupra costurilor și economiilor pe termen lung este esențial pentru a vă asigura că obțineți maximum din proiectul dvs. de centru de date.

Întrebarea 5: Cum va afecta această strategie de răcire profilul meu de durabilitate?

Așa cum s-a menționat anterior, răcirea poate reprezenta până la 40% sau mai mult din consumul total de energie al unui centru de date. Pe măsură ce reglementările și cerințele de raportare ESG se extind, operatorii trebuie să se întrebe: cum afectează acest sistem amprenta mea de carbon, consumul de energie și alte angajamente de durabilitate? Soluțiile care reduc consumul de energie sau de resurse sau care se aliniază cu standarde globale, cum ar fi cadrul Green Grid, devin din ce în ce mai preferate, dar și necesare pentru încrederea investitorilor și conformitatea regulamentară.

Între timp, sectorul public cere din ce în ce mai mult reducerea consumului de energie. Monitoring Analytics, organismul de supraveghere independent al pieței pentru rețeaua de energie din Mid-Atlantic, a produs o cercetare în luna iunie care arată că 70% din creșterea costului cu energia electrică anul trecut a fost cauzată de cererea centrelor de date. Nu este de mirare că consumatorii sună alarma, iar statele examinează măsuri serioase pentru a aborda această preocupare, inclusiv posibilitatea de a închide forțat în perioadele de consum ridicat. Prin investiții în soluții de răcire mai eficiente din punct de vedere energetic și mai durabile, organizațiile pot naviga atât percepția publică, cât și provocările regulamentare care se profilează.

Întrebarea 6: Câtă apă va consuma această abordare de răcire — și este aceasta durabilă în regiunea mea?

Centrele de date mari pot consuma până la 5 milioane de galoane de apă pe zi. Nu ar trebui să fie o surpriză că lipsa apei devine o problemă definitorie pentru centrele de date, în special în regiuni precum Sud-Vestul American și părți din Europa, unde drepturile și lipsa de apă duc la o atenție sporită asupra centrelor de date. Pentru a face lucrurile bine, operatorii trebuie să calculeze consumul de apă proiectat al sistemului lor de răcire și să evalueze dacă se aliniază cu realitățile locale și regionale (în ceea ce privește atât disponibilitatea, cât și cerințele de reglementare).

Nu fiți înșelați de nume — răcirea lichidă consumă de fapt semnificativ mai puțină apă decât sistemele tradiționale de răcire cu aer. Conform unui studiu publicat de Nature, răcirea lichidă reduce consumul de “apă albastră” al centrelor de date cu 31-52% față de răcirea cu aer tradițională, pe durata de viață. Soluțiile de răcire care minimizează sau elimină consumul de apă pot ajuta la protejarea facilităților împotriva riscurilor și reglementărilor de mediu.

Întrebarea 7: Care sunt riscurile sau limitările asociate cu răcirea lichidă, și cum pot fi ele atenuate?

Deși oferă avantaje fără precedent în ceea ce privește eficiența, durabilitatea și rentabilitatea pe termen lung, multe mituri persistă despre răcirea lichidă, în special în ceea ce privește fiabilitatea, costul și integrarea. În realitate, progresele tehnologice, materialele și designul au făcut răcirea lichidă sigură, fiabilă și din ce în ce mai rentabilă. Cheia pentru operatori este să evalueze aceste sisteme în funcție de datele de performanță din lumea reală, și nu de percepțiile învechite, și să proiecteze cu cele mai bune practici dovedite.

Atunci când examinați răcirea lichidă, este la fel de important să fiți conștienți de care soluție este potrivită pentru facilitățile dvs. Cu abordări diferite (de exemplu, direct-pe-chip [DTC], imersie) și o mulțime de furnizori care oferă o varietate de soluții, ar trebui să efectuați întotdeauna dvs. datoria de a face diligența atunci când luați în considerare o implementare de răcire lichidă.

Întrebarea 8: Cum va afecta proiectarea mea de răcire utilizarea spațiului și densitatea rafturilor?

Spațiul este la fel de valoros ca și puterea în facilitățile moderne de centre de date. Rafturile de înaltă densitate, susținute de răcirea lichidă eficientă, pot reduce dramatic cerințele de spațiu și amprenta facilităților. Acest lucru, la rândul său, permite operatorilor să scaleze sarcinile de lucru în spațiile existente sau să minimizeze costurile cu terenul și construcția pentru noile clădiri. A putea face mai mult cu mai puțin spațiu nu numai că reduce costurile, dar deschide și o gamă mult mai largă de site-uri viabile pentru construcție. Cu amprente mai mici, dezvoltatorii pot construi mai liber și pot aduce calculul mai aproape de utilizatorul final. Pregătirea acestor întrebări dinainte asigură că proiectarea răcirii este aliniată atât cu densitatea, cât și cu utilizarea spațiului.

Întrebarea 9: Care este strategia mea de reziliență pe termen lung în cazul în care sarcinile de lucru sar sau reglementările se strâng?

Centrele de date nu sunt statice. Creșterile neașteptate ale cererii, aplicațiile noi de inteligență artificială și mandatele de eficiență și durabilitate din ce în ce mai stricte pot pune rapid o presiune asupra infrastructurii. Operatorii trebuie să se întrebe dacă strategia lor de răcire este suficient de adaptabilă pentru a face față acestor schimbări adesea neașteptate. Sistemele de răcire eficiente trebuie să fie pregătite pentru scalarea capacității, îndeplinirea noilor cerințe de conformitate și integrarea cu tehnologiile viitoare.

Sistemele care oferă modularitate și furnizorii cu lanțuri de aprovizionare robuste vor ajuta la izolarea centrului dvs. de date de schimbările cererii, permițându-vă să scalați mai ușor și să actualizați și integrați mai ușor atunci când este necesar.

Întrebarea 10: Tratez răcirea ca pe un factor strategic — sau doar ca o grijă secundară?

Această ultimă întrebare, cuprinzătoare, este probabil cea mai importantă. Atunci când luați în considerare sistemul dvs. de răcire, luați un moment pentru a reevalua rolul răcirii în operațiunile generale ale centrului dvs. de date. Prea des, răcirea este tratată ca o infrastructură de fundal, când, în realitate, este un factor strategic care permite performanța, timpul de funcționare și durabilitatea. Companiile care investesc în strategii de răcire gândite capătă nu numai eficiență operațională, ci și un avantaj competitiv în ceea ce privește fiabilitatea, conformitatea și costurile pe termen lung.

Și pe măsură ce inteligența artificială pune cerințe noi și mai intensive asupra centrelor de date, este esențial să luați o perspectivă pe termen lung asupra răcirii. Nu vă gândiți doar la ce este mai bine, mai rapid sau mai ieftin pentru implementarea dvs. de astăzi. Gândiți-vă la modul în care soluția dvs. de răcire vă poziționează pe o perioadă de 5, 10 sau chiar 15 ani. Dacă sistemul dvs. de răcire abia îndeplinește cerințele de astăzi, puteți fi siguri că nu va mai face față doar câțiva ani de acum înainte. Rețineți, răcirea este centrală pentru succesul general al facilității pe durata întregului său ciclu de viață.

Răcirea este Acum Centrală pentru Succesul pe Termen Lung al Centrelor de Date — Alegeți cu Înțelepciune

Răcirea nu mai este o problemă de fundal — este centrală pentru succesul pe termen lung și scurt al fiecărui centru de date. Prin punerea acestor zece întrebări de la început, operatorii pot reduce timpul de implementare, minimiza riscurile și asigura că facilitățile sunt construite pentru reziliență într-o lume condusă de inteligență artificială, definită de schimbare și fluctuații.

Viitorul industriei va fi definit nu doar de viteza cu care operatorii implementează capacitatea, ci și de cât de inteligent proiectează pentru durabilitate pe termen lung. Cei care tratează răcirea ca pe un factor strategic vor fi cei mai bine poziționați pentru a conduce în anii care vin.

Kevin Roof este Director Global al Ofertei și Managementului de Captură pentru LiquidStack. Ca inginer mecanic și PMP cu peste un deceniu de experiență în răcirea centrelor de date, Kevin aduce perspective și conducere valoroasă în spațiul de răcire lichidă.