Lideri de opinie

Centrele de date cu inteligență artificială au nevoie de mai mult decât doar de răcire: au nevoie de o inginerie mai rapidă

mm

Inteligența artificială transformă munca digitală, dar impactul său este din ce în ce mai fizic. Inteligența artificială la scară masivă necesită mult mai multă putere decât oricând înainte. Și centrele de date care găzduiesc aceste servere de inteligență artificială se luptă să țină pasul cu cererea. De fapt, un raport de la Deloitte estimează că până în 2035, cererea de putere din centrele de date cu inteligență artificială din Statele Unite alone ar putea crește de peste treizeci de ori.

Cu toate acestea, problema nu este doar o chestiune de consum de putere. Centrele de date care găzduiesc aceste servere de inteligență artificială trebuie să țină cont de nivelul uriaș de căldură pe care tehnologia o creează. Clusterele moderne de GPU pot atinge 50 kW pe raft și mai mult. Acesta este un salt uriaș de zece ori față de serverele standard de calcul de acum o decadă.

Sistemele de răcire care au fost mult timp în funcțiune pentru centrele de date pentru a gestiona suficient încărcăturile de lucru IT sunt depășite de aceste noi ieșiri de căldură. Infrastructura pur și simplu nu poate ține pasul, lăsând pe cei care proiectează sistemele de răcire a centrelor de date o nouă provocare. Inginerii care se ocupă de proiectarea infrastructurii pregătite pentru inteligență artificială descoperă din ce în ce mai mult că fluxurile de lucru tradiționale de inginerie nu pot ține pasul cu scala și viteza de implementare a inteligenței artificiale.

Poate paradoxal, inteligența artificială crește atât cererea de capacitate a centrelor de date, cât și transformă procesul de inginerie utilizat pentru a construi acea capacitate. Aceleași progrese în inteligența artificială care conduc la cerințe de infrastructură fără precedent sunt, de asemenea, începând să accelereze modul în care inginerii modelează, validează și optimizează sistemele fizice care susțin aceste încărcături de lucru.

În esență, inteligența artificială devine parte a procesului utilizat pentru a proiecta infrastructura care rulează inteligența artificială.

În lumina acestor fapte, multe echipe de ingineri adoptă fluxuri de lucru de simulare accelerate de inteligență artificială, native în cloud, care le permit să evalueze performanța termică, strategiile de răcire și compromisurile de infrastructură înainte de începerea construcției.

Când vine vorba de infrastructura actuală a centrelor de date, riscurile sunt atât de mari încât orice greșeală poate fi devastatoare. Demonstrația performanței înainte de construcție a devenit imperativul pentru succesul pe termen lung, nu pentru a se baza pe presupuneri, reguli empirice sau validări târzii.

Infrastructura de răcire tradițională sub presiune

Din nefericire pentru echipele de ingineri, încărcăturile de lucru cu inteligență artificială sunt fundamental diferite de calculul tradițional bazat pe cloud. Nu există nicio fluctuație cu inteligența artificială, cerințele de rețea, ieșirile de căldură și cerințele de putere sunt constante.

Această schimbare, în parte, expune o deficiență cheie a multor centre de date. Multe au fost construite sub presupunerea că o astfel de cerere susținută nu va fi necesară. Și deoarece aceste sisteme de răcire sunt adesea foarte energo-intensive, devine rapid impracticabil să “supraráci” și să presupunem că va acoperi nevoile centrelor de date. Acestă abordare și prioritatea timpului de funcționare vor face ca costurile și consumul de energie să crească rapid și să scape de sub control.

La sfârșitul zilei, intersecția la care se află multe centre de date nu este o chestiune de “mai multă căldură”. Riscul definitoriu pe care îl aduce creșterea inteligenței artificiale este o marjă mult mai strânsă de eroare.

Pentru dezvoltatorii de centre de date, orice întârziere în procesul de validare poate afecta angajamentele clienților, planificarea capacității sau costurile cu energia.

În mod istoric, echipele de ingineri puteau compensa incertitudinea prin supradimensionare, presupuneri de proiectare conservatoare și validare în etape târzii. Infrastructura inteligenței artificiale schimbă această ecuație. Ritmul de implementare, investițiile de capital necesare și creșterea densității rafturilor lasă mult mai puțin spațiu pentru ingineria bazată pe încercări și erori. Deciziile care puteau fi validate mai târziu acum trebuie demonstrate mult mai devreme în procesul de proiectare.

Noua realitate: demonstrarea performanței termice înainte de începerea lucrărilor

Cu marja de eroare scăzând, echipele de ingineri mută analiza termică mai devreme în procesul de proiectare, în timp ce modificările sunt încă ieftine și proiectul este încă flexibil. În loc să aștepte până la punerea în funcțiune pentru a descoperi dacă modelele de curgere a aerului, dispozitivele de raft, strategiile de conținere sau amplasarea echipamentului de răcire sunt suficiente, pot modela curgerea aerului și transferul de căldură înainte de începerea construcției.

Acest lucru le permite inginerilor să identifice zonele fierbinți, să testeze strategiile de răcire și să compare opțiunile de proiectare în condiții de funcționare realistă. O echipă poate evalua dacă aerul rece ajunge la rafturile de înaltă densitate, dacă evacuarea caldă se recirculă în intrările echipamentului și dacă capacitatea de răcire este utilizată eficient.

Acesta este locul în care arhitectura platformei contează. Pentru echipele care lucrează sub o presiune puternică, simularea nu poate rămâne limitată la un grup mic de specialiști cu acces la resurse HPC dedicate. Utilizarea unei platforme de simulare native în cloud face analiza de înaltă fidelitate accesibilă întregilor echipe de ingineri, nu doar unui grup mic de persoane. Acest lucru le permite echipelor să ruleze studii, să compare opțiuni de proiectare și să colaboreze fără a construi sau a menține propria infrastructură de calcul.

Cu inteligența artificială integrată în fluxul de lucru, rolul simulării însăși începe să se schimbe. În mod istoric, simularea a fost limitată de expertiză, timp și resurse computaționale. Rularea studiilor de înaltă fidelitate a necesitat adesea cunoștințe specializate, hardware dedicat și cicluri de iterare lungi.

Inteligența artificială pentru inginerie, care utilizează agenți aproape autonomi pentru a automatiza și a accelera fluxurile de lucru de proiectare, simulare și analiză, ajută la reducerea acestor bariere prin accelerarea configurării modelului, a afișării insight-urilor relevante și a permis echipelor să evalueze mai multe opțiuni de proiectare în mai puțin timp. În loc să reserve simularea pentru un pas final de validare, echipele de ingineri pot utiliza fluxuri de lucru accelerate de inteligență artificială pentru a explora alternative continuu pe tot parcursul procesului de proiectare.

Rezultatul nu este doar o simulare mai rapidă. Este o inovare mai rapidă.

Deci, ce înseamnă toate acestea în realitate pentru echipele de ingineri? Să considerăm o companie care produce sisteme de răcire și ventilație pentru facilități mari și are nevoie de o modalitate mai rapidă de a testa noile proiecte de echipamente. De obicei, aceste companii trebuie să construiască prototipuri fizice, să aducă specialiști din afară și să petreacă câteva săptămâni verificând dacă aerul se mișcă și se amestecă corect în sistem.

Dar atunci când această companie decide să utilizeze software de simulare pentru a crea o versiune virtuală a configurației de test, ecuația se schimbă. Abordarea aceasta permite inginerilor să testeze performanța aerului și a temperaturii pe computer înainte de a construi produsul real.

Și rezultatele adesea aduc un impact real. Faza de testare prealabilă poate fi redusă la doar 2-3 săptămâni, iar timpul de inginerie poate scădea la 40 de ore, față de 85 de ore în fluxurile de lucru tradiționale.

Dar valoarea aici este mult mai mare decât doar economisirea timpului. Valoarea reală constă în capacitatea echipei de ingineri de a pune mai multe întrebări și de a explora posibilitățile mai devreme. Ce se întâmplă dacă densitatea rafturilor crește? Ce se întâmplă dacă căile de curgere a aerului se schimbă? Ce se întâmplă dacă ipotezele de redundanță eșuează?

Permiterea unui nivel ridicat de explorare precum acesta este ceea ce ridică simularea de la un instrument analitic la o componentă crucială a strategiei de proiectare a infrastructurii.

Infrastructura inteligenței artificiale necesită o inginerie accelerată de inteligență artificială

Următoarea fază a infrastructurii inteligenței artificiale nu va fi definită doar de dimensiunea facilităților, de densitatea rafturilor sau de capacitatea de răcire. Va fi definită și de viteza cu care echipele de ingineri pot demonstra că aceste sisteme vor funcționa înainte de a fi construite.

Acesta este locul în care următorul avantaj competitiv al industriei va apărea. Dezvoltatorii de centre de date care aduc simularea mai devreme în procesul de proiectare, o fac accesibilă pe tot parcursul echipelor de ingineri și o asociază cu fluxuri de lucru accelerate de inteligență artificială vor fi mai bine poziționați pentru a lua decizii cu încredere înainte de a se angaja capitalul și de a începe construcția.

Pe măsură ce inteligența artificială continuă să schimbe cerințele fizice impuse asupra centrelor de date, va schimba și modul în care aceste facilități sunt proiectate. Organizațiile care vor conduce această următoare eră nu vor reacționa doar la încărcături de căldură mai mari sau la constrângeri de energie mai stricte. Vor construi procese de proiectare capabile să anticipeze acestea.

David Heiny este CEO și co-fondator la SimScale. El deține o diplomă de licență în matematică și un diploma în inginerie mecanică de la Universitatea Tehnică din München, precum și o diplomă de master în științe computaționale și inginerie de la Institutul de Tehnologie din Georgia. Expertiza sa include CFD, analiza numerică, dezvoltarea de software și matematica aplicată, dezvoltate atât prin studii, cât și prin experiența sa de muncă (FZG – TU München, MAN Diesel & Turbo, FluiDyna GmbH,).

David deține, de asemenea, o diplomă de onoare în managementul tehnologiei de la Centrul pentru Tehnologia Digitală și Management (CDTM). David a absolvit Academia Elite din Bavaria (Bayerische EliteAkademie) alături de alți trei fondatori ai SimScale - Vincenz Dölle, Johannes Probst și Alexander Fischer.