Connect with us

Skutečná úzká místa umělé inteligence: Energie, chlazení a fyzika měřítka

Umělá inteligence

Skutečná úzká místa umělé inteligence: Energie, chlazení a fyzika měřítka

mm

Umělá inteligence pokročila výjimečným tempem za posledních deset let. Rychlejší GPU, větší klastry a revoluční architektury odemkly průlomy, které dříve seemed nemožné. Yet jako průmysl tlačí směrem k modelům s trillions parametrů a hyperscale AI továrnám, další bariéra nemá nic společného s algoritmy. Skutečná úzká místa dnes jsou fyzická: energie, chlazení a infrastruktura vyžadovaná pro udržení výpočtu na planetární měřítku.

Otázka již není, kolik čipů můžete vyrábět, ale zda můžete dodat gigawatty, vodu a přenosové linky potřebné pro jejich provoz. Infrastruktura, ne křemík, je to, co bude určovat tempo umělé inteligence v letech, které budou.

Gigawatty nad gigaflopy

Projekt OpenAI „Stargate“, který je budován s Oracle a SoftBank, cílí na téměř 7 gigawattů kapacity napříč americkými kampusy — srovnatelné s několika jadernými reaktory. V tomto měřítku je hlavní výzvou není producción GPU, ale zajištění elektráren a transformačních stanic pro jejich provoz.

Poptávka Microsoftu je stejně ohromující. Jeho AI pracovní zátěže se očekává, že vyžadují tolik elektřiny jako celý region Nové Anglie do roku 2030. To vysvětluje, proč společnost investovala desítky miliard do obnovitelných projektů a také prosazuje více experimentální možnosti, jako je jaderná fúze a pokročilé jaderné reaktory.

Dynamika se promítá do energetické politiky. V PJM Interconnection, regionální organizaci pro přenos, která spravuje síť pro více než 65 milionů lidí ve 13 státech a Washingtonu, D.C., utility zkoumají mechanismy pro omezení datových center během špičkové poptávky. Velké technologické firmy lobují proti takovým omezením, ale fakt, že regulátoři je dokonce zvažují, ukazuje, jak centrální je umělá inteligence pro plánování sítě.

Výzva chlazení

Dodávka elektřiny je pouze polovina problému. Jakmile se energie dostane k regálům, další výzvou je teplo. Každý высокokvalitní GPU spotřebuje kolem 700 wattů a s regály hostujícími stovky GPU, hustoty dosahují 100 až 600 kilowattů na regál. Vzduchové chlazení, průmyslový standard po desetiletí, se stává nefunkčním beyond přibližně 40 kilowattů na regál kvůli neefektivitě proudění a recirkulaci.

Kapalné chlazení se tedy posunulo z niky do mainstreamu. Nejnovější kapalně chlazené platformy Blackwell od NVIDIA jsou navrženy pro hyperscale AI klastry a poskytují 25× lepší energetickou efektivitu a 300× větší vodní efektivitu než vzduchově chlazené regály. Společnost také spolupracuje s Vertiv na referenční architektuře, která může zvládnout více než 130 kilowattů na regál, což činí husté nasazení GPU proveditelným.

Startupy také inovují. Corintis, švýcarská společnost, která vkládá mikrokanály přímo do substrátů čipů, nedávno získala 24 milionů dolarů a již počítá Microsoft mezi svými zákazníky. Výzkumný tým Microsoftu již demonstroval mikrofluidní kanály vyřezané do balení čipů, snižující maximální teploty GPU o až 65 procent a zvyšující efektivitu o trojnásobek ve srovnání s tradičními chladicími deskami. Tyto technologie umožňují udržet GPU v chodu na plný výkon bez roztavení datového centra.

Voda jako strategická proměnná

Kapalné chlazení zavádí další proměnnou: spotřebu vody. Odpařovací a chlazené vodní systémy mohou vyžadovat enormní objemy, když se měří na kampusy stovek megawattů. V Phoenixu mohou klastry datových center vyžadovat stovky milionů galonů vody denně, což vyvolává obavy v suchem postižených regionech.

To vedlo k vývoji bezvodých a uzavřených chladicích systémů. IEEE Spectrum dokumentoval strategie, jako jsou uzavřené dielektrické lázně, suché chladiče a bezvodé chladiče, které snižují spotřebu pitné vody téměř na nulu. Mezitím některé operátoři experimentují s opětovným využíváním odpadního tepla. Projekty, jako je Aquasar a iDataCool, ukázaly, jak horkovodní chladicí smyčky mohou krmit systémy vytápění budov nebo absorpční chladiče, recykluje se tak většina energie, která by jinak byla ztracena.

Kompenzace je často mezi vodou a elektřinou: uzavřené nebo suché systémy spotřebují více energie, zatímco odpařovací návrhy šetří energii, ale silně využívají vodu. V regionech se suchem se politika stále více zaměřuje na ochranu vody, i když to znamená vyšší spotřebu energie.

Infrastruktura a síť

I s řešením problému energie a chlazení je konečnou úzkým místem infrastruktura. Rozhodnutí o umístění nyní určují vítěze a poražené v AI závodě.

Microsoftova poptávka je stejně ohromující. Jeho AI pracovní zátěže se očekává, že vyžadují tolik elektřiny jako celý region Nové Anglie do roku 2030. To vysvětluje, proč společnost investovala desítky miliard do obnovitelných projektů a také prosazuje více experimentální možnosti, jako je jaderná fúze a pokročilé jaderné reaktory.

Aby podpořila svůj rostoucí nárok, Microsoft podepsal smlouvu s Brookfield na přidání 10,5 gigawattů obnovitelné kapacity do roku 2030. Mezitím také podpořil více experimentální projekty, jako je jaderná fúzní elektrárna postavená společností Helion Energy, která má být uvedena do provozu v roce 2028, a 20letou smlouvu na opětovné spuštění jaderné elektrárny Three Mile Island v Pensylvánii.

Amazon a Google činí podobné kroky, zajišťují místa vedle jaderných elektráren a vyvíjejí své vlastní čisté energetické portfolia. V Irsku, kde datová centra již spotřebují více energie než všechny domácnosti dohromady, regulátoři zmrazili nové schválení až do roku 2028, což zdůrazňuje, jak politika a schvalování mohou zhatit i ty nejlépe financované projekty.

Chytrá operace: AI řídí AI

Zajímavě, AI samo je používáno pro řízení infrastrukturní zátěže. Učení s posilováním bylo nasazeno v produkčních datových centrech pro optimalizaci chladicích systémů, produkcí 14 až 21 procent úspor energie bez ohrožení bezpečnosti. Digitální dvojčata a prediktivní modelování jsou také používána pro předvídání teplých míst, předchlazení zařízení a přesunutí pracovních zátěží do chladnějších hodin nebo období přebytku obnovitelné energie.

Google již demonstroval, jak strojové učení může snížit potřeby chlazení datových center o 40 procent, a další operátoři přijímají podobné systémy. Jak se zvyšují náklady na energii a chlazení, tyto provozní úspory se stávají nezbytnou konkurenční výhodou.

Strategický výhled

Trajektorie je jasná. Poptávka AI se očekává, že zdvojnásobí celosvětovou spotřebu elektřiny datových center do roku 2030, přičemž pracovní zátěže AI samotné budou představovat podíl nižší než deset procent celosvětové spotřeby energie do roku 2050. Zatímco NVIDIA a další výrobci čipů pokračují v posouvání hranic výkonu křemíku, praktická hranice AI bude definována tím, jak rychle utility mohou postavit novou generaci, přenos a chladicí infrastrukturu.

Pro společnosti, které staví produkty AI, to znamená, že roadmapy jsou stále více vázané na to, kde existuje kapacita. Pro investory mohou být nejvýnosnější hry utility, vývojáři přenosů a startupy chlazení spíše než pouze dodavatelé GPU. A pro politiky se debata o AI přesouvá z otázek etiky a správy dat na otázky megawattů, vody a modernizace sítě.

Budoucnost AI nebude rozhodnuta pouze ve výzkumných laboratořích a továrnách na čipy, ale na transformačních stanicích, chladicích smyčkách a elektrárnách. Fyzika měřítka — ne pouze matematika algoritmů — je to, co bude určovat rychlost a rozsah umělé inteligence v příštím desetiletí.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.