Connect with us

Thought leaders

Het temmen van het beest: Hoe geïntegreerde spanningsregelaars de stroomcrisis van AI oplossen

mm

Kunstmatige intelligentie is hongerig. Van het trainen van enorme taalmodellen tot het leveren van real-time inferentie in de cloud, de computationele eisen van AI schieten omhoog. Deze onstilbare honger heeft een tweede crisis gecreëerd die de vooruitgang kan stoppen: een onhoudbare honger naar elektrische stroom. Datacentra, de moderne kathedralen van berekening, zijn op weg om een aanzienlijk deel van de wereldwijde elektriciteit te verbruiken, met AI-werklasten als een primaire drijfveer. Volgens de Internationale Energie Agentschap (IEA), verbruikten datacentra ongeveer 2% van de wereldwijde elektriciteit in 2022, en dit cijfer zal naar verwachting dramatisch stijgen.

Deze stroomproblemen gaan niet alleen over enorme elektriciteitsrekeningen en milieueffecten; het is een fundamenteel ingenieursbottleneck. De processors die AI aandrijven – de GPUs, TPUs en aangepaste ASICs – botsen tegen een thermische muur. U kunt niet eenvoudigweg meer transistors op een chip plaatsen als u geen stroom kunt leveren zonder dat de chip oververhit raakt. De uitdaging ligt niet alleen in het opwekken van stroom, maar in het effectief leveren ervan in de laatste paar millimeters voordat het de silicium bereikt. Maar nu is een klein stukje technologie bekend als een Geïntegreerde Spanningsregelaar (IVR) fundamenteel de toekomst van high-performance computing aan het herschappen.

Het “Laatste-Inch”-probleem in stroomlevering

Om de innovatie van de IVR te begrijpen, moet men eerst de traditionele methode van het aandrijven van een high-performance chip begrijpen. Een moderne processor heeft miljarden transistors die miljarden keren per seconde aan- en uitgaan. Deze bewerkingen vereisen een precieze, stabiele en lage-voltagespanning DC-stroomvoorziening. Echter, de stroom die uit de muur komt is hoogspanningswisselstroom. De reis van de muurcontactdoos naar het silicium omvat een complexe keten van omzetting en regulering bekend als het Power Delivery Network (PDN).

Typisch omvat dit proces meerdere stadia. Stroom wordt omgezet en teruggeschakeld op het servermoederbord, en de laatste, kritieke omzetting wordt afgehandeld door een component genaamd een Spanningsregelaar (VR). Deze VR’s zijn meestal omvangrijke discrete componenten – een verzameling van controllers, vermogensstappen en grote, draadgewikkelde spoelen – die op het moederbord rond de processorsocket zitten.

Deze traditionele benadering heeft verschillende kritieke fouten in de leeftijd van AI:

  1. Verloren Energie: Stroom moet reizen van deze off-chip VR’s over het moederbord en door de verpakking van de chip. Elke millimeter van deze route introduceert weerstand, wat leidt tot aanzienlijk vermogensverlies (I2R-verlies). Dit verloren vermogen wordt afgegeven als warmte, die vervolgens moet worden verwijderd door nog meer stroomvretende koelsystemen.
  2. Langzame Responstijd: Wanneer een processor plotseling overschakelt van een idle naar een volledige belastingsstaat (een gebruikelijk scenario in AI-werklasten genaamd een transiënte belasting), vraagt het een enorme, instantane stroomstoot. Off-chip VR’s kunnen te langzaam reageren, waardoor een tijdelijke spanningsdaling, of “droop”, ontstaat. Om dit te compenseren, moeten ingenieurs het hele systeem ontwerpen om op een hogere basisspanning te draaien, waardoor nog meer stroom wordt verspild.
  3. Ruimtebeperkingen: Deze omvangrijke, off-chip componenten consumeren waardevolle ruimte op het moederbord, ruimte die kan worden gebruikt voor meer geheugengroepen, snellere interconnects of andere prestatieverbeterende functies. Deze “strandbezit” rond de processor is een van de meest waardevolle in de elektronica.

On-Chip Stroom en Dunne-Film Magnetisme

Recente vooruitgang in dunne-film magnetische technologie maakt het nu mogelijk om high-performance spoelen rechtstreeks op een chip of zijn pakketsubstraat te produceren met behulp van halfgeleider fabricagetegnieken. Deze microscopisch kleine, hoge-efficiëntie spoelen maken het mogelijk om de hele spanningsregelaar op slechts enkele microns van de circuits te plaatsen die het aandrijft.

Deze verschuiving in locatie levert verschillende voordelen op:

  • Verlaagd Vermogensverlies: Het verkorten van de stroomleveringsroute van inches tot microns verlaagt aanzienlijk het energieverlies tijdens de transmissie, waardoor de algehele systeemefficiëntie verbetert.
  • Korrelige Stroombeheer: Meerdere onafhankelijke, ultra-lage-voltagespanning domeinen kunnen precies leveren wat elke core of functionele blok nodig heeft, wanneer het nodig is, en onmiddellijk uitschakelen wanneer het niet nodig is.
  • Bijna-Instantane Respons: On-package IVR’s reageren op transiënte belastingen in nanoseconden, waardoor de spanningsdaling vrijwel wordt geëlimineerd en lagere, efficiëntere bedrijfsspanningen mogelijk worden zonder prestaties te offeren.
  • Vereenvoudigd Ontwerp en Kleiner Formaat: Het verwijderen van spanningsregelaars van het moederbord maakt ontwerp vereenvoudigen, ondersteunt dichtere, high-performance architectuur.

De Toekomst van AI-Hardware Herschappen

De voordelen van IVR’s komen rechtstreeks overeen met de grootste uitdagingen waarmee AI-hardware ontwerpers worden geconfronteerd. Voor bedrijven die de volgende generatie GPUs en AI-versnellers ontwikkelen, is geïntegreerd stroombeheer geen “leuke-to-have”; het is een noodzakelijke technologie.

Geavanceerde halfgeleider verpakkingsmethoden zoals chiplets en 3D-stapeling worden gezien als de weg vooruit nu traditionele Moore’s Law-schaalvergroting vertraagt. Deze methoden omvatten het assembleren van meerdere kleinere, gespecialiseerde stukjes in één krachtig pakket. Zoals uitgelegd door industrieleiders zoals TSMC met zijn CoWoS-technologie, vereist deze benadering een geavanceerde stroomleveringsstrategie. IVR’s, waaronder die gemaakt door Ferric, zijn perfect geschikt voor deze paradigma, waardoor korrelige, efficiënte stroom nodig is om deze complexe, heterogene systemen te beheren.

Uitdagingen en Conclusie

De weg naar brede adoptie is niet zonder zijn hindernissen. Het integreren van nieuwe materialen en processen in het zeer conservatieve en complexe halfgeleider fabricage-ecosysteem is een monumentale taak.

Echter, de noodzaak voor een oplossing is onmiskenbaar. Het huidige traject van stroomverbruik in AI is onhoudbaar. Het maken van transistors kleiner is niet langer voldoende; een holistische herschikking van het hele systeem, van software tot stroomlevering, is vereist. Het werk van bedrijven zoals Ferric vertegenwoordigt een kritiek deel van die puzzel. Door het stroombeest te temmen bij de bron, creëren ze niet alleen een efficiënter onderdeel, maar banen ze ook de weg voor de volgende generatie AI en high-performance computing.

Wat denkt u dat het volgende grote bottleneck in AI-hardware ontwerp zal zijn nadat stroomlevering is geoptimaliseerd? Hoe zullen vooruitgang in energie-efficiëntie de economie van grootschalige AI-implementatie veranderen?

Noah Sturcken is een oprichter en CEO van Ferric met meer dan 40 octrooien en 15 publicaties over geïntegreerde spanningsregelaars. Noah leidt Ferric met focus op bedrijfsontwikkeling, marketing en nieuwe technologieontwikkeling. Noah werkte eerder bij AMD R&D Lab waar hij geïntegreerde spanningsregelaar (IVR) technologie ontwikkelde. Noah heeft een Ph.D. en M.S. in Elektrotechniek van Columbia University en een B.S. van Cornell University summa cum laude.