Partnerství

Infineon Technologies a d-Matrix Partner na nízkoodběrovou AI Infrastrukturu

mm

Infineon Technologies oznámily spolupráci s d-Matrix, zaměřenou na zlepšení výkonu a energetické efektivity systémů AI inference používaných v moderních datových centrech. Partnerství se točí kolem platformy d-Matrix’s Corsair AI inference accelerator a Infineon’s OptiMOS dual-phase power modules, které jsou navrženy pro podporu vysokohustotních výpočetních prostředí pro interaktivní AI úlohy.

Oznámení zdůrazňuje rostoucí posun v AI hardwarovém průmyslu. Zatímco většina infrastrukturního boomu v posledních letech se soustředila na školení stále větších AI modelů, průmysl se nyní rychle rozšiřuje do inference — procesu skutečného běhu modelů v reálných aplikacích, jako jsou chatboti, agentic AI systémy, copiloti, vyhledávání, finanční analýzy a podporu rozhodování ve zdravotnictví. Tyto úlohy kladou odlišné nároky na hardware, zejména kolem latence, odezvy a spotřeby energie.

Proč se AI inference stává významnou hardwarovou bitvou

AI Inference se stal jednou z nejrychleji rostoucích segmentů AI infrastrukturního trhu, protože interaktivní AI systémy vyžadují odpovědi v milisekundách spíše než v sekundách. d-Matrix se zaměřila na Corsair speciálně pro tyto úlohy, zdůrazňující ultra-nízkou latenci a energeticky efektivní inference pro velké jazykové modely a AI agenty.

Podle d-Matrix byl Corsair navržen kolem digitální in-memory compute architektury, která má snížit paměťové úzká místa, která často zpomalují generativní AI inference. Společnost tvrdí, že platforma může významně snížit latenci a zlepšit propustnost ve srovnání s tradičními GPU-centrickými inferenčními systémy, zejména pro interaktivní aplikace.

Partnerství s Infineon řeší další stále kritičtější výzvu: dodávku energie.

Jakmile AI servery pokračují ve zvyšování hustoty, efektivní dodávka energie do akcelerátorů se stala omezujícím faktorem pro škálování infrastruktury. Infineon’s OptiMOS TDM2254xx moduly jsou navrženy pro vertikální architektury dodávky energie, které pomáhají snižovat elektrické ztráty a zlepšovat hustotu energie uvnitř kompaktních serverových systémů.

Posun směrem k reálným AI systémům

Společnosti rámovaly spolupráci kolem vzestupu „interaktivního AI“, kde inferenční systémy musí nepřetržitě generovat výstupy s extrémně nízkou latencí. To zahrnuje konverzační AI, AI agenty, systémy reálného uvažování a aplikace vyžadující rychlou generaci tokenů z velkých jazykových modelů.

Zakladatel a CEO d-Matrix Sid Sheth řekl, že architektura za Corsair byla postavena speciálně pro sub-2 milisekundovou latenci tokenů, metriku, která se stala stále důležitější, protože podniky přesouvají AI systémy z experimentů do zákaznicky orientovaných prostředí.

Širší AI průmysl také začíná rozpoznávat, že infrastruktura inference se může vyvíjet odlišně od infrastruktury školení. Zatímco GPU klastry dominovaly první fázi expanze generativního AI, inference stále více odměňuje architektury optimalizované kolem paměťové šířky, latence, sítí a energetické efektivity spíše než surového výpočtu.

Energetická efektivita se stává centrální pro škálování AI

Jednou z největších omezení, kterým čelí hyperscalers a AI cloudoví poskytovatelé, je poptávka po elektřině. AI inferenční úlohy mohou běžet nepřetržitě napříč miliony požadavků denně, což činí provozní efektivitu kritickou pro nasazení nákladů.

Infineon agresivně rozšiřuje svou pozici v AI infrastruktuře prostřednictvím polovodičových technologií založených na křemíku, karbidu křemíku (SiC) a nitridu gallia (GaN). Společnost se stále více zaměřuje na dodávku vrstvy dodávky energie pod AI akcelerátory a serverovou infrastrukturu.

Spolupráce s d-Matrix odráží, jak polovodičové firmy se stávají stále více integrovanými s AI akceleračními startupy, protože průmysl hledá alternativy k tradičním GPU-heavy architekturám.

AI infrastruktura se rozšiřuje za hranice tradičních GPU

Partnerství také přichází během širší vlny experimentů v AI hardwaru. Rostoucí počet startupů vyvíjí specializované akcelerátory zaměřené specificky na inference, paměťově centrické výpočty nebo AI sítě.

d-Matrix se odlišila svým zaměřením na compute-in-memory technologie a nízkoodběrové inferenční systémy přizpůsobené pro generativní AI. Společnost také rozšířila svou infrastrukturní strategii za hranice samotných akceleračních čipů, nedávno zdůrazňujíc sítě, komponovatelnou infrastrukturu a optimalizaci celého systému pro inferenční klastry.

Jakmile se AI aplikace stávají stále více agentic a interaktivní, poskytovatelé infrastruktury se očekává, že budou klást větší důraz na snižování latence, snižování spotřeby energie a zlepšování systémové efektivity napříč celými datovými centry, spíše než se soustředit pouze na surovou výpočetní sílu.

Antoine je vizionářský líder a spoluzakladatel Unite.AI, který je poháněn neotřesitelnou vášní pro formování a propagaci budoucnosti umělé inteligence a robotiky. Jako sériový podnikatel věří, že umělá inteligence bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, že vypráví o potenciálu disruptivních technologií a AGI.

As a futurist, je zasvěcen zkoumání toho, jak tyto inovace budou tvarovat náš svět. Kromě toho je také zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinují budoucnost a přetvarují celé sektory.