Umělá inteligence

Využití křemíku: Jak vlastní čipy formují budoucnost AI

mm

Umělá inteligence, stejně jako jakýkoli software, závisí na dvou základních komponentách: programech AI, často označovaných jako modely, a výpočetním hardwaru, nebo čipech, které tyto programy pohánějí. Dosud se ve vývoji AI zaměřila pozornost na zdokonalování modelů, zatímco hardware byl obvykle považován za standardní komponentu dodávanou třetími stranami. Nedávno se však tato přístup začala měnit. Velké společnosti AI, jako je Google, Meta a Amazon, začaly vyvíjet své vlastní čipy AI. Vnitřní vývoj vlastních čipů AI oznamuje novou éru v pokroku AI. Tento článek bude zkoumat důvody této změny přístupu a bude zdůrazňovat nejnovější vývoj v této se vyvíjející oblasti.

Proč vývoj vlastních čipů AI?

Směr k vnitřnímu vývoji vlastních čipů AI je poháněn několika kritickými faktory, které zahrnují:

Zvyšující se poptávka po čipech AI

Vytvoření a použití modelů AI vyžaduje značné výpočetní zdroje, aby účinně zvládly velké objemy dat a generovaly přesné předpovědi nebo přehledy. Tradiční počítačové čipy nejsou schopny zvládnout výpočetní požadavky při školení na trillions datových bodů. Tento limit vedl k vytvoření pokročilých čipů AI, které jsou speciálně navrženy pro splnění vysokých požadavků na výkon a efektivitu moderních aplikací AI. Jak výzkum a vývoj AI pokračují, tak roste i poptávka po těchto specializovaných čipech.

Nvidia, lídr ve výrobě pokročilých čipů AI a výrazně před svým konkurenty, čelí výzvám, protože poptávka výrazně překračuje jeho výrobní kapacitu. Tato situace vedla k seznamu čekajících na čipy AI Nvidia, který se prodlužuje na několik měsíců, zpoždění, které dále roste, protože poptávka po jejich čipech AI prudce stoupá. Kromě toho trh s čipy, který zahrnuje velké hráče jako Nvidia a Intel, čelí výzvám ve výrobě čipů. Tento problém pramení z jejich závislosti na taiwanském výrobci TSMC pro sestavení čipů. Tato závislost na jediném výrobci vede k prodlouženým dodacím lhůtám pro výrobu těchto pokročilých čipů.

Vyrobě energie úsporné a udržitelné výpočetní techniky AI

Současná generace čipů AI, které jsou navrženy pro náročné výpočetní úkoly, tendují k spotřebě大量 energie a generují významné množství tepla. To vedlo k podstatným environmentálním dopadům pro školení a použití modelů AI. Výzkumníci z OpenAI poznamenávají, že: od roku 2012 se výpočetní výkon potřebný pro školení pokročilých modelů AI zdvojnásobil každých 3,4 měsíců, což naznačuje, že do roku 2040 by emise z odvětví informačních a komunikačních technologií (ICT) mohly tvořit 14 % globálních emisí. Další studie ukázala, že školení jediného velkého jazykového modelu může emitovat až 284 000 kg CO2, což je přibližně ekvivalent spotřeby energie pěti aut během jejich životnosti. Kromě toho se odhaduje, že spotřeba energie datových center poroste o 28 procent do roku 2030. Tyto zjištění zdůrazňují nutnost najít rovnováhu mezi vývojem AI a environmentální odpovědností. V reakci na to mnoho společností AI nyní investuje do vývoje energeticky úspornějších čipů, jejichž cílem je učinit školení a operace AI více udržitelnými a environmentálně přátelskými.

Šití čipů na míru pro specializované úkoly

Různé procesy AI mají různé výpočetní požadavky. Například školení hlubokých učících se modelů vyžaduje významný výpočetní výkon a vysoký průtok, aby zvládly velké datové sady a provedly komplexní výpočty rychle. Čipy navržené pro školení jsou optimalizovány pro zlepšení těchto operací, zlepšují rychlost a efektivitu. Na druhé straně proces inference, kde model aplikuje své získané znalosti, aby udělal předpovědi, vyžaduje rychlou zpracování s minimální spotřebou energie, zejména v okrajových zařízeních, jako jsou smartphony a zařízení IoT. Čipy pro inference jsou navrženy tak, aby optimalizovaly výkon na watt, zajišťovaly rychlou odezvu a šetřily baterii. Tento specifický přizpůsobení čipových designů pro školení a inference úkoly umožňuje každému čipu být přesně upraven pro jeho zamýšlenou roli, zlepšuje výkon napříč různými zařízeními a aplikacemi. Tento druh specializace nejen podporuje robustnější funkce AI, ale také propaguje větší energetickou efektivitu a nákladovou efektivitu obecně.

Snižování finančních břemen

Finanční břemeno výpočtů pro školení a operace modelů AI zůstává podstatné. OpenAI, například, používá rozsáhlý superpočítač vytvořený Microsoftem pro školení a inference od roku 2020. Stálo OpenAI asi 12 milionů dolarů, aby mohlo školení svého modelu GPT-3, a náklady prudce stouply na 100 milionů dolarů pro školení GPT-4. Podle zprávy od SemiAnalysis, OpenAI potřebuje přibližně 3 617 serverů HGX A100, celkem 28 936 GPU, aby podpořilo ChatGPT, což přináší průměrnou cenu za dotaz na přibližně 0,36 dolaru. S těmito vysokými náklady na vědomí, Sam Altman, generální ředitel OpenAI, údajně hledá významné investice, aby postavil celosvětovou síť výrobních závodů na čipy AI, podle zprávy Bloomberg.

Ovládání a inovace

Třetích stranách čipy AI často přicházejí s omezeními. Společnosti, které se spoléhají na tyto čipy, mohou najít sami sebe omezené řešeními, která nejsou plně v souladu s jejich jedinečnými modely AI nebo aplikacemi. Vnitřní vývoj čipů umožňuje přizpůsobení podle specifických případů použití. Bez ohledu na to, zda je to pro autonomní vozidla nebo mobilní zařízení, kontrola hardwaru umožňuje společnostem plně využít své algoritmy AI. Přizpůsobené čipy mohou zlepšit specifické úkoly, snížit latenci a zlepšit celkový výkon.

Nejnovější pokroky ve vývoji čipů AI

Tato sekce se zabývá nejnovějšími kroky, které učinily Google, Meta a Amazon ve vývoji technologie čipů AI.

Procesory Axion od Google

Google postupně pokročil ve vývoji technologie čipů AI od uvedení Tensor Processing Unit (TPU) v roce 2015. Na základě této základny Google nedávno uvedl procesory Axion, své první vlastní CPU speciálně navržené pro datové centra a zatížení AI. Tyto procesory jsou založeny na architektuře Arm, známé svou efektivitou a kompaktním designem. Procesory Axion mají za cíl zlepšit efektivitu CPU-založeného školení a inference AI, zatímco zachovávají energetickou efektivitu. Tento pokrok také představuje významné zlepšení výkonu pro různé obecné úkoly, včetně webových a aplikací serverů, kontejnerizovaných mikroslužeb, open-source databází, mezipaměti, analytických strojů, médií a dalších.

MTIA od Meta

Meta tlačí kupředu ve vývoji technologie čipů AI se svým Meta Training and Inference Accelerator (MTIA). Tento nástroj je navržen tak, aby zvýšil efektivitu školení a inference procesů, zejména pro algoritmy排名 a doporučení. Nedávno Meta nastínil, jak MTIA je klíčovou součástí své strategie pro posílení infrastruktury AI za hranice GPU. Původně naplánované na spuštění v roce 2025, Meta již uvedl obě verze MTIA do výroby, ukazující rychlejší tempo ve svých plánech vývoje čipů. Zatímco MTIA se目前 zaměřuje na školení určitých typů algoritmů, Meta má v plánu rozšířit jeho použití, aby zahrnovalo školení pro generativní AI, jako je jeho Llama language models.

Trainium a Inferentia od Amazonu

Od uvedení svého vlastního čipu Nitro v roce 2013, Amazon výrazně rozšířil vývoj čipů AI. Společnost nedávno představila dvě inovativní čipy AI, Trainium a Inferentia. Trainium je speciálně navržen pro zlepšení školení modelů AI a má být začleněn do EC2 UltraClusters. Tyto klastry, které mohou hostit až 100 000 čipů, jsou optimalizovány pro školení základních modelů a velkých jazykových modelů energeticky úsporným způsobem. Inferentia, na druhé straně, je přizpůsoben pro úkoly inference, kde se modely AI aktivně aplikují, zaměřuje se na snížení latence a nákladů během inference, aby lépe sloužily potřebám milionů uživatelů, kteří interagují se službami AI.

Závěrečné shrnutí

Směr k vnitřnímu vývoji vlastních čipů AI velkými společnostmi, jako jsou Google, Microsoft a Amazon, odráží strategickou změnu, aby se řešily rostoucí výpočetní potřeby technologií AI. Tento trend zdůrazňuje nutnost řešení, která jsou speciálně přizpůsobena pro efektivní podporu modelů AI, splňující jedinečné požadavky těchto pokročilých systémů. Jak poptávka po čipech AI dále roste, lídři trhu, jako je Nvidia, pravděpodobně uvidí významný růst hodnoty na trhu, podtrhující vitální roli, kterou hrají přizpůsobené čipy v pokroku inovací AI. Tvořením svých vlastních čipů tyto technologické giganty nejen zlepšují výkon a efektivitu svých systémů AI, ale také propagují udržitelnější a nákladově efektivnější budoucnost. Tato evoluce stanovuje nové standardy v odvětví, pohání technologický pokrok a konkurenční výhodu v rychle se měnícím globálním trhu.

Dr. Tehseen Zia je docent s trvalým úvazkem na COMSATS University Islamabad, držitel titulu PhD v oblasti AI z Vienna University of Technology, Rakousko. Specializuje se na umělou inteligenci, strojové učení, datové vědy a počítačové vidění, a významně přispěl publikacemi v renomovaných vědeckých časopisech. Dr. Tehseen také vedl různé průmyslové projekty jako hlavní výzkumník a působil jako konzultant pro umělou inteligenci.