Spojte se s námi

partnerství

OpenAI využívá Cerebras k investování 10 miliard dolarů do výpočtů s nízkou latencí

mm

Společnost OpenAI oznámila víceletou dohodu s čipovým startupem Cerebras Systems, která dodá výrobci ChatGPT 750 megawattů dedikovaných výpočetních kapacit umělé inteligence. Obě společnosti to popisují jako... největší nasazení vysokorychlostní inference se kdy pokusil/a.

Tato dohoda, jejíž hodnota přesahuje 10 miliard dolarů, podle zdrojů obeznámených s podmínkami představuje nejvýznamnější infrastrukturní investici společnosti OpenAI mimo její primární vztah se společností Microsoft. Cerebras bude systémy budovat a hostovat ve fázích do roku 2028, přičemž první kapacita bude spuštěna letos.

Partnerství se zaměřuje na konkrétní problém: rychlost. OpenAI sice rozšířila ChatGPT na… 800 milionů uživatelů týdněSpolečnost čelí výpočetním omezením, která zpomalují dobu odezvy – zejména u náročných úloh, jako je generování kódu, agentní úlohy a hlasová interakce v reálném čase.

„Cerebras přidává do naší platformy specializované řešení pro inferenci s nízkou latencí,“ řekl Sachin Katti, který vede výpočetní strategii OpenAI. „To znamená rychlejší reakce, přirozenější interakce a silnější základ pro škálování umělé inteligence v reálném čase pro mnohem více lidí.“

Proč je křemík v měřítku destiček důležitý

Prezentace společnosti Cerebras se zaměřuje na procesory o velikosti waferů – čipy o velikosti talířů, které eliminují komunikační zpoždění, jež jsou vlastní systémům sestaveným z mnoha menších grafických procesorů (GPU). Společnost tvrdí, že její architektura poskytuje až 15krát vyšší rychlosti inference než alternativy založené na GPU, přičemž modely jako GPT-OSS-120B běží rychlostí zhruba 3 000 tokenů za sekundu.

Pro OpenAI se tato rychlost přímo promítá do uživatelské zkušenosti. Když umělá inteligence reaguje v reálném čase – bez latence, která konverzaci činí umělou – uživatelé se hlouběji zapojují a dosahují větších výsledků. Společnost testovala křemík Cerebras se svými modely s otevřenou hmotností před Dnem díkůvzdání a technické rozhovory mezi týmy se rychle vyhrotily do podepsané dohody o podmínkách, uvedl generální ředitel Cerebrasu Andrew Feldman.

„Stejně jako širokopásmové připojení transformovalo internet, inference v reálném čase transformuje umělou inteligenci,“ řekl Feldman. „To umožňuje zcela nové způsoby, jak vytvářet modely umělé inteligence a interagovat s nimi.“

Toto srovnání není přehnané. Rané dial-up připojení k internetu podporovalo e-mail a základní prohlížení; širokopásmové připojení umožňovalo streamování videa, hlasové hovory a nakonec i ekonomiku aplikací pro chytré telefony. Zdá se, že OpenAI sází na to, že dostatečně rychlá inference podobně odemkne aplikace, které současná latence znemožňuje – zejména pro agenty umělé inteligence, kteří musí řetězit více operací, aniž by se lidská trpělivost vyčerpala.

Závod ve zbrojení v oblasti infrastruktury se zostřuje

Dohoda s Cerebrasem přichází v době, kdy Oceňování infrastruktury umělé inteligence explodovaly, přičemž Databricks nedávno získala 134 miliard dolarů a samotná Cerebras údajně jedná o novém financování s oceněním 22 miliard dolarů. Výpočetní nároky hraničních modelů umělé inteligence nevykazují žádné známky stagnace a společnosti se snaží zajistit si kapacitu dříve, než to udělají konkurenti.

Pro Cerebras řeší partnerství s OpenAI problém koncentrace podnikání. Skupina G42 ze Spojených arabských emirátů se v první polovině roku 2024 podílela na tržbách Cerebras 87 % – tato koncentrace zákazníků znervózňovala investory. Přidání OpenAI jako hlavního zákazníka před potenciální IPO významně snižuje rizika pro podnikání.

Pro OpenAI dohoda diverzifikuje její Infrastruktura AI nad rámec cloudu Azure od Microsoftu. Ačkoli Microsoft zůstává primárním poskytovatelem výpočetních služeb pro OpenAI, partnerství se společností Cerebras poskytuje OpenAI vyhrazenou kapacitu s nízkou latencí optimalizovanou speciálně pro inferenci – což je jiná pracovní zátěž, než jaké zvládá trénovací běhy infrastruktura Microsoftu.

Načasování také záleží. OpenAI nedávno vydala GPT-5.2 uprostřed sílící konkurence ze strany platformy Gemini od Googlu. S rostoucími schopnostmi modelů společnosti, které je nasazují, zjišťují, že pouhá hrubá inteligence nestačí – uživatelé také očekávají téměř okamžité reakce. Brilantní umělá inteligence, které odpoví deset sekund, se zdá být rozbitá; stejná umělá inteligence, která reaguje za méně než sekundu, působí magicky.

Sam Altman, generální ředitel společnosti OpenAI, je již investorem v Cerebras a OpenAI kdysi zvažovala její úplnou akvizici. Tato dohoda naznačuje, že se vztah vyvíjí v něco strategičtějšího: partnerství, kde se osudy obou společností propletou v závodě o to, aby se umělá inteligence stala skutečně konverzační.

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s řadou AI startupů a publikací po celém světě.