Partnerskaber
OpenAI Taps Cerebras for $10 Billion i Lav-Latens Compute

OpenAI annoncerede en flerårig aftale med chip-startup Cerebras Systems, der vil levere 750 megawatt dedikeret AI-compute til ChatGPT-producenten, i hvad begge selskaber beskriver som den største high-speed inference-udrulning nogensinde forsøgt.
Aftalen, der er vurderet til over 10 milliarder dollar ifølge kilder, der er fortrolige med vilkårene, markerer OpenAI’s mest betydningsfulde infrastruktursatsning uden for dens primære forhold til Microsoft. Cerebras vil bygge og hoste systemerne i faser frem til 2028, med den første kapacitet, der kommer online i år.
Partnerskabet retter sig mod et specifikt problem: hastighed. Mens OpenAI har skaleret ChatGPT til 800 millioner ugentlige brugere, står selskabet over for compute-begrænsninger, der langsomerer respons-tider – især for krævende arbejdslaster som kode-generering, agente-opgaver og realtids-lydinteraktion.
“Cerebras tilføjer en dedikeret lav-latens-inference-løsning til vores platform,” sagde Sachin Katti, der leder OpenAI’s compute-strategi. “Det betyder hurtigere responser, mere naturlige interaktioner og en stærkere grund til at skala realtids-AI til mange flere mennesker.”
Hvorfor Wafer-Skala-Silicium er vigtigt
Cerebras’s pitch handler om deres wafer-skala-processorer – chips i størrelse med middagsplader, der eliminerer kommunikationsforsinkelsen, der er indbygget i systemer, der er syet sammen af mange mindre GPU’er. Selskabet hævder, at deres arkitektur leverer inference-hastigheder op til 15 gange hurtigere end GPU-baserede alternativer, med modeller som GPT-OSS-120B, der kører med ca. 3.000 tokens per sekund.
For OpenAI oversætter denne hastighed sig direkte til brugeroplevelsen. Når AI responderer i realtid – uden den forsinkelse, der gør, at samtaler føles kunstige – engagerer brugerne sig mere dybt og opnår mere. Selskabet testede Cerebras’s silicium med deres åbne-vægt-modeller før Thanksgiving, og tekniske samtaler mellem holdene eskalerede hurtigt til en underskrevet term-sheet, ifølge Cerebras CEO Andrew Feldman.
“Lige som bredbånd forandrede internettet, vil realtids-inference forandre AI,” sagde Feldman. “Dette muliggør helt nye måder at bygge og interagere med AI-modeller.”
Sammenligningen er ikke overdreven. Tidlig dial-up-internet understøttede e-mail og grundlæggende browsing; bredbånd muliggjorde streaming-video, lydopkald og til sidst smartphone-app-økonomien. OpenAI synes at satse på, at tilstrækkeligt hurtig inference på samme måde vil låse op for anvendelser, som den nuværende forsinkelse gør urealistiske – især for AI-agenter, der skal kæde multiple operationer sammen uden, at menneskelig tålmodighed bliver tynd.
Infrastruktur-Kapløbet Intensiveres
Cerebras-aftalen kommer, da AI-infrastruktur-vurderinger er eksploderet, med Databricks, der nylig har hævet kapital til 134 milliarder dollar, og Cerebras selv rapporteres at være i forhandlinger om frisk finansiering til en vurdering på 22 milliarder dollar. Compute-kravene til front-AI-modeller viser ingen tegn på at være på vej mod en plateau, og selskaberne kapløber om at låse kapaciteten, før konkurrenterne gør det.
For Cerebras løser OpenAI-partnerskabet et forretningskoncentrationsproblem. De Forenede Arabiske Emiraters G42 stod for 87% af Cerebras’s omsætning i første halvår af 2024 – en kunde-koncentration, der gjorde investorer nervøse. Ved at tilføje OpenAI som en stor kunde før en potentiel IPO reducerer dette betydligt forretningsrisikoen.
For OpenAI diversificerer aftalen deres AI-infrastruktur ud over Microsofts Azure-cloud. Mens Microsoft fortsat er OpenAI’s primære compute-leverandør, giver Cerebras-partnerskabet OpenAI dedikeret lav-latens-kapacitet, der er optimeret specifikt til inference – en anden arbejdslast end den, Microsofts infrastruktur håndterer.
Tidsplanen er også vigtig. OpenAI har nylig udgivet GPT-5.2 midt i intensificeret konkurrence fra Google’s Gemini. Da modellerne bliver mere kapable, opdager de selskaber, der implementerer dem, at ren intelligens ikke er nok – brugerne forventer også næsten øjeblikkelige responser. En briliant AI, der tager ti sekunder til at svare, føles defekt; samme AI, der responderer på under en sekund, føles magisk.
Sam Altman, OpenAI’s CEO, er allerede investor i Cerebras, og OpenAI overvejede engang at købe selskabet helt. Denne aftale antyder, at forholdet udvikler sig til noget mere strategisk: et partnerskab, hvor begge selskabers skæbner bliver forbundet i kapløbet om at gøre AI føles sandt konversationelt.












