Partnerskap
OpenAI bruker Cerebras til å tjene 10 milliarder dollar på databehandling med lav latens

OpenAI annonserte en flerårig avtale med chip-oppstartsselskapet Cerebras Systems som skal levere 750 megawatt dedikert AI-databehandling til ChatGPT-produsenten, i det begge selskapene beskriver som den største høyhastighetsinferensutplasseringen noen gang forsøkt.
Avtalen, som er verdsatt til over 10 milliarder dollar ifølge kilder med kjennskap til vilkårene, markerer OpenAIs viktigste infrastruktursatsing utenfor det primære samarbeidet med Microsoft. Cerebras vil bygge og drifte systemene i faser frem til 2028, med den første kapasiteten som kommer på nett i år.
Partnerskapet retter seg mot et spesifikt problem: hastighet. Selv om OpenAI har skalert ChatGPT til 800 millioner ukentlige brukere, står selskapet overfor beregningsbegrensninger som reduserer responstidene – spesielt for krevende arbeidsbelastninger som kodegenerering, agentoppgaver og stemmeinteraksjon i sanntid.
«Cerebras legger til en dedikert lav-latens inferensløsning til plattformen vår», sa Sachin Katti, som leder OpenAIs databehandlingsstrategi. «Det betyr raskere responser, mer naturlige interaksjoner og et sterkere grunnlag for å skalere sanntids-AI til mange flere mennesker.»
Hvorfor silisium i waferskala er viktig
Cerebras' presentasjon fokuserer på deres wafer-skala prosessorer – brikker på størrelse med middagstallerkener som eliminerer kommunikasjonsforsinkelsene som er iboende i systemer som er sydd sammen av mange mindre GPU-er. Selskapet hevder at arkitekturen deres leverer inferenshastigheter opptil 15 ganger raskere enn GPU-baserte alternativer, med modeller som GPT-OSS-120B som kjører på omtrent 3,000 tokens per sekund.
For OpenAI oversettes denne hastigheten direkte til brukeropplevelsen. Når AI reagerer i sanntid – uten latensen som gjør at samtaler føles kunstige – engasjerer brukerne seg dypere og oppnår mer. Selskapet testet Cerebras’ silisium med sine åpne vektmodeller før Thanksgiving, og tekniske samtaler mellom teamene eskalerte raskt til en signert term sheet, ifølge Cerebras’ administrerende direktør Andrew Feldman.
«Akkurat som bredbånd forvandlet internett, vil sanntidsinferens forvandle AI», sa Feldman. «Dette muliggjør helt nye måter å bygge og samhandle med AI-modeller på.»
Sammenligningen er ikke en overdrivelse. Tidlig oppringt internett støttet e-post og grunnleggende surfing; bredbåndsaktivert strømming av video, taleanrop og etter hvert smarttelefonappøkonomien. OpenAI ser ut til å satse på at tilstrekkelig rask inferens på samme måte vil låse opp applikasjoner som nåværende latens gjør upraktiske – spesielt for AI-agenter som må kjede flere operasjoner sammen uten at menneskelig tålmodighet tar slutt.
Infrastrukturkappløpet intensiveres
Cerebras-avtalen kommer samtidig som Verdsettelser av AI-infrastruktur har eksplodert, med Databricks som nylig hentet inn 134 milliarder dollar, og Cerebras selv som angivelig er i samtaler om ny finansiering til en verdsettelse på 22 milliarder dollar. Beregningsbehovet til frontlinjemodeller for AI viser ingen tegn til å flate ut, og selskaper kjemper for å låse opp kapasiteten før konkurrentene gjør det.
For Cerebras løser OpenAI-partnerskapet et problem med forretningskonsentrasjon. De forente arabiske emiraters G42 sto for 87 % av Cerebras' inntekter i første halvdel av 2024 – en kundekonsentrasjon som gjorde investorene nervøse. Å legge til OpenAI som en stor kunde i forkant av en potensiell børsnotering reduserer risikoen for virksomheten betydelig.
For OpenAI diversifiserer avtalen sin AI-infrastruktur utover Microsofts Azure-sky. Selv om Microsoft fortsatt er OpenAIs primære databehandlingsleverandør, gir Cerebras-partnerskapet OpenAI dedikert lavforsinkelseskapasitet som er optimalisert spesielt for inferens – en annen arbeidsmengde enn treningskjøringene Microsofts infrastruktur håndterer.
Timingen har også betydning. OpenAI ble nylig lansert GPT-5.2 midt i økende konkurranse fra Googles Gemini. Etter hvert som modellene blir mer kapable, oppdager selskapene som tar dem i bruk at rå intelligens ikke er nok – brukerne forventer også nesten umiddelbare responser. En briljant AI som bruker ti sekunder på å svare føles ødelagt; den samme AI-en som svarer på under et sekund føles magisk.
Sam Altman, administrerende direktør i OpenAI, er allerede investor i Cerebras, og OpenAI vurderte en gang å kjøpe opp selskapet direkte. Denne avtalen antyder at forholdet utvikler seg til noe mer strategisk: et partnerskap der begge selskapenes skjebner blir sammenflettet i kappløpet om å gjøre AI virkelig samtalevennlig.












