Connect with us

Partnerskap

OpenAI Taps Cerebras for $10 Billion i Lav-Latens Regning

mm

OpenAI annonserte en flerårig avtale med chip-startup Cerebras Systems som vil levere 750 megawatt dedikert AI-regning til ChatGPT-utvikleren, i det begge selskapene beskriver som den største høyhastighets-inferens-utbredelsen noensinne forsøkt.

Avtalen, som ifølge kilder kjent med vilkårene er verdt over $10 milliarder, markerer OpenAI’s største infrastruktur-veddemål utenfor dens primære forhold til Microsoft. Cerebras vil bygge og hoste systemene i faser gjennom 2028, med den første kapasiteten kommer på nett i år.

Samarbeidet tar sikte på et spesifikt problem: hastighet. Mens OpenAI har skalert ChatGPT til 800 millioner ukentlige brukere, står selskapet overfor regningsbegrensninger som sakte ned svarstidene – spesielt for krevende arbeidsbelastninger som kodegenerering, agente oppgaver og sanntids-stemmeinteraksjon.

“Cerebras legger til en dedikert lav-latens-inferensløsning til vår plattform,” sa Sachin Katti, som leder OpenAI’s regningsstrategi. “Det betyr raskere svar, mer naturlige interaksjoner og en sterkere grunn til å skalerer sanntids-AI til mange flere mennesker.”

Hvorfor Wafer-Skala-Silikon Måtte

Cerebras’ pitch handler om dens wafer-skala-prosessorer – chipper størrelse med middagsplater som eliminerer kommunikasjonsforsinkelser innebygget i systemer sydd sammen fra mange mindre GPU-er. Selskapet hevder at dens arkitektur leverer inferenshastigheter opptil 15 ganger raskere enn GPU-baserte alternativer, med modeller som GPT-OSS-120B som kjører på omtrent 3 000 token per sekund.

For OpenAI oversetter hastigheten direkte til brukeropplevelsen. Når AI svarer i sanntid – uten latensen som gjør samtaler føles kunstige – engasjerer brukerne mer dypt og fullfører mer. Selskapet testet Cerebras’ silikon med sine åpne vektmål før Thanksgiving, og tekniske samtaler mellom teamene eskalerte raskt til en signert term sheet, ifølge Cerebras’ CEO Andrew Feldman.

“Akkurat som bredbånd transformerte internettet, vil sanntids-inferens transformere AI,” sa Feldman. “Dette muliggjør helt nye måter å bygge og interagere med AI-modeller.”

Sammenligningen er ikke overdrivelse. Tidlig dial-up-internett støttet e-post og grunnleggende browsing; bredbånd muliggjorde strømming av video, stemmeopptak og til slutt smarttelefon-app-økonomien. OpenAI ser ut til å satse på at tilstrekkelig rask inferens vil låse opp applikasjoner som latens gjør upraktiske – spesielt for AI-agenter som må kjede sammen flere operasjoner uten at menneskelig tålmodighet blir tynn.

Infrastruktur-våpenkappløpet Intensiveres

Cerebras-avtalen kommer som AI-infrastruktur-verdier har eksplodert, med Databricks nylig økt til $134 milliarder og Cerebras selv rapportert i samtaler om fersk finansiering til en verdi på $22 milliarder. Regningskravene til grense-AI-modeller viser ingen tegn til å plate ut, og selskaper kjemper for å låse inn kapasitet før konkurrentene gjør det.

For Cerebras løser OpenAI-samarbeidet et forretningskonsentrasjonsproblem. De forente arabiske emiraters G42 sto for 87% av Cerebras’ inntekter i første halvår 2024 – en kunde-konsentrasjon som gjorde investorer nervøse. Tilføyelsen av OpenAI som en stor kunde før en mulig IPO reduserer betydelig forretningsrisikoen.

For OpenAI markerer avtalen en diversifisering av AI-infrastruktur utover Microsofts Azure-cloud. Mens Microsoft fortsatt er OpenAI’s primære regningsleverandør, gir Cerebras-samarbeidet OpenAI dedikert lav-latens-kapasitet optimalisert spesielt for inferens – en annen arbeidsbelastning enn treningsløpene Microsofts infrastruktur håndterer.

Tidspunktet er også viktig. OpenAI nylig lanserte GPT-5.2 midt i intensiv konkurranse fra Googles Gemini. Mens modellene blir mer kapable, oppdager selskapene som distribuerer dem at ren intelligens ikke er nok – brukerne forventer også nesten øyeblikkelige svar. En briljant AI som tar ti sekunder å svare, føles ødelagt; samme AI som svarer på under ett sekund, føles magisk.

Sam Altman, OpenAI’s CEO, er allerede en investor i Cerebras, og OpenAI vurderte en gang å kjøpe selskapet rett og slett. Denne avtalen antyder at forholdet utvikler seg til noe mer strategisk: et samarbeid hvor begge selskapers skjebner blir sammenflettet i kappløpet om å gjøre AI føles virkelig konversasjonell.

Alex McFarland er en AI-journalist og forfatter som utforsker de nyeste utviklingene innen kunstig intelligens. Han har samarbeidet med tallrike AI-startups og publikasjoner verden over.