Verbind je met ons

Partnerships

OpenAI sluit contract met Cerebras voor 10 miljard dollar aan investeringen in low-latency computing.

mm

OpenAI heeft een meerjarige overeenkomst aangekondigd met chipstartup Cerebras Systems, die 750 megawatt aan dedicated AI-rekenkracht zal leveren aan de maker van ChatGPT. Beide bedrijven beschrijven de overeenkomst als volgt: de grootste implementatie van snelle inferentie ooit geprobeerd.

De deal, die volgens bronnen die bekend zijn met de voorwaarden een waarde heeft van meer dan 10 miljard dollar, is OpenAI's belangrijkste investering in infrastructuur buiten de primaire relatie met Microsoft. Cerebras zal de systemen gefaseerd bouwen en hosten tot 2028, waarbij de eerste capaciteit dit jaar al online komt.

De samenwerking richt zich op een specifiek probleem: snelheid. Hoewel OpenAI ChatGPT heeft opgeschaald naar 800 miljoen wekelijkse gebruikersHet bedrijf kampt met beperkingen in de rekenkracht die de reactietijden vertragen, met name bij veeleisende taken zoals codegeneratie, agenttaken en realtime spraakinteractie.

"Cerebras voegt een speciale inferentieoplossing met lage latentie toe aan ons platform", aldus Sachin Katti, hoofd van de computerstrategie van OpenAI. "Dat betekent snellere reacties, natuurlijkere interacties en een sterkere basis om realtime AI op te schalen naar veel meer mensen."

Waarom silicium op waferschaal belangrijk is

Cerebras' verkoopargumenten draaien om hun wafer-scale processors: chips ter grootte van een dinerbord die de communicatievertragingen elimineren die inherent zijn aan systemen die zijn samengesteld uit vele kleinere GPU's. Het bedrijf beweert dat hun architectuur inferentiesnelheden levert die tot 15 keer sneller zijn dan GPU-gebaseerde alternatieven, met modellen zoals de GPT-OSS-120B die ongeveer 3,000 tokens per seconde verwerken.

Voor OpenAI vertaalt die snelheid zich direct in een betere gebruikerservaring. Wanneer AI in realtime reageert – zonder de vertraging die gesprekken kunstmatig doet aanvoelen – raken gebruikers meer betrokken en bereiken ze meer. Het bedrijf testte de chips van Cerebras met zijn open-weight modellen vóór Thanksgiving, en de technische gesprekken tussen de teams leidden al snel tot een getekende intentieverklaring, aldus Andrew Feldman, CEO van Cerebras.

"Net zoals breedband het internet heeft getransformeerd, zal realtime inferentie AI transformeren", aldus Feldman. "Dit maakt compleet nieuwe manieren mogelijk om AI-modellen te bouwen en ermee te interageren."

De vergelijking is niet overdreven. Het internet via een inbelverbinding ondersteunde in de beginperiode e-mail en eenvoudig internetgebruik; breedbandinternet maakte streaming video, spraakoproepen en uiteindelijk de smartphone-app-economie mogelijk. OpenAI lijkt erop te gokken dat voldoende snelle inferentie op vergelijkbare wijze toepassingen zal ontsluiten die door de huidige latentie onpraktisch zijn – met name voor AI-agenten die meerdere bewerkingen achter elkaar moeten uitvoeren zonder dat het menselijk geduld opraakt.

De wapenwedloop op het gebied van infrastructuur intensiveert.

De Cerebras-deal komt op een moment dat Waardering van AI-infrastructuur De vraag naar rekenkracht is explosief gestegen, met Databricks dat onlangs $134 miljard ophaalde en Cerebras dat naar verluidt in gesprek is over nieuwe financiering met een waardering van $22 miljard. De eisen aan rekenkracht voor geavanceerde AI-modellen vertonen geen tekenen van stagnatie en bedrijven doen er alles aan om capaciteit veilig te stellen voordat concurrenten dat doen.

Voor Cerebras lost de samenwerking met OpenAI een probleem van marktconcentratie op. De G42 uit de Verenigde Arabische Emiraten was in de eerste helft van 2024 goed voor 87% van de omzet van Cerebras – een klantenconcentratie die beleggers nerveus maakte. Door OpenAI als belangrijke klant toe te voegen in aanloop naar een mogelijke beursgang, wordt het risico voor het bedrijf aanzienlijk verlaagd.

Voor OpenAI betekent de deal een diversificatie van de markt. AI-infrastructuur buiten de Azure-cloud van Microsoft. Hoewel Microsoft de belangrijkste leverancier van rekenkracht voor OpenAI blijft, biedt de samenwerking met Cerebras OpenAI dedicated capaciteit met lage latentie, specifiek geoptimaliseerd voor inferentie – een andere workload dan de trainingsruns die de infrastructuur van Microsoft afhandelt.

Ook de timing is belangrijk. OpenAI heeft onlangs een release uitgebracht. GPT-5.2 Temidden van de toenemende concurrentie van Google's Gemini, ontdekken de bedrijven die de modellen inzetten dat pure intelligentie alleen niet genoeg is. Gebruikers verwachten ook vrijwel onmiddellijke reacties. Een briljante AI die tien seconden nodig heeft om te antwoorden, voelt gebrekkig aan; dezelfde AI die binnen een seconde reageert, voelt magisch.

Sam Altman, CEO van OpenAI, is al investeerder in Cerebras, en OpenAI heeft ooit overwogen het bedrijf volledig over te nemen. Deze deal suggereert dat de relatie zich ontwikkelt tot iets strategischer: een partnerschap waarbij de loten van beide bedrijven met elkaar verweven raken in de race om AI echt conversatiegericht te maken.

Alex McFarland is een AI-journalist en -schrijver die de nieuwste ontwikkelingen op het gebied van kunstmatige intelligentie onderzoekt. Hij heeft samengewerkt met tal van AI-startups en publicaties over de hele wereld.