Partnerschappen

OpenAI Taps Cerebras voor 10 miljard dollar in Low-Latency Compute

Published January 15, 2026

Updated April 25, 2026

Alex McFarland

OpenAI heeft een meerdere jaren durende overeenkomst gesloten met chip-startup Cerebras Systems dat 750 megawatt aan dedicated AI-compute zal leveren aan de maker van ChatGPT, in wat beide bedrijven beschrijven als de grootste high-speed inference-implementatie ooit geprobeerd.

De overeenkomst, die volgens bronnen die bekend zijn met de voorwaarden meer dan 10 miljard dollar waard is, markeert de belangrijkste infrastructuurinzet van OpenAI buiten zijn primaire relatie met Microsoft. Cerebras zal de systemen in fasen bouwen en hosten tot 2028, met de eerste capaciteit die dit jaar online komt.

De samenwerking richt zich op een specifiek probleem: snelheid. Terwijl OpenAI ChatGPT heeft geschaald naar 800 miljoen wekelijkse gebruikers, staat het bedrijf voor compute-beperkingen die de responstijden vertragen – vooral voor veeleisende workloads zoals codegeneratie, agentic taken en real-time spraakinteractie.

“Cerebras voegt een dedicated low-latency inference-oplossing toe aan ons platform”, zei Sachin Katti, die de compute-strategie van OpenAI leidt. “Dat betekent snellere antwoorden, meer natuurlijke interacties en een sterker fundament om real-time AI te schalen naar veel meer mensen.”

Waarom Wafer-Scale Silicon Ertoe Doet

De pitch van Cerebras draait om zijn wafer-scale processors – chips ter grootte van een dinertafel die de communicatievertragingen elimineren die inherent zijn aan systemen die zijn samengesteld uit veel kleinere GPUs. Het bedrijf beweert dat zijn architectuur inference-snelheden oplevert die tot 15 keer sneller zijn dan GPU-gebaseerde alternatieven, met modellen zoals GPT-OSS-120B die ongeveer 3.000 tokens per seconde draaien.

Voor OpenAI vertaalt die snelheid zich rechtstreeks naar de gebruikerservaring. Wanneer AI in real-time reageert – zonder de latentie die gesprekken kunstmatig laat aanvoelen – engageren gebruikers zich dieper en bereiken ze meer. Het bedrijf testte het silicium van Cerebras met zijn open-weight modellen voor Thanksgiving, en technische gesprekken tussen de teams escaleerden snel naar een ondertekend term sheet, volgens Cerebras CEO Andrew Feldman.

“Net zoals breedband het internet transformeerde, zal real-time inference AI transformeren”, zei Feldman. “Dit maakt helemaal nieuwe manieren mogelijk om AI-modellen te bouwen en te interacteren.”

De Infrastructuur Wapenwedloop Intensifieert

De overeenkomst met Cerebras komt op een moment dat AI-infrastructuurwaarderingen zijn geëxplodeerd, met Databricks die onlangs 134 miljard dollar ophaalde en Cerebras zelf naar verluidt in gesprek is over verse financiering tegen een waardering van 22 miljard dollar. De compute-eisen van frontier AI-modellen laten geen tekenen van afvlakking zien, en bedrijven proberen capaciteit te vergaren voordat concurrenten dat doen.

Voor Cerebras lost de OpenAI-samenwerking een bedrijfsconcentratieprobleem op. De Verenigde Arabische Emiraten’s G42 vertegenwoordigde 87% van de omzet van Cerebras in de eerste helft van 2024 – een klantconcentratie die beleggers nerveus maakte. Het toevoegen van OpenAI als een belangrijke klant vóór een potentiële beursgang de-risiceert het bedrijf aanzienlijk.

Voor OpenAI diversifieert de overeenkomst zijn AI-infrastructuur buiten de Azure-cloud van Microsoft. Terwijl Microsoft nog steeds de primaire compute-provider van OpenAI is, geeft de Cerebras-samenwerking OpenAI dedicated low-latency-capaciteit die specifiek is geoptimaliseerd voor inference – een andere workload dan de trainingsruns die de infrastructuur van Microsoft afhandelt.

De timing is ook belangrijk. OpenAI heeft onlangs GPT-5.2 uitgebracht te midden van intens wordende concurrentie van Google’s Gemini. Naarmate modellen krachtiger worden, ontdekken de bedrijven die ze implementeren dat pure intelligentie niet genoeg is – gebruikers verwachten ook bijna-onmiddellijke antwoorden. Een briljante AI die tien seconden nodig heeft om te antwoorden, voelt kapot; dezelfde AI die in minder dan een seconde antwoordt, voelt magisch.

Sam Altman, de CEO van OpenAI, is al een investeerder in Cerebras, en OpenAI overwoog eerder om het bedrijf helemaal over te nemen. Deze overeenkomst suggereert dat de relatie evolueert naar iets strategischer: een partnership waarin het lot van beide bedrijven verweven raakt in de race om AI echt conversational te maken.

Unite.AI

OpenAI Taps Cerebras voor 10 miljard dollar in Low-Latency Compute

Waarom Wafer-Scale Silicon Ertoe Doet

De Infrastructuur Wapenwedloop Intensifieert

You may like