Conectează-te cu noi

Parteneriate

OpenAI apelează la Cerebras pentru 10 miliarde de dolari în calcul cu latență redusă

mm

OpenAI a anunțat un acord multianual cu startup-ul de cipuri Cerebras Systems, care va livra 750 de megawați de putere de calcul dedicată inteligenței artificiale către producătorul ChatGPT, ceea ce ambele companii descriu ca fiind... cea mai mare implementare de inferență de mare viteză încercat vreodată.

Acordul, evaluat la peste 10 miliarde de dolari, potrivit unor surse familiarizate cu termenii și condițiile, marchează cel mai semnificativ pariu pe infrastructură al OpenAI în afara relației sale principale cu Microsoft. Cerebras va construi și găzdui sistemele în etape, până în 2028, prima capacitate urmând să fie pusă în funcțiune anul acesta.

Parteneriatul vizează o problemă specifică: viteza. Deși OpenAI a scalat ChatGPT la 800 de milioane de utilizatori săptămânal, compania se confruntă cu constrângeri de calcul care încetinesc timpii de răspuns, în special pentru sarcini de lucru solicitante, cum ar fi generarea de cod, sarcinile agențice și interacțiunea vocală în timp real.

„Cerebras adaugă o soluție dedicată de inferență cu latență redusă platformei noastre”, a declarat Sachin Katti, care conduce strategia de calcul a OpenAI. „Aceasta înseamnă răspunsuri mai rapide, interacțiuni mai naturale și o bază mai solidă pentru a scala inteligența artificială în timp real la mult mai mulți oameni.”

De ce contează siliciul la scară de napolitană

Prezentarea Cerebras se concentrează pe procesoarele sale la scară de wafer - cipuri de dimensiunea unor farfurii care elimină întârzierile de comunicare inerente sistemelor îmbinate din mai multe GPU-uri mai mici. Compania susține că arhitectura sa oferă viteze de inferență de până la 15 ori mai rapide decât alternativele bazate pe GPU, cu modele precum GPT-OSS-120B care rulează la aproximativ 3,000 de jetoane pe secundă.

Pentru OpenAI, această viteză se traduce direct în experiența utilizatorului. Atunci când IA răspunde în timp real - fără latența care face ca conversațiile să pară artificiale - utilizatorii se implică mai profund și realizează mai multe. Compania a testat siliciul Cerebras cu modelele sale open-weight înainte de Ziua Recunoștinței, iar conversațiile tehnice dintre echipe au escaladat rapid într-o foaie de termen semnată, potrivit CEO-ului Cerebras, Andrew Feldman.

„Așa cum banda largă a transformat internetul, inferența în timp real va transforma inteligența artificială”, a spus Feldman. „Acest lucru permite modalități complet noi de a construi și interacționa cu modele de inteligență artificială.”

Comparația nu este o hiperbolă. Primele etape ale internetului dial-up suportau e-mailul și navigarea de bază; internetul în bandă largă permitea streamingul video, apelurile vocale și, în cele din urmă, economia aplicațiilor pentru smartphone-uri. OpenAI pare să parieze că o inferență suficient de rapidă va debloca în mod similar aplicații pe care latența actuală le face impracticabile - în special pentru agenții IA care trebuie să înlănțuiască mai multe operațiuni fără ca răbdarea umană să le epuizeze.

Cursa înarmării pentru infrastructură se intensifică

Acordul cu Cerebras vine în contextul în care Evaluări ale infrastructurii de inteligență artificială au explodat, Databricks atragând recent fonduri de 134 de miliarde de dolari, iar Cerebras însăși fiind în discuții pentru o finanțare nouă, evaluată la 22 de miliarde de dolari. Cerințele de calcul ale modelelor de inteligență artificială de frontieră nu dau semne de stagnare, iar companiile se luptă să își asigure capacitatea înaintea concurenței.

Pentru Cerebras, parteneriatul OpenAI rezolvă o problemă de concentrare a afacerilor. G42 din Emiratele Arabe Unite a reprezentat 87% din veniturile Cerebras în prima jumătate a anului 2024 - o concentrare a clienților care i-a făcut pe investitori să fie nervoși. Adăugarea OpenAI ca client major înaintea unei potențiale IPO reduce semnificativ riscurile pentru afacere.

Pentru OpenAI, acordul diversifică... Infrastructura AI dincolo de cloud-ul Azure al Microsoft. Deși Microsoft rămâne principalul furnizor de servicii de calcul al OpenAI, parteneriatul Cerebras oferă OpenAI o capacitate dedicată cu latență redusă, optimizată special pentru inferență - o sarcină de lucru diferită de cea pentru antrenament, gestionată de infrastructura Microsoft.

Momentul contează și el. OpenAI a lansat recent GPT-5.2 pe fondul concurenței tot mai intense din partea companiei Google Gemini. Pe măsură ce modelele devin mai capabile, companiile care le implementează descoperă că inteligența brută nu este suficientă - utilizatorii se așteaptă și la răspunsuri aproape instantanee. O inteligență artificială strălucită căreia îi ia zece secunde să răspundă pare stricată; aceeași inteligență artificială care răspunde în mai puțin de o secundă pare magică.

Sam Altman, CEO-ul OpenAI, este deja investitor în Cerebras, iar OpenAI a luat cândva în considerare achiziționarea directă a companiei. Această tranzacție sugerează că relația evoluează spre ceva mai strategic: un parteneriat în care destinele ambelor companii se împletesc în cursa de a face ca IA să fie cu adevărat conversațională.

Alex McFarland este jurnalist și scriitor AI care explorează cele mai recente evoluții în inteligența artificială. A colaborat cu numeroase startup-uri și publicații AI din întreaga lume.