Finanțare

Cerebras obține 1,1 miliarde de dolari prin seria G la o valoare de 8,1 miliarde de dolari pentru a redesena cursa cipului de inteligență artificială

mm

Cerebras Systems a anunțat finalizarea unei serii G suprasubscrise de 1,1 miliarde de dolari, evaluând compania la 8,1 miliarde de dolari. Finanțarea a fost condusă de Fidelity Management & Research și Atreides Management, cu participarea Tiger Global, Valor Equity Partners, 1789 Capital și a acționarilor existenți Altimeter, Alpha Wave și Benchmark.

Compania afirmă că capitalul va accelera dezvoltarea procesoarelor la scară de wafer, va extinde capacitățile de fabricație din Statele Unite și va crește amprenta sa de centru de date. Acest lucru o poziționează pe Cerebras pentru a satisface cererea explozivă pentru sarcinile de inferență care devin coloana vertebrală a implementării moderne a inteligenței artificiale.

De ce Cerebras se diferențiază

În timp ce Nvidia domină antrenarea modelelor mari de inteligență artificială cu procesoarele sale grafice, Cerebras și-a asumat un rol important în inferență, unde modelele sunt implementate în medii reale. În ultimul an, Cerebras a demonstrat constant viteze de peste 20 de ori mai mari decât procesoarele grafice Nvidia într-o gamă largă de modele. Acest avantaj de performanță a alimentat o adoptare masivă în întreprinderi, guverne și instituții de cercetare.

Cheia constă în motorul Wafer Scale Engine (WSE) al lui Cerebras, cel mai mare cip semiconductor din lume. Ultima generație, WSE-3, integrează aproape un milion de nuclee optimizate pentru inteligență artificială pe un wafer întreg, evitând blocajele de comunicare care apar atunci când sarcinile de lucru sunt distribuite pe mai multe procesoare grafice. Acest design reduce latența și consumul de energie, în timp ce crește debitul, făcându-l ideal pentru sarcinile de inferență în care viteza și eficiența sunt parametrii cheie.

Cum se compară cu Nvidia și Groq

Cerebras nu este singurul care reimagинеază hardware-ul de inferență. Groq a urmat o cale diferită cu unitățile sale de procesare a limbajului, proiectate pentru latență ultra-scăzută și performanță deterministă în scenarii ușoare și în timp real. Nvidia, între timp, continuă să domine peisajul antrenamentului și oferă suport extins pentru inferență prin ecosistemul său CUDA și procesoarele grafice din centrele de date.

Concurența evidențiază o industrie care se fragmentează în arhitecturi specializate. Punctul forte al lui Nvidia rămâne versatilitatea și integrarea ecosistemului. Groq se concentrează pe sarcini de inferență în timp real și cu latență scăzută. Cerebras, în schimb, se axează pe partea superioară a spectrului, unde modelele masive necesită un debit enorm și eficiență. Abordarea sa la scară de wafer nu poate fi la fel de modulară ca clusterul de procesoare grafice, dar oferă un avantaj decisiv atunci când sarcinile de inferență ajung la trilioane de tokeni pe lună.

Impuls și poziție pe piață

Sistemele Cerebras sunt deja utilizate de companii și instituții majore, inclusiv AWS, Meta, IBM, Mistral, Cognition și Notion, alături de guverne și centre de cercetare precum Departamentul de Energie al Statelor Unite și Departamentul Apărării. Compania a devenit, de asemenea, principalul furnizor de inferență pe Hugging Face, deservind peste cinci milioane de solicitări lunare ale dezvoltatorilor.

Acest impuls subliniază modul în care economia inteligenței artificiale se schimbă. În timp ce antrenamentul rămâne scump și intensiv din punct de vedere al resurselor, valoarea pe termen lung constă în implementarea modelelor la scară. Întreprinderile devin din ce în ce mai sensibile la costurile, latența și fiabilitatea inferenței — factori care joacă direct în punctele forte ale lui Cerebras.

Provocările care urmează

Ascensiunea lui Cerebras nu este lipsită de obstacole semnificative. Proiectele la scară de wafer sunt notorii pentru dificultățile de fabricație. Rendimentul poate fi scăzut, defectele pot fi costisitoare, iar soluțiile de răcire pot fi complexe, ceea ce face ca producția de serie să fie riscantă și scumpă. În contrast cu clusterul modular de procesoare grafice, unde cipurile defecte pot fi înlocuite individual, sistemele la scară de wafer sunt mai puțin iertătoare.

Compania a fost, de asemenea, supusă unor critici legate de concentrarea clienților. În declarațiile financiare anterioare, Cerebras a dezvăluit că majoritatea veniturilor sale în primul semestru al anului 2024 au provenit de la un singur client. Acest tip de dependență expune afacerea la volatilitate în cazul în care partenerii cheie își schimbă strategiile, adoptă hardware alternativ sau decid să-și diversifice furnizorii de computere.

Dinamica regulamentelor adaugă o altă straturi de complexitate. Cerebras a depus în mod confidențial o cerere de IPO în 2024, dar a amânat-o în mijlocul unor revizuiri de securitate națională legate de acordul său anterior cu G42, o firmă de inteligență artificială din Abu Dhabi. Regulatorii americani au examinat din ce în ce mai mult investițiile străine și parteneriatele în sectorul cipului de inteligență artificială, complicând drumul lui Cerebras către piețele publice. În timp ce noua rundă de 1,1 miliarde de dolari cumpără timp, aceasta ridică și așteptări că compania va trebui să arate în curând o creștere durabilă a veniturilor și diversificare pentru a satisface atât investitorii, cât și regulatorii.

În final, concurența nu face decât să se intensifice. Nvidia continuă să inoveze rapid cu procesoarele sale Blackwell și ecosistemul său de software. Groq câștigă o cotă de piață în inferența în timp real. Hiperscalarii precum Amazon, Microsoft și Google construiesc siliciu personalizat pentru a reduce dependența de terți. Cerebras trebuie să demonstreze că abordarea sa la scară de wafer nu este doar mai rapidă, ci și scalabilă, eficientă din punct de vedere al costurilor și defensivă împotriva atât a celor consacrați, cât și a noilor intrări.

Calculul de inferență și viitorul inteligenței artificiale

Cerebras ridică fonduri care evidențiază un moment crucial în evoluția inteligenței artificiale: schimbarea focalizării competitive de la antrenament la inferență. Antrenamentul determină cât de repede pot apărea noi modele de frontieră, dar inferența decide cât de larg și eficient pot fi implementate. Hardware-ul de inferență devine gâtul de sticlă critic — și oportunitatea — pentru industrie.

Pe măsură ce modelele devin mai mari și aplicațiile lor se mută în domenii în timp real, cum ar fi raționamentul, sistemele agenților și generarea de cod, viteza și eficiența vor defini avantajul competitiv. Companiile care pot oferi inferență eficientă din punct de vedere al costurilor, cu latență scăzută și la scară vor modela cine va câștiga în inteligența artificială generativă. Nvidia, Cerebras, Groq și inițiativele de cipuri personalizate ale giganților norilor converg toți către acest spațiu, aducând fiecare puncte forte diferite.

Viitorul inteligenței artificiale nu va fi determinat în mod exclusiv de cine antrenează cele mai mari modele. Va fi decis de cine poate livra aceste modele în lume — alimentând întreprinderi, guverne și dezvoltatori — cu cele mai rapide, mai accesibile și mai eficiente platforme de inferență. Ridicarea fondurilor de 1 miliard de dolari de către Cerebras arată cât de centrală a devenit această cursă.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.