kemitraan
OpenAI Menggandeng Cerebras untuk Pendanaan Komputasi Latensi Rendah Sebesar $10 Miliar

OpenAI mengumumkan perjanjian multi-tahun dengan perusahaan rintisan chip Cerebras Systems yang akan menyediakan daya komputasi AI khusus sebesar 750 megawatt untuk pembuat ChatGPT, yang oleh kedua perusahaan digambarkan sebagai... penyebaran inferensi kecepatan tinggi terbesar pernah dicoba.
Kesepakatan yang bernilai lebih dari $10 miliar menurut sumber yang mengetahui persyaratannya ini, menandai investasi infrastruktur paling signifikan OpenAI di luar hubungan utamanya dengan Microsoft. Cerebras akan membangun dan menghosting sistem tersebut secara bertahap hingga tahun 2028, dengan kapasitas pertama mulai beroperasi tahun ini.
Kemitraan ini menargetkan masalah spesifik: kecepatan. Sementara OpenAI telah meningkatkan skala ChatGPT hingga 800 juta pengguna mingguanPerusahaan tersebut menghadapi keterbatasan daya komputasi yang memperlambat waktu respons—terutama untuk beban kerja yang berat seperti pembuatan kode, tugas berbasis agen, dan interaksi suara secara real-time.
“Cerebras menambahkan solusi inferensi latensi rendah khusus ke platform kami,” kata Sachin Katti, yang memimpin strategi komputasi OpenAI. “Itu berarti respons yang lebih cepat, interaksi yang lebih alami, dan fondasi yang lebih kuat untuk meningkatkan skala AI waktu nyata bagi lebih banyak orang.”
Mengapa Silikon Skala Wafer Penting?
Strategi pemasaran Cerebras berpusat pada prosesor skala wafer-nya—chip seukuran piring makan yang menghilangkan penundaan komunikasi yang melekat pada sistem yang dirakit dari banyak GPU yang lebih kecil. Perusahaan mengklaim arsitekturnya memberikan kecepatan inferensi hingga 15 kali lebih cepat daripada alternatif berbasis GPU, dengan model seperti GPT-OSS-120B yang berjalan sekitar 3,000 token per detik.
Bagi OpenAI, kecepatan itu berdampak langsung pada pengalaman pengguna. Ketika AI merespons secara real-time—tanpa latensi yang membuat percakapan terasa artifisial—pengguna terlibat lebih dalam dan mencapai lebih banyak hal. Perusahaan tersebut menguji silikon Cerebras dengan model open-weight-nya sebelum Thanksgiving, dan percakapan teknis antara tim dengan cepat meningkat hingga penandatanganan lembar persyaratan, menurut CEO Cerebras, Andrew Feldman.
“Sama seperti broadband yang mengubah internet, inferensi waktu nyata akan mengubah AI,” kata Feldman. “Ini memungkinkan cara-cara baru untuk membangun dan berinteraksi dengan model AI.”
Perbandingan ini bukanlah hiperbola. Internet dial-up awal mendukung email dan penjelajahan dasar; broadband memungkinkan streaming video, panggilan suara, dan akhirnya ekonomi aplikasi ponsel pintar. OpenAI tampaknya bertaruh bahwa inferensi yang cukup cepat akan membuka aplikasi yang saat ini tidak praktis karena latensi—terutama untuk agen AI yang harus menggabungkan beberapa operasi tanpa menguras kesabaran manusia.
Perlombaan Senjata Infrastruktur Semakin Intensif
Kesepakatan Cerebras ini terjadi seiring berjalannya waktu. Penilaian infrastruktur AI Permintaan komputasi untuk model AI mutakhir telah meledak, dengan Databricks baru-baru ini mengumpulkan dana sebesar $134 miliar dan Cerebras sendiri dilaporkan sedang dalam pembicaraan untuk pendanaan baru dengan valuasi $22 miliar. Permintaan komputasi untuk model AI mutakhir tidak menunjukkan tanda-tanda akan melambat, dan perusahaan-perusahaan berebut untuk mengamankan kapasitas sebelum pesaing melakukannya.
Bagi Cerebras, kemitraan dengan OpenAI memecahkan masalah konsentrasi bisnis. Kelompok G42 Uni Emirat Arab menyumbang 87% dari pendapatan Cerebras pada paruh pertama tahun 2024—konsentrasi pelanggan yang membuat investor khawatir. Menambahkan OpenAI sebagai pelanggan utama menjelang potensi IPO secara signifikan mengurangi risiko bisnis.
Bagi OpenAI, kesepakatan ini mendiversifikasi bisnisnya. Infrastruktur AI Di luar cloud Azure milik Microsoft. Meskipun Microsoft tetap menjadi penyedia komputasi utama OpenAI, kemitraan Cerebras memberi OpenAI kapasitas latensi rendah khusus yang dioptimalkan secara khusus untuk inferensi—beban kerja yang berbeda dari pelatihan yang ditangani infrastruktur Microsoft.
Waktu juga penting. OpenAI baru-baru ini merilis GPT-5.2 Di tengah persaingan yang semakin ketat dari Gemini milik Google. Seiring model-model tersebut menjadi semakin canggih, perusahaan-perusahaan yang menggunakannya menemukan bahwa kecerdasan mentah saja tidak cukup—pengguna juga mengharapkan respons yang hampir instan. AI yang brilian yang membutuhkan waktu sepuluh detik untuk menjawab terasa tidak sempurna; AI yang sama yang merespons dalam waktu kurang dari satu detik terasa ajaib.
Sam Altman, CEO OpenAI, sudah menjadi investor di Cerebras, dan OpenAI pernah mempertimbangkan untuk mengakuisisi perusahaan tersebut secara keseluruhan. Kesepakatan ini menunjukkan bahwa hubungan tersebut berkembang menjadi sesuatu yang lebih strategis: kemitraan di mana nasib kedua perusahaan saling terkait dalam perlombaan untuk membuat AI terasa benar-benar seperti percakapan.












