Kemitraan

OpenAI Menandatangani Cerebras untuk $10 Miliar dalam Komputasi Rendah-Latensi

Published January 15, 2026

Updated April 25, 2026

Alex McFarland

OpenAI mengumumkan perjanjian multi-tahun dengan startup chip Cerebras Systems yang akan menyediakan 750 megawatt komputasi AI khusus untuk pembuat ChatGPT, dalam apa yang digambarkan oleh kedua perusahaan sebagai penyebaran inferensi kecepatan tinggi terbesar yang pernah dicoba.

Perjanjian, yang bernilai lebih dari $10 miliar menurut sumber yang familiar dengan ketentuan, menandai taruhan infrastruktur terbesar OpenAI di luar hubungan utamanya dengan Microsoft. Cerebras akan membangun dan menghosting sistem dalam beberapa tahap hingga 2028, dengan kapasitas pertama yang akan online tahun ini.

Kemitraan ini menargetkan masalah tertentu: kecepatan. Sementara OpenAI telah menskalakan ChatGPT ke 800 juta pengguna mingguan, perusahaan ini menghadapi keterbatasan komputasi yang memperlambat waktu respons—terutama untuk beban kerja yang menuntut seperti generasi kode, tugas agen, dan interaksi suara waktu nyata.

“Cerebras menambahkan solusi inferensi rendah-latensi khusus ke platform kami,” kata Sachin Katti, yang memimpin strategi komputasi OpenAI. “Itu berarti respons yang lebih cepat, interaksi yang lebih alami, dan fondasi yang lebih kuat untuk menskalakan AI waktu nyata ke banyak orang.”

Mengapa Wafer-Skala Silikon Penting

Pitch Cerebras berpusat pada prosesor skala wafer—chip seukuran piring makan yang menghilangkan keterlambatan komunikasi yang melekat dalam sistem yang dijahit dari banyak GPU yang lebih kecil. Perusahaan ini mengklaim arsitektur mereka menyediakan kecepatan inferensi hingga 15 kali lebih cepat daripada alternatif berbasis GPU, dengan model seperti GPT-OSS-120B yang berjalan sekitar 3.000 token per detik.

Untuk OpenAI, kecepatan itu diterjemahkan langsung ke pengalaman pengguna. Ketika AI merespons dalam waktu nyata—tanpa keterlambatan yang membuat percakapan terasa tidak alami—pengguna terlibat lebih dalam dan mencapai lebih banyak. Perusahaan ini menguji silikon Cerebras dengan model open-weight sebelum Hari Thanksgiving, dan percakapan teknis antara tim-tim tersebut dengan cepat meningkat menjadi lembaran tanda tangan, menurut CEO Cerebras Andrew Feldman.

“Just seperti broadband mengubah internet, inferensi waktu nyata akan mengubah AI,” kata Feldman. “Ini memungkinkan cara-cara baru untuk membangun dan berinteraksi dengan model AI.”

Perbandingan ini tidak berlebihan. Internet dial-up awal mendukung email dan browsing dasar; broadband memungkinkan streaming video, panggilan suara, dan akhirnya ekonomi aplikasi smartphone. OpenAI tampaknya bertaruh bahwa inferensi yang cukup cepat akan membuka kunci aplikasi yang saat ini tidak praktis karena keterlambatan—terutama untuk agen AI yang harus menghubungkan beberapa operasi tanpa kesabaran manusia yang menipis.

Perlombaan Infrastruktur Semakin Intens

Kesepakatan Cerebras datang ketika valuasi infrastruktur AI meledak, dengan Databricks baru-baru ini mengumpulkan dana sebesar $134 miliar dan Cerebras sendiri dilaporkan dalam pembicaraan untuk pendanaan baru dengan valuasi $22 miliar. Kebutuhan komputasi model AI frontier tidak menunjukkan tanda-tanda penurunan, dan perusahaan berlomba-lomba untuk mengamankan kapasitas sebelum pesaing melakukannya.

Untuk Cerebras, kemitraan OpenAI memecahkan masalah konsentrasi bisnis. Uni Emirat Arab’ G42 menyumbang 87% dari pendapatan Cerebras di paruh pertama 2024—konsentrasi pelanggan yang membuat investor gelisah. Menambahkan OpenAI sebagai pelanggan utama sebelum IPO yang potensial secara signifikan mengurangi risiko bisnis.

Untuk OpenAI, kesepakatan ini diversifikasi infrastruktur AI di luar awan Azure Microsoft. Sementara Microsoft tetap menjadi penyedia komputasi utama OpenAI, kemitraan Cerebras memberikan OpenAI kapasitas rendah-latensi khusus yang dioptimalkan untuk inferensi—beban kerja yang berbeda dari pelatihan yang ditangani oleh infrastruktur Microsoft.

Waktu kesepakatan juga penting. OpenAI baru-baru ini merilis GPT-5.2 di tengah persaingan yang intens dari Google’s Gemini. Ketika model menjadi lebih kuat, perusahaan yang menggunakannya menemukan bahwa kecerdasan mentah tidak cukup—pengguna juga mengharapkan respons yang hampir instan. AI yang brilian yang membutuhkan waktu sepuluh detik untuk menjawab terasa rusak; AI yang sama yang merespons dalam waktu kurang dari satu detik terasa ajaib.

Sam Altman, CEO OpenAI, sudah menjadi investor di Cerebras, dan OpenAI pernah mempertimbangkan untuk membeli perusahaan tersebut secara keseluruhan. Kesepakatan ini menunjukkan bahwa hubungan ini berkembang menjadi sesuatu yang lebih strategis: kemitraan di mana nasib kedua perusahaan menjadi terkait erat dalam perlombaan untuk membuat AI terasa benar-benar konversasional.

Unite.AI

OpenAI Menandatangani Cerebras untuk $10 Miliar dalam Komputasi Rendah-Latensi

Mengapa Wafer-Skala Silikon Penting

Perlombaan Infrastruktur Semakin Intens

You may like