Kecerdasan buatan

Laboratorium Mesin Pemikir Mengirimkan Model Pertama dengan Interaksi Waktu Nyata 200ms

Published May 12, 2026

Alex McFarland

Laboratorium Mesin Pemikir, startup AI yang didirikan oleh mantan CTO OpenAI Mira Murati, merilis pratinjau penelitian dari model internal pertamanya pada 11 Mei 2026, mengakhiri lebih dari setahun keheningan tentang apa yang sebenarnya akan dibangun laboratorium tersebut. Perusahaan ini menyebut sistem tersebut sebagai “model interaksi” — arsitektur multimodal yang dilatih dari awal untuk memproses audio, video, dan teks dalam potongan 200 milidetik daripada menunggu pengguna menyelesaikan giliran.

Model, yang dinamai TML-Interaction-Small, adalah sistem campuran-ahli 276 miliar parameter dengan 12 miliar parameter aktif. Menurut pos blog pengumuman perusahaan, ini adalah produk pertama dari laboratorium yang telah mengumpulkan sekitar $2 miliar dengan valuasi $12 miliar tanpa mengirimkan apa pun selain alat penyetelan halus. Rilis ini dilakukan di tengah tekanan berkelanjutan dari kepergian talenta dan putaran pendanaan lanjutan yang terhambat.

Apa yang Sebenarnya Dilakukan oleh Model Interaksi

Laboratorium Mesin Pemikir berargumen bahwa model-model frontier saat ini — termasuk GPT-Waktu Nyata OpenAI dan Gemini Live Google — menambahkan perilaku waktu nyata ke arsitektur berbasis giliran menggunakan “harness” komponen eksternal seperti deteksi aktivitas suara. Komponen-komponen tersebut memutuskan kapan pengguna telah berhenti berbicara, kemudian menyerahkan ucapan yang selesai kepada model. Sementara model menghasilkan balasan, persepsi dunianya membeku.

Model interaksi menggantikan scaffolding tersebut dengan apa yang disebut perusahaan sebagai mikro-giliran waktu-terikat. Sistem ini terus-menerus memproses 200 milidetik input sambil menghasilkan 200 milidetik output, dengan kedua aliran token yang diinterleave pada siklus jam yang sama. Struktur tersebut memungkinkan model untuk memotong pengguna di tengah kalimat, bereaksi terhadap isyarat visual tanpa diminta, atau berbicara bersamaan dengan pengguna untuk tugas seperti terjemahan langsung.

Arsitektur ini melewati pengkode awal yang berat. Audio diberikan sebagai fitur dMel melalui lapisan penyematan ringan, gambar dibagi menjadi potongan 40×40, dan semua komponen dilatih bersama dari awal dengan transformer. Model latar belakang terpisah berjalan secara asinkron, menangani penalaran yang lebih dalam, panggilan alat, dan browsing web sambil model interaksi tetap hadir dalam percakapan.

Pada benchmark yang dilaporkan perusahaan, TML-Interaction-Small memposting latensi giliran 0,40 detik pada FD-bench V1, dibandingkan dengan 1,18 detik untuk GPT-Waktu Nyata-2.0 dalam mode pemikiran minimal dan 0,57 detik untuk Gemini-3.1-flash-live. Pada FD-bench V1.5, yang menilai kualitas interaksi di seluruh gangguan pengguna, saluran belakang, dan ucapan latar, model ini mencetak 77,8 dibandingkan dengan 46,8 untuk GPT-Waktu Nyata-2.0 minimal dan 45,5 untuk Gemini-3.1-flash-live dalam mode pemikiran tinggi. Angka-angka tersebut dilaporkan sendiri.

Pengiriman Pertama yang Dinantikan

Rilis ini menutup kesenjangan panjang antara pendanaan dan produk. Laboratorium Mesin Pemikir didirikan pada Februari 2025 dan pada Juli tahun itu menutup putaran pendanaan awal sebesar $2 miliar dengan valuasi $12 miliar — yang dilaporkan secara luas sebagai putaran pendanaan awal terbesar dalam catatan. Putaran tersebut dipimpin oleh Andreessen Horowitz dengan partisipasi dari Nvidia, AMD, Cisco, Accel, ServiceNow, dan Jane Street. Sampai sekarang, satu-satunya produk yang dikirim oleh perusahaan adalah Tinker, API untuk penyetelan halus model berat terbuka yang diluncurkan pada Oktober 2025.

Bulan-bulan berikutnya membawa kekacauan. Co-pendiri Barret Zoph dan Luke Metz meninggalkan pada Januari 2026 untuk kembali ke OpenAI, dengan Murati mengumumkan bahwa perusahaan telah “berpisah” dengan Zoph. Andrew Tulloch meninggalkan untuk Meta’s Superintelligence Labs setelah penawaran Mark Zuckerberg sebesar $1 miliar untuk membeli perusahaan secara langsung ditolak. Meta sejak itu telah mempekerjakan lima anggota pendiri laboratorium. Murati merespons dengan mempromosikan Soumith Chintala, co-pencipta PyTorch, ke CTO. Putaran pendanaan lanjutan yang dilaporkan sebesar $50 miliar tidak ditutup pada akhir 2025.

Cerita komputasi bergerak ke arah yang berlawanan. Pada Maret, Laboratorium Mesin Pemikir mengumumkan kemitraan dengan Nvidia yang mencakup investasi yang tidak diungkapkan dan penerapan setidaknya satu gigawatt sistem Vera Rubin generasi berikutnya. Laboratorium juga memperluas hubungannya dengan Google Cloud untuk mencakup pelatihan model frontier pada perangkat keras Nvidia GB300.

Apa yang Perlu Diperhatikan

Model interaksi belum tersedia untuk perusahaan atau masyarakat umum. Laboratorium Mesin Pemikir mengatakan bahwa pratinjau penelitian terbatas akan dibuka untuk mitra terpilih dalam beberapa bulan mendatang, dengan rilis yang lebih luas kemudian pada 2026. Perusahaan juga berencana untuk merilis model interaksi yang lebih besar, dengan mencatat bahwa versi parameter 276B saat ini adalah varian terkecil yang dapat mereka layani pada latensi yang diperlukan.

Verifikasi independen dari klaim benchmark adalah pertanyaan segera. FD-bench adalah salah satu benchmark publik yang menargetkan kualitas interaksi, dan skor Laboratorium Mesin Pemikir belum direproduksi oleh pihak ketiga di bawah beban realistis. Tes proaktivitas yang diperkenalkan perusahaan untuk isyarat visual, termasuk versi yang disesuaikan dari RepCount-A, ProactiveVideoQA, dan Charades, adalah instrumen baru tanpa baseline yang mapan.

Taruhannya lebih tajam. Sementara OpenAI, Anthropic, dan Google menghabiskan tahun terakhir mendorong kemampuan agen otonom, Laboratorium Mesin Pemikir bertaruh bahwa sumbu kompetisi berikutnya akan menjadi bagaimana manusia berkomunikasi dengan AI — lebih dekat dengan percakapan terus-menerus daripada serangkaian prompt. Model interaksi bersaing secara langsung dengan sistem AI suara waktu nyata yang dikirim oleh OpenAI, Google, dan tingkat startup yang semakin meningkat yang berfokus pada ucapan. Apakah arsitektur tersebut dapat bertahan kontak dengan beban kerja produksi — sesi panjang, koneksi yang tidak dapat diandalkan, dan konstrain keamanan penolakan waktu nyata — adalah tes yang akan diberlakukan oleh putaran pratinjau berikutnya.

Alex McFarland

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.

Unite.AI

Laboratorium Mesin Pemikir Mengirimkan Model Pertama dengan Interaksi Waktu Nyata 200ms

Apa yang Sebenarnya Dilakukan oleh Model Interaksi

Pengiriman Pertama yang Dinantikan

Apa yang Perlu Diperhatikan

You may like