Yapay Zekâ

Düşünen Makineler Laboratuvarı İlk Modelini 200ms Gerçek Zamanlı Etkileşim ile Gönderdi

mm

Düşünen Makineler Laboratuvarı, eski OpenAI CTO Mira Murati tarafından kurulan AI şirketi, 11 Mayıs 2026’da ilk iç modelinin araştırma önizlemesini yayınladı ve laboratuvarın ne inşa edeceğine ilişkin bir yıldan fazla süren suskunluğu sona erdirdi. Şirket, sistemi bir “etkileşim modeli” olarak adlandırıyor – kullanıcılar konuşmalarını bitirmeyi beklemek yerine 200 milisaniyelik parçalar halinde ses, video ve metin işlemek için sıfırdan eğitilmiş çok modlu bir mimari.

Model, TML-Interaction-Small adı verilen 276 milyar parametreli bir uzmanlar karışımı sistemdir ve 12 milyar aktif parametreye sahiptir. Şirketin duyuru blog yazısına göre, bu, yaklaşık 2 milyar dolarlık bir yatırım ve 12 milyar dolarlık bir değerlemeyle hiçbir şey göndermeyen bir laboratuvarın ilk ürünüdür. Yayın, yetenek kayıpları ve durdurulan bir takip fonlama turu nedeniyle süregelen baskılar arasında gerçekleşiyor.

Gerçek Zamanlı Etkileşim Modeli Nedir?

Düşünen Makineler, günümüzün sınır modellerinin – OpenAI’nin GPT-Realtime ve Google’ın Gemini Live dahil – gerçek zamanlı davranışı, dış bileşenler gibi ses etkinliği algılama kullanarak döner tabanlı mimarilere eklediğini savunuyor. Bu bileşenler, kullanıcının konuşmayı bittiğinde karar veriyor ve tamamlanmış bir ifadeyi modele teslim ediyor. Model bir cevap üretirken, dünyanın algısı donuyor.

Etkileşim modeli, bu iskeleyi zamanla hizalanmış mikro dönmelerle değiştiriyor. Sistem, 200 milisaniyelik girdi işlerken 200 milisaniyelik çıktı üretir ve her iki token akışı da aynı saat döngüsünde iç içe geçer. Bu yapı, modelin bir kullanıcıyı cümle ortasında kesmesine, görsel ipuçlarına karşı tepki vermesine veya canlı çeviri gibi görevler için kullanıcıyla aynı anda konuşmasına olanak tanır.

Mimari, ağır bağımsız kodlayıcıları atlar. Ses, dMel özelliklerine lightweight bir gömme katmanından geçirilerek verilir, görüntüler 40×40 parçalara bölünür ve tüm bileşenler sıfırdan transformer ile birlikte eğitilir. Bir arka plan modeli, daha derin akıl yürütme, araç çağrıları ve web taraması işlemlerini gerçekleştirirken etkileşim modeli sohbet içinde kalır.

Şirketin rapor edilen benchmark’lerine göre, TML-Interaction-Small FD-bench V1’de 0,40 saniyelik bir dönmeye gecikme süresi kaydeder ve bu, GPT-Realtime-2.0’in minimal düşünme modunda 1,18 saniye ve Gemini-3.1-flash-live’da 0,57 saniyeye karşılık gelir. FD-bench V1.5’te, model 77,8 puan alır ve bu, GPT-Realtime-2.0’in minimal modunda 46,8 puan ve Gemini-3.1-flash-live’da 45,5 puana karşılık gelir. Bu rakamlar kendileri tarafından rapor edilmiştir.

Uzun Süre Beklenen İlk Gönderi

Bu yayın, fonlama ve ürün arasında uzun bir boşluğu kapatıyor. Düşünen Makineler Şubat 2025’te kuruldu ve aynı yılın Temmuz ayında 2 milyar dolarlık bir yatırım ve 12 milyar dolarlık bir değerlemeyle – geniş olarak reported edilen en büyük tohum turu – bir yatırım turunu kapattı. Tur, Andreessen Horowitz tarafından liderlik edildi ve Nvidia, AMD, Cisco, Accel, ServiceNow ve Jane Street’in katılımıyla gerçekleşti. Şimdiye kadar şirketin yalnızca gönderdiği ürün, Ekim 2025’te lanç edilen Tinker adlı açık ağırlıklı modeller için bir API’dir.

Aralık aylar, fırtınalı geçti. Kurucular Barret Zoph ve Luke Metz, Ocak 2026’da OpenAI’ye dönmek için ayrıldı ve Murati, şirketin Zoph ile “yollarını ayırdığını” açıkladı. Andrew Tulloch, Mark Zuckerberg’in şirketini tamamen satın almak için yaptığı 1 milyar dolarlık teklifin reddedilmesinden sonra Meta’nın Süper Zeka Laboratuvarlarına katıldı. Meta, laboratuvarın beş kurucu üyesini işe aldı. Murati, PyTorch’un ortak yaratıcısı Soumith Chintala’yı CTO olarak atadı. Tahmin edilen bir takip turu, 2025 yılı sonunda yaklaşık 50 milyar dolarlık bir değerlemeyle kapanmadı.

Bilgisayar hikayesi ise tersine döndü. Mart ayında Düşünen Makineler, Nvidia ile bir ortaklık duyurdu ve bu, bilinmeyen bir yatırım ve en az bir gigawatt next-generation Vera Rubin sistemlerinin dağıtımı içermektedir. Laboratuvar ayrıca Google Cloud ilişkisini, Nvidia GB300 donanımı上的 frontier model eğitimini kapsayacak şekilde genişletti.

Neyi İzlemek Gerekir

Etkileşim modeli henüz şirketlere veya halka açık değildir. Düşünen Makineler, sınırlı bir araştırma önizlemesinin seçilen ortaklarla yakın aylarda açılacağını ve 2026’nın ilerleyen döneminde daha geniş bir sürümün geleceğini söylüyor. Şirket, daha büyük etkileşim modelleri yayınlayacağını da belirtiyor ve mevcut 276B parametreli sürümün, gerekli gecikme süresinde hizmet verebileceği en küçük varyant olduğunu söylüyor.

İddia edilen benchmark iddialarının bağımsız olarak doğrulanması, acil soru olarak ortaya çıkıyor. FD-bench, etkileşim kalitesini hedefleyen birkaç kamu benchmark’inden biridir ve Düşünen Makineler’in puanları henüz gerçekçi yük altında üçüncü taraf tarafından üretilmedi. Şirketin, görsel ipuçları için geliştirdiği proaktif testler, RepCount-A, ProactiveVideoQA ve Charades’in uyarlanmış sürümlerini içerir ve bunlar, kurulmuş bir temel olmadan yeni araçlardır.

Stratejik bahis daha nettir. OpenAI, Anthropic ve Google, son bir yıl içinde otonom ajan yeteneklerine odaklanırken, Düşünen Makineler, rekabetin próximo ekseninin insanların AI ile nasıl iletişim kurduğu olacağını düşünüyor – bir dizi.prompt yerine sürekli bir sohbet. Etkileşim modeli, OpenAI, Google ve bir dizi konuşma odaklı startup’tan gelen gerçek zamanlı ses AI sistemleriyle doğrudan rekabet hâlindedir. Mimarinin, üretim iş yükleri – uzun oturumlar, güvenilir olmayan bağlantı ve gerçek zamanlı retin safety kısıtlamaları – ile temas halinde hayatta kalıp kalamayacağı, bir sonraki önizleme turunun uygulayacağı sınav olacaktır.

Alex McFarland yapay zeka muhabiri ve yazarıdır ve yapay zekadaki son gelişmeleri araştırıyor. Birçok yapay zeka başlangıç şirketi ve dünya çapındaki yayınlarda işbirliği yaptı.