Artificiell intelligens
Thinking Machines Lab Skickar Ut Sitt Första Modell Med 200ms Realtidsinteraktion

Thinking Machines Lab, AI-startuppen som grundades av före detta OpenAI CTO Mira Murati, släppte en forskningsförhandsvisning av sitt första inbyggda modell den 11 maj 2026, och avslutade därmed en över ett års tystnad om vad labbet faktiskt skulle bygga. Företaget kallar systemet för ett “interaktionsmodell” – en multimodal arkitektur som tränats från scratch för att bearbeta ljud, video och text i 200-millisekundsblock snarare än att vänta på att användarna ska slutföra en vända.
Modellen, som heter TML-Interaction-Small, är ett 276 miljarder-parametrars mixture-of-experts-system med 12 miljarder aktiva parametrar. Enligt företagets tillkännagivande på bloggen är det den första produkten från ett labb som har samlat in cirka 2 miljarder dollar vid en värdering av 12 miljarder dollar utan att skicka något annat än ett finjusteringsverktyg. Utgåvan kommer mitt i en varaktig press från talangavgångar och en avbruten uppföljningsfinansieringsrunda.
Vad en Interaktionsmodell Verkligen Gör
Thinking Machines hävdar att dagens gränsmodeller – inklusive OpenAI:s GPT-Realtime och Google:s Gemini Live – monterar realtidsbeteende på vändningsbaserade arkitekturer med hjälp av en “harness” av externa komponenter som t.ex. röstaktivitetsdetektering. Dessa komponenter bestämmer när användaren har slutat tala, och sedan överlämnar de en färdig uttalande till modellen. Medan modellen genererar ett svar fryser dess uppfattning om världen.
Interaktionsmodellen ersätter den här stödstrukturen med vad företaget kallar tidsjusterade mikrovändor. Systemet bearbetar kontinuerligt 200 millisekunder av indata medan det genererar 200 millisekunder av utdata, med båda tokenströmmarna vävda samman på samma klockcykel. Den här strukturen låter modellen avbryta en användare mitt i en mening, reagera på visuella signaler utan att bli ombedd, eller tala samtidigt med användaren för uppgifter som direktöversättning.
Arkitekturen hoppar över tunga fristående encoders. Ljud matas in som dMel-egenskaper genom ett lätthanterligt inbäddningslager, bilder delas upp i 40×40-patchar, och alla komponenter är samtränade från scratch med transformatorn. En separat bakgrundsmodell körs asynkront och hanterar djupare resonemang, verktygsanrop och webbläsning medan interaktionsmodellen förblir närvarande i samtalet.
Enligt företagets rapporterade benchmarkresultat har TML-Interaction-Small en vändning-latens på 0,40 sekunder på FD-bench V1, jämfört med 1,18 sekunder för GPT-Realtime-2.0 i dess minimaltänkande läge och 0,57 sekunder för Gemini-3.1-flash-live. På FD-bench V1.5, som poängsätter interaktionskvalitet över användaravbrott, bakkanaler och bakgrundspråk, får modellen 77,8 poäng jämfört med 46,8 för GPT-Realtime-2.0 minimalt och 45,5 för Gemini-3.1-flash-live i dess högtänkande läge. Siffrorna är självrapporterade.
En Länge Väntad Första Leverans
Utgåvan avslutar en lång lucka mellan finansiering och produkt. Thinking Machines grundades i februari 2025 och stängde en finansieringsrunda på 2 miljarder dollar i juli samma år, vid en värdering av 12 miljarder dollar – vilket har rapporterats som den största startfinansieringsrundan på record. Rundan leddes av Andreessen Horowitz med deltagande från Nvidia, AMD, Cisco, Accel, ServiceNow och Jane Street. Fram till nu har företagets enda levererade produkt varit Tinker, en API för finjustering av öppna modeller som lanserades i oktober 2025.
De mellanliggande månaderna förde med sig turbulens. Medgrundarna Barret Zoph och Luke Metz lämnade i januari 2026 för att återvända till OpenAI, och Murati meddelade att företaget hade “gått skilda vägar” med Zoph. Andrew Tulloch lämnade för Meta:s Superintelligence Labs efter att Mark Zuckerberg hade erbjudit 1 miljard dollar för att köpa företaget direkt, men detta avslogs. Meta har sedan dess anställt fem grundande medlemmar av labbet. Murati svarade genom att befordra Soumith Chintala, en medskapare av PyTorch, till CTO. En rapporterad uppföljningsrunda vid en värdering av cirka 50 miljarder dollar stängdes inte före slutet av 2025.
Beräkningshistorien gick i motsatt riktning. I mars meddelade Thinking Machines ett partnerskap med Nvidia som omfattade en icke-avslöjad investering och distributionen av minst en gigawatt av nästa generations Vera Rubin-system. Labbet utvidgade också sin relation med Google Cloud för att omfatta gränsmodellsträning på Nvidia GB300-hårdvara.
Vad att Titta på
Interaktionsmodellen är ännu inte tillgänglig för företag eller allmänheten. Thinking Machines säger att en begränsad forskningsförhandsvisning kommer att öppnas för utvalda partner under de kommande månaderna, och en bredare utgåva senare under 2026. Företaget planerar också att släppa större interaktionsmodeller och noterar att den nuvarande 276-miljardersparametrarversionen är den minsta varianten som kan serveras vid den krävda latensen.
Oberoende verifiering av benchmarkpåståendena är den omedelbara frågan. FD-bench är en av de få offentliga benchmarktesterna som riktar sig mot interaktionskvalitet, och Thinking Machines poäng har ännu inte reproducerats av tredje parter under realistiska belastningar. De proaktiva test som företaget introducerade för visuella signaler, inklusive anpassade versioner av RepCount-A, ProactiveVideoQA och Charades, är nya instrument utan en etablerad baslinje.
Den strategiska insatsen är mer fokuserad. Medan OpenAI, Anthropic och Google har tillbringat det senaste året med att driva autonom agentkapacitet, satsar Thinking Machines på att den nästa axeln av konkurrens kommer att vara hur människor kommunicerar med AI – närmare en kontinuerlig konversation än en serie prompt. Interaktionsmodellen konkurrerar mest direkt med realtidsröst-AI-system som skickas från OpenAI, Google och en växande skara tal-fokuserade startups. Om arkitekturen överlever kontakt med produktionsarbetsbelastningar – långa sessioner, opålitlig anslutning och säkerhetsbegränsningar för realtidsvägran – är det testet som den kommande förhandsvisningsrundan kommer att utgöra.












