Τεχνητή νοημοσύνη
Η Thinking Machines Lab Αποστέλλει το Πρώτο Μοντέλο Με Πραγματικό Χρόνο Σύνδεσης 200ms

Thinking Machines Lab, η εταιρεία AI που ιδρύθηκε από τον πρώην CTO της OpenAI Mira Murati, κυκλοφόρησε μια προεπισκόπηση έρευνας του πρώτου εσωτερικού μοντέλου της στις 11 Μαΐου 2026, τερματίζοντας πάνω από ένα χρόνο σιωπής σχετικά με το τι θα κατασκευάσει πραγματικά το εργαστήριο. Η εταιρεία ονομάζει το σύστημα “μοντέλο σύνδεσης” — μια πολυτροπική αρχιτεκτονική εκπαιδευμένη από την αρχή για την επεξεργασία ήχου, βίντεο και κειμένου σε τμήματα 200 χιλιοστοδευτερόλεπτα αντί να περιμένει τους χρήστες να ολοκληρώσουν μια σειρά.
Το μοντέλο, με το όνομα TML-Interaction-Small, είναι ένα σύστημα 276 δισεκατομμυρίων παραμέτρων με 12 δισεκατομμύρια ενεργές παραμέτρους. Σύμφωνα με την ανακοίνωση του blog της εταιρείας, είναι το πρώτο προϊόν από ένα εργαστήριο που έχει συγκεντρώσει περίπου 2 δισεκατομμύρια δολάρια σε αξία 12 δισεκατομμυρίων δολαρίων χωρίς να αποστείλει τίποτα πέρα από ένα εργαλείο επιμερισμού. Η κυκλοφορία έρχεται εν μέσω συνεχούς πίεσης από τις αποχωρήσεις ταλαντούχων και μια σταθεροποιημένη γύρο χρηματοδότησης.
Τι Κάνει Πραγματικά Ένα Μοντέλο Σύνδεσης
Η Thinking Machines υποστηρίζει ότι τα σημερινά μοντέλα του μετώπου — συμπεριλαμβανομένων των GPT-Πραγματικού Χρόνου της OpenAI και του Gemini Live της Google — προσθέτουν πραγματικό χρόνο συμπεριφορά σε αρχιτεκτονικές με βάση σειρά χρησιμοποιώντας ένα “χαράκωμα” εξωτερικών компонέντων όπως η ανίχνευση δραστηριότητας φωνής. Αυτά τα компонента quyết định όταν ο χρήστης έχει σταματήσει να μιλάει και στη συνέχεια μεταβιβάζουν μια ολοκληρωμένη προφορά στο μοντέλο. Ενώ το μοντέλο γεννάει μια απάντηση, η αντίληψη του κόσμου παγώνει.
Το μοντέλο σύνδεσης αντικαθιστά αυτή τη σκαλωσιά με αυτό που η εταιρεία ονομάζει χρονο-συντονισμένες μικρές σειρές. Το σύστημα επεξεργάζεται συνεχώς 200 χιλιοστοδευτερόλεπτα εισόδου ενώ παράγει 200 χιλιοστοδευτερόλεπτα εξόδου, με και τις δύο ροές συμβόλων διαπλεγμένες στην ίδια κύκλο ρολογιού. Αυτή η δομή επιτρέπει στο μοντέλο να διακόπτει einen χρήστη εν μέσω πρότασης, να αντιδρά σε οπτικά σήματα χωρίς να ζητηθεί, ή να μιλάει ταυτόχρονα με τον χρήστη για εργασίες όπως η ζωντανή μετάφραση.
Η αρχιτεκτονική παραλείπει τους βαρείς αυτόνομους κωδικοποιητές. Ο ήχος εισάγεται ως δMel χαρακτηριστικά μέσω eines ελαφριού στρώματος ενσωμάτωσης, οι εικόνες χωρίζονται σε τμήματα 40×40, και όλα τα components είναι συν-εκπαιδευμένα από την αρχή με τον μετασχηματιστή. Ένα ξεχωριστό υπόβαθρο μοντέλο εκτελείται ασύγχρονα, χειρίζεται βαθύτερη σκέψη, κλήσεις εργαλείων και περιήγηση στο διαδίκτυο ενώ το μοντέλο σύνδεσης παραμένει παρόν στη συζήτηση.
Σύμφωνα με τις αναφερόμενες μετρήσεις της εταιρείας, το TML-Interaction-Small καταγράφει μια καθυστέρηση λήψης σειράς 0,40 δευτερολέπτων στο FD-bench V1, σε σύγκριση με 1,18 δευτερόλεπτα για το GPT-Πραγματικού Χρόνου-2.0 στη λειτουργία ελάχιστης σκέψης και 0,57 δευτερόλεπτα για το Gemini-3.1-flash-live. Στο FD-bench V1.5, το οποίο βαθμολογεί την ποιότητα σύνδεσης σε διακοπές χρηστών, οπτικά σήματα και ομιλία υπόβαθρου, το μοντέλο βαθμολογείται με 77,8 έναντι 46,8 για το GPT-Πραγματικού Χρόνου-2.0 ελάχιστης σκέψης και 45,5 για το Gemini-3.1-flash-live στη λειτουργία υψηλής σκέψης. Οι αριθμοί είναι αυτοαναφερόμενοι.
Μια Μακροχρόνια Πρώτη Αποστολή
Η κυκλοφορία κλείνει ένα μεγάλο χάσμα μεταξύ χρηματοδότησης και προϊόντος. Η Thinking Machines ιδρύθηκε τον Φεβρουάριο του 2025 και τον Ιούλιο του ίδιου έτους έκλεισε μια στροφή 2 δισεκατομμυρίων δολαρίων με αξία 12 δισεκατομμυρίων δολαρίων — ευρέως αναφερόμενη ως η μεγαλύτερη στροφή σεξ στο ρεκόρ. Η στροφή οδηγήθηκε από την Andreessen Horowitz με τη συμμετοχή της Nvidia, AMD, Cisco, Accel, ServiceNow και Jane Street. Μέχρι τώρα, το μόνο προϊόν που έχει αποσταλεί από την εταιρεία είναι το Tinker, μια API για την επιμερισμό ανοιχτών μοντέλων που κυκλοφόρησε τον Οκτώβριο του 2025.
Οι ενδιάμεσες μήνες έφεραν τουρμπουλάνς. Οι συνιδρυτές Barret Zoph και Luke Metz έφυγαν τον Ιανουάριο του 2026 για να επιστρέψουν στην OpenAI, με την Murati να ανακοινώνει ότι η εταιρεία είχε “διαχωριστεί” από τον Zoph. Ο Andrew Tulloch έφυγε για τα Superintelligence Labs της Meta μετά από μια αναφερόμενη προσφορά 1 δισεκατομμυρίου δολαρίων από τον Mark Zuckerberg για να αγοράσει την εταιρεία. Η Meta έχει από τότε προσλάβει πέντε ιδρυτικά μέλη του εργαστηρίου. Η Murati ανταποκρίθηκε προωθώντας τον Soumith Chintala, συνδημιουργό του PyTorch, σε CTO. Μια αναφερόμενη στροφή χρηματοδότησης σε αξία περίπου 50 δισεκατομμυρίων δολαρίων δεν έκλεισε μέχρι το τέλος του 2025.
Η ιστορία υπολογισμού κινήθηκε στην αντίθετη κατεύθυνση. Τον Μάρτιο, η Thinking Machines ανακοίνωσε μια συνεργασία με την Nvidia που καλύπτει μια μη αναφερόμενη επένδυση και την ανάπτυξη τουλάχιστον ενός γιγαβάτ της επόμενης γενιάς Vera Rubin συστημάτων. Το εργαστήριο επέκτεινε επίσης τη σχέση του με τη Google Cloud για την κάλυψη της εκπαίδευσης μοντέλων μετώπου σε υλικό Nvidia GB300.
Τι Να Παρακολουθήσετε
Το μοντέλο σύνδεσης δεν είναι ακόμη διαθέσιμο σε επιχειρήσεις ή στο κοινό. Η Thinking Machines λέει ότι μια περιορισμένη προεπισκόπηση έρευνας θα ανοίξει σε επιλεγμένους συνεργάτες τους επόμενους μήνες, με μια ευρύτερη κυκλοφορία αργότερα το 2026. Η εταιρεία επίσης σχεδιάζει να κυκλοφορήσει μεγαλύτερα μοντέλα σύνδεσης, σημειώνοντας ότι η τρέχουσα έκδοση 276B παραμέτρων είναι η μικρότερη εκδοχή που μπορεί να εξυπηρετήσει στην απαιτούμενη καθυστέρηση.
Η ανεξάρτητη επαλήθευση των αξιώσεων μετρήσεων είναι το άμεσο ερώτημα. Το FD-bench είναι ένα από τα λίγα δημόσια μετρήματα που στοχεύουν στην ποιότητα σύνδεσης, και τα αποτελέσματα της Thinking Machines δεν έχουν ακόμη αναπαραχθεί από τρίτους υπό ρεαλιστικές φόρτους. Οι δοκιμές προωθητικής που εισήγαγε η εταιρεία για οπτικά σήματα, συμπεριλαμβανομένων προσαρμοσμένων εκδόσεων του RepCount-A, ProactiveVideoQA και Charades, είναι νέα όργανα χωρίς μια καθιερωμένη βάση.
Η στρατηγική στοίχημα είναι πιο κατευθυνόμενο. Ενώ η OpenAI, η Anthropic και η Google έχουν περάσει το τελευταίο χρόνο推ώντας αυτόνομες ικανότητες एजέντων, η Thinking Machines στοιχηματίζει ότι ο επόμενος άξονας ανταγωνισμού θα είναι πώς οι άνθρωποι επικοινωνούν με την AI — πιο κοντά σε μια συνεχής συνομιλία παρά σε μια σειρά προτροπών. Το μοντέλο σύνδεσης ανταγωνίζεται πιο直接ικά με τα συστήματα φωνητικής AI σε πραγματικό χρόνο που αποστέλλονται από την OpenAI, τη Google και μια αυξανόμενη βαθμίδα startups που επικεντρώνονται στη φωνή. Εάν η αρχιτεκτονική επιβιώσει της επαφής με τις φόρτους παραγωγής — μακρές συνεδρίες, αξιόπιστες συνδέσεις και τους περιορισμούς ασφαλείας της άρνησης σε πραγματικό χρόνο — είναι το τεστ που θα επιβληθεί στην επόμενη προεπισκόπηση.












