الذكاء الاصطناعي
مختبر آلات الفكر يرسل أول نموذج مع تفاعل في الوقت الفعلي 200 مللي ثانية

مختبر آلات الفكر، وهو شركة ناشئة في مجال الذكاء الاصطناعي تأسست من قبل المدير التنفيذي السابق لشركة OpenAI ميرا موراتي، أطلقت معاينة بحثية لنموذجها الأول داخل الشركة في 11 مايو 2026، مما أنهى أكثر من سنة من الصمت حول ما ستبني الشركة بالفعل. وتسمي الشركة النظام “نموذج التفاعل” – وهو بنية متعددة الوضع تم تدريبه من الصفر لمعالجة الصوت والفيديو والنص في قطع من 200 مللي ثانية بدلاً من الانتظار حتى ينهي المستخدم الدورة.
النموذج، الذي يُسمى TML-Interaction-Small، هو نظام مكون من 276 مليار معامل ومزيج من الخبراء مع 12 مليار معامل نشط. وفقًا لمنشور مدونة الإعلان التابعة للشركة ، إنه أول منتج من مختبر تمraising حوالي 2 مليار دولار بمูลاه 12 مليار دولار دون شحن أي شيء بخلاف أداة ضبط دقيق تم إطلاقها في أكتوبر 2025.
ما الذي يفعله نموذج التفاعل بالفعل
يجادل مختبر آلات الفكر بأن نماذج الحدود الحالية – بما في ذلك GPT-Realtime من OpenAI وGemini Live من Google – تثبت سلوكًا في الوقت الفعلي على معمارية دورية باستخدام “حزام” من المكونات الخارجية مثل كشف نشاط الصوت. تلك المكونات تقرر متى توقف المستخدم عن التحدث، ثم تسلم العبارة المنتهية إلى النموذج. بينما يولد النموذج ردًا، تصبح تصوره للعالم مجمدًا.
يستبدل نموذج التفاعل ذلك الهيكل بما يسميه الشركة “دورات دقيقة متزامنة مع الوقت”. النظام يعالج باستمرار 200 مللي ثانية من الإدخال أثناء توليد 200 مللي ثانية من الإخراج، مع تداخل بين تدفقات الرموز على نفس دورة الساعة. هذا الهيكل يسمح للنموذج بقطع كلام المستخدم في منتصف الجملة، أو الاستجابة للإشارات البصرية دون سؤال، أو التحدث بالتزامن مع المستخدم لمهام مثل الترجمة الحية.
يتجاوز البنية معالجات التشفير المستقلة الثقيلة. يتم تغذية الصوت كسمات dMel من خلال طبقة تضمين خفيفة، يتم تقسيم الصور إلى قطع بحجم 40×40، وجميع المكونات يتم تدريبها معًا من الصفر مع المحول. يعمل نموذج خلفي منفصل بشكل غير متزامن، ويدير التفكير الأعمق، واستدعاء الأدوات، والتصفح على الويب، بينما يبقى نموذج التفاعل حاضرًا في المحادثة.
على معايير الشركة المبلغ عنها، يبلغ TML-Interaction-Small تأخير الدورة من 0.40 ثانية على FD-bench V1، مقارنةً ب 1.18 ثانية لـ GPT-Realtime-2.0 في وضع التفكير الأدنى و 0.57 ثانية لـ Gemini-3.1-flash-live. على FD-bench V1.5، الذي يقيم جودة التفاعل عبر مقاطعة المستخدم، والقنوات الخلفية، والكلام الخلفي، يصل النموذج إلى 77.8 مقابل 46.8 لـ GPT-Realtime-2.0 الأدنى و 45.5 لـ Gemini-3.1-flash-live في وضع التفكير الأعلى. الأرقام مبلغ عنها ذاتيًا.
الرحلة الأولى التي طال انتظارها
الإطلاق يغلق فجوة طويلة بين التمويل والمنتج. تم تأسيس مختبر آلات الفكر في فبراير 2025 وفي يوليو من ذلك العام أغلق جولة بذرة بقيمة 2 مليار دولار بمูลاه 12 مليار دولار – كما تم الإبلاغ على نطاق واسع كأكبر جولة بذرة في السجلات. قادت الجولة Andreessen Horowitz مع مشاركة من Nvidia و AMD و Cisco و Accel و ServiceNow و Jane Street. حتى الآن، كان المنتج الوحيد الذي أطلقته الشركة هو Tinker، وهو واجهة برمجة تطبيقات لضبط النماذج المفتوحة التي تم إطلاقها في أكتوبر 2025.
أحضرت الأشهر الفاصلة اضطرابات. غادر المؤسسان باريت زوف ولوك ميتز في يناير 2026 للعودة إلى OpenAI، مع إعلان موراتي أن الشركة “انفصلت” عن زوف. غادر أندرو تولوتش إلى معمل الذكاء الخارق في Meta بعد أن رفض عرض مارك زوكربيرج البالغ مليار دولار لشراء الشركة بالكامل. منذ ذلك الحين، وظفت Meta خمسة من أعضاء المؤسسين للمختبر. استجابت موراتي من خلال ترقية سوميث تشينتالا، أحد مبتكري PyTorch، إلى منصب المدير التقني. لم تُغلق جولة متابعة بمولاه تقريبًا 50 مليار دولار بحلول نهاية 2025.
قصة الحوسبة انتقلت في الاتجاه المعاكس. في مارس، أعلن مختبر آلات الفكر شراكة مع Nvidia تغطي استثمارًا غير معلن عنه ونشر ما لا يقل عن غيغاواط واحد من أنظمة Vera Rubin الجديدة. كما وسع المختبر علاقته مع Google Cloud لتغطية تدريب نماذج الحدود على أجهزة Nvidia GB300.
ماذا يجب ملاحظته
نموذج التفاعل ليس متاحًا للشركات أو الجمهور بعد. يقول مختبر آلات الفكر إن معاينة بحثية محدودة ستفتح للشركاء المختارين في الأشهر القادمة، مع إطلاق أوسع لاحقًا في 2026. كما يخطط المختبر لإطلاق نماذج تفاعل أكبر، مشيرًا إلى أن الإصدار الحالي البالغ 276 مليار معامل هو أصغر إصدار يمكنه تقديم اللاتنسية المطلوبة.
التحقق المستقل من مطالبات البenchmarks هو السؤال الفوري. FD-bench هو واحد من القليل من المعايير العامة التي تستهدف جودة التفاعل، ولم يتم إعادة إنتاج نتائج مختبر آلات الفكر بعد من قبل أطراف ثالثة تحت حمولة واقعية. الاختبارات الاستباقية التي قدمها المختبر للاشارات البصرية، بما في ذلك الإصدارات المعدلة من RepCount-A و ProactiveVideoQA و Charades، هي أدوات جديدة بدون قاعدة معيارية.
الرهان الاستراتيجي أكثر حدة. بينما قامت OpenAI و Anthropic و Google بمهاجمة قدرات الوكيل المستقل خلال العام الماضي، يراهن مختبر آلات الفكر على أن المحور التالي للمنافسة سيكون كيف يتواصل البشر مع الذكاء الاصطناعي – أقرب إلى محادثة مستمرة من سلسلة من التحفيزات. يتنافس نموذج التفاعل بشكل مباشر مع نظم الذكاء الاصطناعي الصوتية في الوقت الفعلي التي يتم شحنها من OpenAI و Google وطبقة متزايدة من الشركات الناشئة التي تركز على الكلام. سواء كان الهيكل يتحمل الاتصال بالحمولة الإنتاجية — الجلسات الطويلة، والاتصال غير الموثوق، وقيود السلامة للرفض في الوقت الفعلي — هو الاختبار الذي سفرضه الجولة التالية للمعاينة.












