تمويل
مبتكر AlphaGo يجمع أموالًا kỷطة بقيمة 1 مليار دولار لإنشاء الذكاء الاصطناعي بدون نماذج اللغة الكبيرة

ديفيد سيلفر، رائد التعلم التعزيزي الذي قاد إنشاء التعلم التعزيزي في جوجل ديب مايند، يجمع أموالًا kỷطة بقيمة 1 مليار دولار لشركة إنيفابل إن텔يجنس، وهي شركة أبحاث لندنية تعتمد على فكرة أن النماذج اللغة الكبيرة هي الطريق الخطأ إلى الذكاء الاصطناعي الفائق.
الصفقة، بقيادة شركة سيكويا كابيتال، ستكون أكبر جولة بذور يتم إغلاقها من قبل شركة أوروبية إذا تم التأكيد عليها. إنفيديا، جوجل، ومايكروسوفت في محادثات للمشاركة، على الرغم من استمرار المفاوضات وتغيير الشروط النهائية. تقدر الجولة شركة عند 4 مليارات دولار قبل الأموال.
سيلفر، الذي شغل منصب نائب الرئيس للتعلم التعزيزي في ديب مايند، أضاف شركة إنيفابل إن텔يجنس بشكل صامت في نوفمبر 2025 وعين مديرًا في يناير 2026. مهمة الشركة، كما وصفها سيلفر، هي بناء “ذكاء فائق يتعلم بلا نهاية ويكتشف أسس جميع المعارف”.
وصف يحتوي على تحدي متعمد. في صناعة تنفق مئات المليارات من الدولارات لتوسيع نماذج اللغة الكبيرة المتدربة على نصوص الإنترنت، يجادل سيلفر بأن هذا النهج كله له سقف.
حالة ضد بيانات الإنسان
أطروحة سيلفر تستند مباشرة إلى العمل الذي جعله مشهورًا. في عام 2017، مدير ديب مايند ديميس هاسابيس وسيلفر نشرا ألفا غو زيرو، إصدارًا من ألفا غو تعلم بالكامل من خلال اللعب الذاتي مع صفر بيانات ألعاب بشرية. فازت بنسبة 100 مباراة إلى صفر.
النتيجة أذهلت مجتمع الذكاء الاصطناعي. نظام تعلم من الصفر، من خلال التفاعل والمكافأة فقط، لم يكن مجرد مطابقة للمعرفة البشرية – بل تجاوزها بدرجة كبيرة لدرجة أن الإصدار المدرب على بيانات بشرية لم يتمكن من الفوز بمباراة واحدة.
وسيلفر مدد هذا النهج من خلال ألفا زيرو، الذي أتقن الشطرنج والشوجي وغو من الصفر، وموزيرو، الذي تعلم التخطيط دون أن يُ告ى حتى بقواعد اللعبة التي كان يلعبها. كل نظام عزز الاستنتاج نفسه: الأداء الأفضل يأتي ليس من تقليد البشر ولكن من التعلم من خلال الخبرة.
في بودكاست ديب مايند مسجلة قبل مغادرته، وصف سيلفر عهدين للذكاء الاصطناعي: “عصر البيانات البشرية” الحالي و “عصر الخبرة” القادم. يعتمد النماذج اللغة الكبيرة المعاصرة، كما جادل، على بيانات بشرية واعتراف، مما يخلق قيودًا متأصلة. يتطلب طريق الذكاء الاصطناعي الفائق الانتقال إلى ما وراء المعرفة البشرية تمامًا.
هذا هو فلسفة “مدرسة ألبيرتا” – سميت على اسم جامعة ألبيرتا، حيث درس سيلفر تحت إشراف رائد التعلم التعزيزي ريتش سوتون. جادل مقال سوتون المؤثر عام 2019 “الدرس المر” بأن الأساليب التي تعتمد على المعرفة البشرية تفقد في النهاية للأساليب التي توسع الحوسبة والتعلم. يبني سيلفر شركة بأكملها على هذا المبدأ.
سباق شركة الذكاء الفائق
سيلفر ليس أول باحث نخبة يغادر مختبرًا رئيسيًا وجمع مبالغ استثنائية لشركة تركز على الذكاء الفائق. إيليا سوتسكيفير، رئيس عالمي سابقي في أوبن آي آي، أطلق شركة الذكاء الفائق الآمن في عام 2024 مع أطروحة مماثلة – أن جهودًا مركزة خارج ضغوط شركة المنتجات يمكن أن تصل إلى الذكاء الفائق بشكل أسرع. جمع سSI منذ ذلك الحين مليارات الدولارات بتقييم يزيد عن 30 مليار دولار.
التوازي معلم. غادر كل من الباحثين المنظمات التي ساهموا في تعريفها. يعتقد كلاهما أن النموذج الحالي – توسيع نماذج اللغة الكبيرة وبيع اشتراكات الدردشة – هو طريق مسدود. وجذبا رأس مالًا ضخمًا بقوة سمعتهم فقط، قبل إنتاج أي منتج أو نشر أي نتائج.
لكن النهج يختلف. قال سوتسكيفير القليل علنًا عن اتجاه سSI الفني. سيلفر، من ناحية أخرى، كان صريحًا: التعلم التعزيزي، اللعب الذاتي، والتعلم من المبادئ الأولى – وليس نماذج اللغة. حيث يتناقش معظم مختبرات الذكاء الاصطناعي حول كيفية جعل نماذج اللغة الكبيرة تعمل بشكل أفضل، يسأل سيلفر عما إذا كان يجب أن تكون الأساس على الإطلاق.
كما يعكس جولة البذور البالغة 1 مليار دولار كيف تغيرت مساحة تمويل الذكاء الاصطناعي بشكل كبير. اقتربت أنثروبك مؤخرًا من تقييم يبلغ 350 مليار دولار. زادت الضغط التنافسي في الذكاء الاصطناعي المتقدم حيث تشحن أوبن آي آي، جوجل، وإنثروبك نماذج جديدة بسرعة متزايدة. في هذا السياق، يعتبر تقييم ما قبل الأموال البالغ 4 مليارات دولار لشركة ما قبل المنتج بقيادة باحث واحد هو العادي الجديد.
لمنح سيكويا، الذي يقود الجولة من خلال الشريك الإداري ألفريد لين والشريك سونيا هوانغ، الرهان بسيط: سيلفر هو واحد من خمسة أشخاص على قيد الحياة الذين يطالبون ببناء أنظمة فعلًا تتجاوز الذكاء البشري في مجالات محددة. إذا كان التعلم التعزيزي هو الطريق الصحيح إلى الذكاء الفائق العام، فهو الشخص الأكثر احتمالا للعثور عليه.
الخطر واضح أيضًا. نجحت ألفا غو وألفا زيرو في مجالات ذات قواعد واضحة، ومعلومات كاملة، وإشارات مكافأة محددة جيدًا. العالم الحقيقي لا يحتوي على أي من هذه الخصائص. توسيع اللعب الذاتي ما وراء الألعاب إلى مجالات مفتوحة – العلوم، الهندسة، التفكير – هو مشكلة غير محلولة التي قضى سيلفر نفسه سنوات العمل عليها في ديب مايند دون كسر واضح.
تضع قاعدة إنيفابل إن텔يجنس في لندن أيضًا الشركة كمرسى محتمل لطموحات أوروبا في مجال الذكاء الاصطناعي. أنتجت القارة باحثين رائدين في مجال الذكاء الاصطناعي، لكنها عانَت من صعوبة الاحتفاظ بهم حيث تقدم مختبرات أمريكية رواتب أكبر وبنية تحتية أسرع. تدل جولة البذور الأوروبية البالغة 1 مليار دولار، مدعومة من شركة رأس المال الرائدة في وادي السيليكون، على أن جغرافيا أبحاث الذكاء الاصطناعي المتقدم قد تتوسع – على الرغم من أنه من الجدير بالذكر أن سيكويا، إنفيديا، جوجل، ومايكروسوفت جميعها مستثمرين أمريكيون.
رهان سيلفر هو أن تركيز الصناعة على نماذج اللغة الكبيرة يمثل أقصى حد محلي – مثير للإعجاب ولكن في النهاية محدود. السؤال هو ما إذا كان التعلم التعزيزي يمكنه الهروب من البيئات المسيطرة التي نجح فيها ويعمل في العالم الحقيقي المضطرب والمبهم. يُظهر مليار دولار ومسيرة بنيت على إثبات المخالفة أن سيلفر يعتقد أنه يمكن.












