قادة الفكر
قد تكون البيانات التي يتم إنشاؤها بواسطة الألعاب أكثر الموارد قيمة والتي لا تقدر في تدريب الذكاء الاصطناعي

قضت شركات الذكاء الاصطناعي الخمسة سنوات الماضية في استهلاك كل قطعة من النص، وكل صورة، وكل قطعة من البيانات المتاحة بشكل عام على الإنترنت. هذه الإمدادات محدودة، ونحن نقترب من النقطة التي لا توجد فيها بيانات كافية لاستمرار وتحقيق التقدم الذي اعتمدت عليه.
然而، هناك مرشح واضح تم تجاهله من قبل ngành الذكاء الاصطناعي.
أنا أبني أنظمة ألعاب للأعيش، والبيانات التي تتدفق من خلالها كل يوم هي مثل أي شيء لم يعمل معه معظم باحثي الذكاء الاصطناعي. ومع ذلك، لا يبدو أن أحدًا خارج صناعة الألعاب يولي انتباهًا لها.
توليد منصات الألعاب تيرابايتات من البيانات السلوكية كل يوم، تيار من القرارات في الوقت الفعلي، والنشاط الاقتصادي، والتفاعل الاجتماعي، كل ذلك داخل بيئات بنيت على قواعد فيزيائية متسقة.
لم يتم استخدام hầuلا هذه البيانات لتدريب الذكاء الاصطناعي. والشركات التي استخدمتها، من ديب مايند إلى إنفيديا، أنتجت بعض الإنجازات الأكثر أهمية في هذا المجال.
مشكلة بيانات الذكاء الاصطناعي
دراسة من Epoch AI تتنبأ بأن مخزون النصوص المتاحة للجمهور، التي تم إنشاؤها بواسطة الإنسان، سوف يتم استهلاكها تمامًا في مكان ما بين 2026 و2032. النماذج التي تقف وراء ChatGPT وGemini وClaude قد استهلكت أساسًا كل ما تقدمه الإنترنت.
البيانات الاصطناعية أو النص الذي يولده الذكاء الاصطناعي لتغذية الذكاء الاصطناعي هي حل بديل يعتمد عليه ngành. ولكن النماذج التي يتم تدريبها على مخرجاتها تدهور مع مرور الوقت من خلال ظاهرة وثقتها الباحثون يسمونها انهيار النموذج.
ما أعتقد أنه يحتاجه المجال هو معلومات غنية ومتفاعلة ومتعددة الأوجه حيث يحدث السبب والنتيجة في الوقت الفعلي وكل عمل له نتيجة قابلة للقياس. الألعاب تنتج ذلك بالضبط، وتفعل ذلك بمقياس لا يمكن أن يطابق أي شيء آخر.
تضغط منصات الألعاب تيرابايتات من البيانات السلوكية من خلال أنظمتها كل يوم. حركات اللاعب، والخيارات الاستراتيجية، وأوقات الاستجابة، والمعاملات الاقتصادية، والتفاعلات الاجتماعية كلها تتدفق من خلال تيارات متسلسلة وموسومة بالزمن التي لم يلمسها معظم باحثي الذكاء الاصطناعي.
مقال أكاديمي حديث عن بيانات الألعاب يحدد تصنيفًا من تسعة فئات لهذه المعلومات ويجادل بأن الغالبية العظمى منها لا تزال غير مستغلة من قبل ngành الذكاء الاصطناعي.
يمكنني التأكيد على ذلك من تجربتي الخاصة. كمية البيانات التي تتدفق من خلال أنظمتنا للألعاب في أي يوم معين سوف تعتبر كنزًا في أي منطقة أخرى من البحث عن الذكاء الاصطناعي. في الألعاب، يتم فقط أرشفتها أو التخلص منها.
لماذا تكون بيانات الألعاب مختلفة
عندما تبني داخل محرك الألعاب لفترة طويلة، تبدأ في إدراك كمية البيانات المنظمة التي تجلس عليها والتي لم يطلبها أحد في الذكاء الاصطناعي بعد. كل جلسة تنتج فيزياء متزامنة وسلوك اللاعب وعلاقة سببية على مستوى النظام بمقياس يصعب العثور عليه في أي مكان آخر.
محركات الألعاب تفرض الفيزياء. الأشياء تسقط وتتصادم وتكسر وفقًا لقواعد متسقة، مما يعني أن البيانات تحتوي على علاقات سببية مخبأة على مستوى النظام بدلاً من الأنماط التي يجب على النموذج تخمينها من خلال علاقات النص.
عندما يطلق اللاعب قذيفة، يحسب المحرك المسار وال مقاومة الهواء والصدم. الذكاء الاصطناعي يتعلم من بيئة تظهر الفيزياء بشكل مباشر من خلال كل互одействة، بدلاً من بيئة تعامل القواعد الفيزيائية كتقريب إحصائي.
هناك أيضًا مشكلة التوجيه المتعدد. في اللعبة، البيانات البصرية، والإشارات الصوتية، ومدخلات اللاعب، وحالة البيئة كلها تحدث في نفس الوقت وتسجل معًا. هذا النوع من التزامن الطبيعي يكلف ثمنًا باهظًا لتحقيقه في مجموعات البيانات في العالم الحقيقي، حيث يضطر الباحثون عادةً إلى وضع علامات وتنسيق كل نمط يدويًا.
الألعاب تنتج حالات حافة بمقياس كبير، أيضًا، من خلال توليد المحتوى الإجرائي. لا مانز سكاي يحتوي على 18 كوينتيليون كوكب فريد، وللذكاء الاصطناعي، هذا التباين يهم بشكل كبير لأن حالات الحافة تحدد ما إذا كان النموذج يعمل بشكل موثوق أو يفشل بشكل خطير.
ثم هناك التعقيد الناشئ، الذي قد يكون أكثر الخاصية قيمة. عندما وضع OpenAI وكلاء في لعبة إخفاء وبحث بسيطة، طور هؤلاء الوكلاء ست مراحل من الاستراتيجية المتطورة بالكامل بمفردهم على مدار مئات الملايين من الجولات.
بنوا الملاجئ من الأشياء القابلة للنقل، واستخدموا منحدرات لاختراق التحصينات، وحتى استغلوا شقوق الفيزياء لركوب الصناديق فوق الجدران. لم يتم برمجة أي من ذلك. كل ذلك ظهر من المنافسة داخل بيئة اللعبة، دون سطر واحد من الشفرة التي أخبرتهم بفعله.
ذلك النوع من التعقيد الذاتي التولد هو بالضبط ما يحتاجه البحث عن الذكاء الاصطناعي بمقياس كبير، والألعاب هي البيئات الوحيدة التي تنتج ذلك بشكل موثوق دون الرقابة البشرية المكلفة.
من لوحات الألعاب إلى جوائز نوبل
أدلة واضحة على أن الذكاء الاصطناعي المدرب على الألعاب يمكن نقلها إلى العالم الحقيقي هو نظام فاز بجائزة نوبل، وهو المثال الذي أعود إليه دائمًا عندما يسألني الناس لماذا بنيت مسيرتي حول الألعاب والذكاء الاصطناعي.
بدأت ديب مايند مع AlphaGo في 2016، ثم بنت AlphaZero، نظامًا علّم نفسه الشطرنج، والغو، والشوجي دون أي معرفة بشرية. أصبح هيكل AlphaZero أساسًا ل AlphaFold، الذي حل مشكلة طي البروتين التي تبلغ من العمر 50 عامًا وحصلت على جائزة نوبل في الكيمياء 2024.
كان ديب مايند سي إي أو ديميس هاسابيس مفتوحًا حول هذا الخط الأنابيب. قال للمجلة العلمية الأمريكية إن الألعاب لم تكن الهدف النهائي ولكنها كانت أكثر الطرق كفاءة لتطوير وتجريب تقنيات الذكاء الاصطناعي قبل تطبيقها على مشاكل علمية حقيقية.
تذكر أنني قرأت ذلك وشعرت أن شخصًا ما قد صاغ بالضبط ما كنت أراه من داخل تطوير الألعاب لسنوات.
تكررت هذه المسار عبر المجال. بيئات التعلم بالتعزيز التي قامت OpenAI بتوحيدها أولًا من خلال Gymnasium теперь تدعم البحث في الروبوتات، والمركبات المستقلة، والآلات الصناعية.
الهيكل الشبيه بلعبة الوكيل، والبيئة، والعمل، والجائزة أصبح الإطار الافتراضي لأي نظام ذكاء اصطناعي يحتاج إلى التفاعل مع العالم المادي.
الألعاب كطبقة المحاكاة الجديدة
في ديسمبر 2025، أصدرت إنفيديا NitroGen، نموذج أساسي تم تدريبه على 40,000 ساعة من لعب الألعاب عبر أكثر من 1,000 عنوان. يشاهد النموذج مقاطع فيديو لعب متاحة للجمهور، ويستخرج إجراءات اللاعب من شاشات التحكم، ويتعلم لعب الألعاب مباشرة من البكسل الخام.
على ألعاب لم يتعرف عليها من قبل، أظهر NitroGen حتى 52% تحسنًا في نجاح المهمة مقارنة بالنماذج المدربة من الصفر. ولكن الأهمية الحقيقية تكمن في الهيكل الأساسي.
يعمل NitroGen على إطار عمل روبوتات إنفيديا GR00T، نفس الأساس الذي تستخدمه الشركة للمحاكاة الفيزيائية والتحويل من المحاكاة إلى الواقع في منصة إسحاق سيم. الوكيل اللعبة والروبوت المصنع يشاركان نفس النظام الأساسي.
وصف جيم فان المشروع بأنه محاولة لبناء “GPT للأفعال”، نموذج عام الغرض يتعلم العمل في أي بيئة.
كشخص يبني أنظمة ألعاب تنتج بالضبط نوع البيانات التي يستهلكها هذه النماذج، أجد صعوبة في التأكيد على ما يعنيه ذلك لصناعة أعمل فيها.
وهذا لا يقتصر على إنفيديا. سجلت Waymo أكثر من 20 مليار ميل محاكى لتدريب مركباتها المستقلة، كل ذلك في بيئات شبيهة بلعبة تكرر سيناريوهات خطرة أو نادرة جدًا للاختبار على الطرق الحقيقية.
أظهرت منصات الجراحة التي بنيت على محركات الألعاب تحسينات كبيرة في أداء المتدربين. يستخدم المخططون الحضريون أدوات مماثلة لتحسين حركة المرور على مستوى المدينة.
أظهرت منصات الجراحة التي بنيت على محركات الألعاب تحسينات كبيرة في أداء المتدربين. يستخدم المخططون الحضريون أدوات مماثلة لتحسين حركة المرور على مستوى المدينة. أصبحت محركات الألعاب طبقة محاكاة عالمية في أي مكان يحتاج الذكاء الاصطناعي إلى التعلم من خلال التفاعل مع بيئته.
البنية التحتية التي لا يتحدث عنها أحد
عندما يناقش الناس بنية الذكاء الاصطناعي، عادةً ما يعني ذلك مراكز البيانات، وكلusters الجرافيك، والحوسبة. في كل السنوات التي عملت فيها في الألعاب، يمكنني أن أحسب على يدي عدد المرات التي سمعت فيها شخصًا في فضاء الذكاء الاصطناعي ي提ون بيئات الألعاب في نفس النفس. هذا الفصل سوف يغلق بسرعة.
سوف يصبح هذا أكثر وضوحًا مع انتهاء مجموعات البيانات التقليدية. الصناعات التي تنتج أغنى بيانات تفاعلية سوف تتحرك حتمًا نحو مركز البحث عن الذكاء الاصطناعي، والألعاب، والمحاكاة، والعوالم الافتراضية هي في موقع أفضل من أي شيء آخر لتلبية هذا الفجوة.
الأموال تتبع بالفعل هذا الاتجاه. كان قيمة الذكاء الاصطناعي في قطاع الألعاب 4.54 مليار دولار في 2025 ومن المتوقع أن يصل إلى 81 مليار دولار بحلول 2035.
معظم استوديوهات الألعاب التي أتحدث معها لا تزال تعتبر نفسها شركات ترفيهية. لكن عندما تنتج أنظمتك البيانات الدقيقة التي يحتاجها الجيل التالي من نماذج الذكاء الاصطناعي للتدريب عليها، أنت في ngành البنية التحتية سواء كنت تخطط لذلك أو لا.












