Connect with us

قد تكون البيانات التي يتم توليدها من الألعاب أكثر الموارد قيمة التي تُقلل من قيمتها في تدريب الذكاء الاصطناعي

قادة الفكر

قد تكون البيانات التي يتم توليدها من الألعاب أكثر الموارد قيمة التي تُقلل من قيمتها في تدريب الذكاء الاصطناعي

mm

قضت شركات الذكاء الاصطناعي الخمس سنوات الماضية في استهلاك كل قطعة من النص، وكل صورة، وكل قطعة من البيانات المتاحة للجمهور على الإنترنت. هذا الإمداد محدود، ونحن نقترب من النقطة التي لن يكون هناك ما يكفي من البيانات لاستمرار وتيرة التقدم الذي اعتمدت عليه.

然而، هناك مرشح واضح تم تجاهله إلى حد كبير من قبل ngành الذكاء الاصطناعي.

أنا أبني أنظمة ألعاب للأعيش، والبيانات التي تتدفق من خلالها كل يوم هي مثل أي شيء لم يعمل معه معظم باحثي الذكاء الاصطناعي. ومع ذلك، لا يبدو أن أحدا خارج مجال الألعاب يولي اهتماما لها.

توليد منصات الألعاب تيرابايتات من بيانات السلوك كل يوم، تيار من القرارات في الوقت الفعلي، والنشاط الاقتصادي، والتفاعل الاجتماعي، كل ذلك داخل بيئات بنيت على قواعد فيزيائية متسقة.

لم يتم استخدام hầuلى هذه البيانات لتدريب الذكاء الاصطناعي. والشركات التي استخدمتها، من ديب مايند إلى إنفيديا، أنتجت بعض أكبر الإنجازات في هذا المجال.

مشكلة بيانات الذكاء الاصطناعي

دراسة من إيبوتش آي تتنبأ بأن مخزون النصوص المتاحة للجمهور، التي تم إنشاؤها بواسطة البشر، سوف يتم استهلاكه بالكامل في مكان ما بين 2026 و 2032. وقد استهلكت النماذج التي تقف وراء تشات جي بي تي، جيميني، وكلود أساسا كل ما تقدمه الإنترنت.

البيانات الاصطناعية أو النص الذي يولد بواسطة الذكاء الاصطناعي لتغذية الذكاء الاصطناعي هي حيلة العمل حولها في ngành. ولكن النماذج التي يتم تدريبها على مخرجاتها تدهور مع مرور الوقت من خلال ظاهرة وثقتها الباحثون يسمونها انهيار النموذج.

ما أعتقد أن المجال يحتاجه هو معلومات غنية ومتفاعلة ومتعددة الأوضاع حيث يحدث السبب والنتيجة في الوقت الفعلي وكل عمل له نتيجة قابلة للقياس. تنتج الألعاب تماما هذا، وتفعل ذلك بمقياس لا يتعادل معه شيء تقريبا.

تضغط منصات الألعاب تيرابايتات من بيانات السلوك عبر أنظمتها كل يوم. حركات اللاعب، والخيارات الاستراتيجية، وأوقات الاستجابة، والمعاملات الاقتصادية، والتفاعلات الاجتماعية كلها تتدفق عبر تيارات متسلسلة وموسومة بالزمن التي لم يلمسها معظم باحثي الذكاء الاصطناعي.

مقال أكاديمي حديث حول بيانات الألعاب التي تم توليدها يحدد تصنيفا تسلسليا من تسعة فئات لهذه المعلومات ويفترض أن الغالبية العظمى منها لا تزال غير مستغلة من قبل ngành الذكاء الاصطناعي.

أستطيع التأكيد على ذلك من خبرتي الخاصة. كمية البيانات التي تتدفق عبر أنظمتنا للألعاب في أي يوم معين سوف تعتبر كنزا في أي مجال آخر من أبحاث الذكاء الاصطناعي. في الألعاب، يتم أرشفتها أو التخلص منها.

لماذا تكون بيانات الألعاب مختلفة

عندما تبني داخل محرك الألعاب لفترة طويلة، تبدأ في إدراك كمية البيانات المهيكلة التي تجلس عليها والتي لم يطلب منها أحد في الذكاء الاصطناعي بعد. كل جلسة تنتج فيزياء متزامنة وسلوك اللاعب وتأثيرات النظام في الوقت الفعلي بمقياس يصعب العثور عليه في أي مكان آخر.

محركات الألعاب تفرض الفيزياء. الأجسام تسقط وتتصادم وتكسر وفقا لقواعد متسقة، مما يعني أن البيانات تحمل علاقات سببية مخبأة على مستوى النظام وليس أنماطا التي يجب على النموذج تخمينها من خلال علاقات النص.

عندما يطلق اللاعب قذيفة، يحسب المحرك المسار وال مقاومة الهوائية والصدمة. يتعلم الذكاء الاصطناعي من بيئة تظهر الفيزياء مباشرة من خلال كل التفاعل، وليس بيئة تعامل القوانين الفيزيائية كتقريبات إحصائية.

هناك أيضا مشكلة المحاذاة متعددة الأوضاع. في اللعبة، البيانات البصرية، والإشارات الصوتية، ومدخلات اللاعب، وحالة البيئة كلها تحدث في نفس الوقت وتسجل معا. هذا النوع من التزامن الطبيعي يكلف ثمنا باهظا لإعادة إنشائه في مجموعات البيانات في العالم الحقيقي، حيث يضطر الباحثون عادة إلى وضع علامات وتنظيم كل وضعية يدويا.

توليد الألعاب حالات حافة بمقياس كبير، أيضا، من خلال توليد المحتوى الإجرائي. لا مانز سكاي имеет 18 كوينتيليون كوكب فريد، وللذكاء الاصطناعي، هذا التباين يهم بشكل كبير لأن حالات الحافة تحدد ما إذا كان النموذج يعمل بشكل موثوق أو يفشل بشكل خطير.

ثم هناك التعقيد الناشئ، الذي قد يكون أكثر الخاصية قيمة. عندما وضع أوبن آي آي وكلاء في لعبة إخفاء بسيطة، طور هؤلاء الوكلاء ست مراحل من الاستراتيجية المتطورة بالكامل بمفردهم خلال مئات الملايين من الجلسات.

بنوا الملاجئ من الأجسام القابلة للنقل، واستخدموا الرампات لتحطيم التحصينات، وحتى استغلوا أخطاء الفيزياء لركوب الصناديق فوق الجدران. لم يتم برمجة أي من ذلك. كل ذلك ظهر من المنافسة داخل بيئة اللعبة، دون سطر واحد من الشفرة التي أخبرتهم بفعل ذلك.

ذلك النوع من التعقيد الذاتي التوليد هو بالضبط ما يحتاجه بحث الذكاء الاصطناعي بمقياس كبير، والألعاب هي البيئات الوحيدة التي تنتجها بشكل موثوق دون الرقابة البشرية المكلفة.

من لوحات الألعاب إلى جوائز نوبل

أقوى دليل على أن الذكاء الاصطناعي الذي تم تدريبه على الألعاب يمكن نقل إلى العالم الحقيقي هو نظام فاز بجائزة نوبل، وهو المثال الذي أعود إليه دائما عندما يسألني الناس لماذا بنيت مسيرتي حول الألعاب والذكاء الاصطناعي.

بدأت ديب مايند مع ألفا غو في 2016، ثم بنت ألفا زيرو، نظام تعلم نفسه الشطرنج، والغو، والشوجي دون أي معرفة بشرية. أصبح هيكل ألفا زيرو أساسا لألفا فولد، الذي حلل مشكلة طي البروتين التي تبلغ من العمر 50 عاما وأحرزت فوزا لخلقتها جائزة نوبل في الكيمياء 2024.

كان ديب مايند سي إي أو ديميس هاسابيس مفتوحا حول هذا الخط. قال لمجلة ساينتيفيك أمريكان أن الألعاب لم تكن الهدف النهائي ولكنها كانت أكثر الطرق كفاءة لتطوير وتجربة تقنيات الذكاء الاصطناعي قبل تطبيقها على مشاكل علمية حقيقية.

تذكر أنني قرأت ذلك وشعرت أن شخصا ما قد صاغ بالضبط ما كنت أراه من داخل تطوير الألعاب لسنوات.

تكرر هذا المسار منذ ذلك الحين في جميع أنحاء المجال. بيئات التعلم بالتعزيز التي قامت أوبن آي آي بتوحيد معاييرها من خلال جيمناسيوم теперь تقوم بأساس أبحاث في الروبوتات، والمركبات المستقلة، والآلات الصناعية.

الهيكل الشبيه باللعبة للوكيل، والبيئة، والعمل، والجائزة بدأ كوسيلة بحثية واصبح الآن الإطار الافتراضي لأي نظام ذكاء اصطناعي يحتاج إلى التفاعل مع العالم المادي.

الألعاب كطبقة محاكاة جديدة

في ديسمبر 2025، أصدرت إنفيديا نيترو جن، نموذج أساسي تم تدريبه على 40,000 ساعة من لعب الألعاب عبر أكثر من 1,000 عنوان. يشاهد النموذج مقاطع فيديو لعب عامة، يستخرج إجراءات اللاعب من طبقات التحكم، ويتعلم لعب الألعاب مباشرة من البكسل الخام.

على ألعاب لم يتعرف عليها من قبل، أظهر نيترو جن تحسنا يصل إلى 52% في نجاح المهمة مقارنة بالنماذج التي تم تدريبها من الصفر. ولكن الأهمية الحقيقية تكمن في الهيكل الأساسي.

يعمل نيترو جن على إطار روبوتات إنفيديا جروت، نفس الأساس الذي تستخدمه الشركة للمحاكاة في منصة إساك سيم. الوكيل اللعبة والروبوت المصنع يشاركان نفس النظام الأساسي.

وصف جيم فان من إنفيديا المشروع على أنه محاولة لبناء “جي بي تي للأفعال”، نموذج عام الغرض يتعلم العمل في أي بيئة.

كشخص يبني أنظمة ألعاب تنتج بالضبط نوع البيانات التي يستهلكها هذه النماذج، أجد صعوبة في التأكيد على ما يعنيه ذلك لصناعة أعمل فيها.

وهذا ليس مقصورا على إنفيديا. سجلت وايمو أكثر من 20 مليار ميل محاكى لتدريب مركباتها المستقلة، كل ذلك في بيئات شبيهة بمحركات الألعاب التي تمثل سيناريوهات خطرة أو نادرة جدا لاختبارها على الطرق الحقيقية.

أظهرت منصات الجراحة التي بنيت على محركات الألعاب تحسينات دراماتيكية في أداء المتدربين. يستخدم المخططون الحضريون أدوات مماثلة لتحسين حركة المرور بمقياس المدينة.

أظهرت منصات الجراحة التي بنيت على محركات الألعاب تحسينات دراماتيكية في أداء المتدربين. يستخدم المخططون الحضريون أدوات مماثلة لتحسين حركة المرور بمقياس المدينة. أصبحت محركات الألعاب طبقة محاكاة عالمية في أي مكان يحتاج الذكاء الاصطناعي إلى التعلم من خلال التفاعل مع بيئته.

البنية التحتية التي لا يتحدث عنها أحد

عندما يناقش الناس بنية الذكاء الاصطناعي، يعتادون أن يعني ذلك مراكز البيانات، وكلスター جي بي يو، والحوسبة. في جميع السنوات التي عملت فيها في الألعاب، أستطيع أن أحسب على يدي عدد المرات التي سمعت فيها شخصا في فضاء الذكاء الاصطناعي ي提 ذكر بيئات الألعاب في نفس النفس. هذا الانقطاع سوف يغلق بسرعة جدا.

سوف يصبح هذا أكثر وضوحا مع انتهاء مجموعات البيانات التقليدية. ستتحرك الصناعات التي تنتج أغنى البيانات التفاعلية إلى مركز أبحاث الذكاء الاصطناعي، والألعاب، والمحاكاة، والعالم الافتراضي هي أفضل موضع لملء هذا الفجوة.

الاموال تتبع بالفعل هذا الاتجاه. كان قيمة الذكاء الاصطناعي في صناعة الألعاب 4.54 مليار دولار في 2025 ومن المتوقع أن تصل إلى 81 مليار دولار بحلول 2035.

معظم استوديوهات الألعاب التي أتحدث معها ما زالت تعتبر نفسها شركات ترفيهية. ولكن عندما تنتج أنظمتك البيانات التي يحتاجها الجيل التالي من نماذج الذكاء الاصطناعي لتدريبها، أنت في ngành البنية التحتية سواء كنت مخططا لذلك أم لا.

إيلمان شازهايف هو المؤسس والرئيس التنفيذي ل Dizzaract، أكبر استوديو ألعاب في منطقة MENA. وهو باحث في مجال الذكاء الاصطناعي وخبير في الأمم المتحدة في برنامج UNODC يعمل على تقاطع الذكاء الاصطناعي والأثر الحقيقي في العالم.