الذكاء الاصطناعي
منافسة الذكاء الاصطناعي في منافسة التعلم الآلي في ماين كرافت

كما ذكر في Nature ، منافسة جديدة للذكاء الاصطناعي ست发生 قريباً ، وهي منافسة MineRL ، والتي تشجع مهندسي الذكاء الاصطناعي والمبرمجين على إنشاء برامج قادرة على التعلم من خلال الملاحظة وال مثال. حالة الاختبار لأنظمة الذكاء الاصطناعي ستكون لعبة الفيديو الشهيرة ماين كرافت للبناء والبقاء.
لقد حقق أنظمة الذكاء الاصطناعي بعض الإنجازات المذهلة مؤخرًا فيما يتعلق بألعاب الفيديو. للتو ، هزمت الذكاء الاصطناعي أفضل اللاعبين في العالم في لعبة StarCraft II الإستراتيجية. ومع ذلك ، فإن StarCraft II لديها أهداف محددة يمكن كسرها بسهولة إلى خطوات متسلسلة التي يمكن للذكاء الاصطناعي استخدامها للتدريب. ومهمة أكثر صعوبة هي أن يتعلم الذكاء الاصطناعي كيفية التنقل في لعبة العالم المفتوح الكبيرة مثل ماين كرافت. يهدف الباحثون إلى مساعدة برامج الذكاء الاصطناعي على التعلم من خلال الملاحظة والمثال ، وإذا نجحوا ، يمكنهم تقليل كمية الطاقة المعالجة اللازمة لتدريب برنامج الذكاء الاصطناعي بشكل كبير.
سيتمتع المشاركون في المنافسة بأربعة أيام لإنشاء الذكاء الاصطناعي الذي سيتم اختباره مع ماين كرافت ، مع أخذ ما يصل إلى 8 ملايين خطوة للتدريب على الذكاء الاصطناعي. هدف الذكاء الاصطناعي هو العثور على الماس داخل اللعبة عن طريق الحفر. 8 ملايين خطوة من التدريب هي فترة زمنية أقصر بكثير من الوقت اللازم لتدريب نماذج الذكاء الاصطناعي القوية هذه الأيام ، لذلك يحتاج المشاركون في المنافسة إلى هندسة أساليب تحسين الطرق الحالية للتدريب بشكل كبير.
تعتمد الأساليب المستخدمة من قبل المشاركين على نوع من التعلم يسمى التعلم بالتقليد. التعلم بالتقليد يقف في مقابل التعلم بالتعزيز ، وهو طريقة شائعة لتدريب الأنظمة المتقدمة مثل أذرع الروبوت في المصانع أو الذكاء الاصطناعي القادر على هزيمة لاعبين بشريين في StarCraft II. العيب الرئيسي للخوارزميات التعزيزية هو حقيقة أنهم يحتاجون إلى كمية هائلة من طاقة المعالجة لتدريبهم ، مع الاعتماد على مئات أو حتى آلاف الكمبيوترات المرتبطة لتعلمها. بالمقارنة ، التعلم بالتقليد هو طريقة أكثر كفاءة وأقل تكلفة لتدريب الذكاء الاصطناعي. تحاول خوارزميات التعلم بالتقليد تقليدها لكيفية تعلم البشر من خلال الملاحظة.
أوضح ويليام جوس ، مرشح الدكتوراه في نظرية التعلم العميق في جامعة كارنيجي ميلون ، لnature أن الحصول على الذكاء الاصطناعي لاستكشاف التعلم والأنماط في البيئة هو مهمة صعبة للغاية ، ولكن التعلم بالتقليد يوفر للذكاء الاصطناعي قاعدة من المعرفة ، أو افتراضات جيدة مسبقًا ، حول البيئة. يمكن أن يجعل ذلك من التدريب على الذكاء الاصطناعي أسرع بكثير بالمقارنة مع التعلم بالتعزيز.
ماين كرافت يخدم كبيئة تدريب مفيدة للغاية لعدة أسباب. أحد الأسباب هو أن ماين كرافت يسمح للاعبين باستخدام كتل بناء بسيطة لإنشاء هياكل ومواد معقدة ، والكثير من الخطوات اللازمة لإنشاء هذه الهياكل تعمل كمركبات ملموسة للتقدم التي يمكن للباحثين استخدامها كأدلة. ماين كرافت cũng شائع للغاية ، وبسبب ذلك ، من السهل نسبيًا جمع بيانات التدريب. قام منظمو منافسة MineRL بتجنيد العديد من لاعبين ماين كرافت لتحديد مجموعة متنوعة من المهام مثل إنشاء أدوات وكسر الكتل. من خلال توليد البيانات من خلال الحشد ، تمكن الباحثون من التقاط 60 مليون مثال للإجراءات التي يمكن اتخاذها في اللعبة. قدم الباحثون حوالي 1000 ساعة من الفيديو لفرق المنافسة.
استخدم المعرفة التي بناها البشر ، يقول روهين شاه ، مرشح الدكتوراه في علوم الحاسوب في جامعة كاليفورنيا ، بيركلي ، لnature أن هذه المنافسة من المحتمل أن تكون الأولى التي تركز على استخدام المعرفة التي أنتجها البشر لتعجيل تدريب الذكاء الاصطناعي.
جوس والباحثون الآخرون يأملون أن تؤدي المنافسة إلى نتائج ذات عواقب تتجاوز ماين كرافت ، مما يؤدي إلى خوارزميات تعلم أفضل بالتقليد ، وتحفيز المزيد من الناس على النظر في التعلم بالتقليد كشكل قابل للتدريب للذكاء الاصطناعي. يمكن أن تساعد الأبحاث على إنشاء الذكاء الاصطناعي الذي يمكنه التفاعل مع الناس في بيئات معقدة ومتغيرة بشكل أفضل.










