الذكاء الاصطناعي
الذكاء الاصطناعي الجديد لـ DeepMind قادر على تعلم قواعد اللعبة أثناء تشغيلها

قامت شركة DeepMind التابعة لشركة Alphabet مؤخرًا بتطوير نظام ذكاء اصطناعي قادر على تعلم قواعد اللعبة أثناء لعبها. في حين أن DeepMind قد أنشأت نماذج رائعة للذكاء الاصطناعي يمكنها إتقان ألعاب مثل Chess و Shogi و Go وألعاب الفيديو من قبل ، يجب تزويد هذه النماذج بقواعد اللعبة مسبقًا. على هذا النحو ، يمثل الذكاء الاصطناعي الجديد لـ DeepMind تحسنًا ملحوظًا مقارنة بخوارزميات الذكاء الاصطناعي السابقة التي تتعلم ممارسة الألعاب من خلال التعلم المعزز.
نظام الذكاء الاصطناعي - MuZero
في ورقة نشرت مؤخرا في المجلة الطبيعة، شرح DeepMind كيف يعمل نظام الذكاء الاصطناعي الجديد. إن الذكاء الاصطناعي الجديد ، الملقب بـ MuZero ، قادر على تعلم قواعد اللعبة أثناء لعبها بفضل مبدأ يسمى "البحث عن المستقبل". وفقًا لما أوردته Engadget، يستخدم MuZero البحث الفوري لتحديد التحركات التي يجب تنفيذها بناءً على الاستجابات الأكثر احتمالية من الخصوم.
عند التفكير في جميع الحركات المحتملة التي يمكن إجراؤها في ألعاب مثل الشطرنج ، يكون MuZero قادرًا على تحديد الأولويات ، وتضييق الحركات إلى الحركات الأكثر احتمالية والأكثر صلة. سوف يتعلم MuZero بعد ذلك من كل من المناورات الناجحة وغير الناجحة. بدلاً من نمذجة جميع العوامل المحتملة ، فإنه يأخذ في الاعتبار فقط العوامل الأكثر صلة بالقرار المطروح. تأخذ MuZero أساسًا عددًا لا يحصى من المتغيرات المحتملة التي يمكن أخذها في الاعتبار وتقطيرها إلى أكثر الميزات بروزًا وتأثيرًا. يتم تمثيل هذه الميزات في خوارزمية البحث على أساس الشجرة. يتم بعد ذلك دمج الاحتمالات داخل الشجرة مع نموذج تم تعلمه بناءً على ميزات بيئة الاختبار. يتم إجراء البحث النظري بعد تحديد الجوانب الأكثر صلة بالبيئة.
من أجل التوصل إلى قرار نهائي ، يتم أخذ ثلاثة عوامل في الاعتبار.
يأخذ MuZero في الاعتبار نتيجة الاختيار السابق ، والموقع الحالي الذي يشغله ، والإجراءات المحتملة التي يمكن أن يتخذها بعد ذلك. يتفوق هذا النهج على الأساليب المستخدمة سابقًا بواسطة DeepMind ، بما في ذلك البحث الأساسي والنماذج المستندة إلى الأشجار. أثبت MuZero أنه على الأقل جيد في الشطرنج ، shogi ، و Go كما كان AlphaZero ، وعندما لعبت لعبة السيدة Pac-Man ، كان MuZero قادرًا فقط على التفكير في حوالي ست أو سبع حركات في المرة الواحدة. على الرغم من هذا الحد ، كان الذكاء الاصطناعي لا يزال قادرًا على الأداء بشكل جيد. جربت DeepMind أيضًا قدرات MuZero من خلال الحد من عدد عمليات المحاكاة التي يمكن أن تكملها قبل أن تضطر إلى الالتزام بحركة. بشكل عام ، كلما زاد الوقت المخصص للبرنامج للنظر في التحركات المحتملة ، كان أداؤه أفضل.
عالم الأبحاث الرئيسي في DeepMind ، ديفيد سيلفر ، أوضح عبر TechXplore أن MuZero هو أول نموذج ذكاء اصطناعي قادر على إنشاء تمثيل خاص به لقواعد البيئة ، باستخدام هذا التمثيل لتخطيط الإجراءات.
لأول مرة، لدينا نظام قادر على بناء فهمه الخاص لكيفية عمل العالم، واستخدام هذا الفهم للتخطيط الاستشرافي المتطور الذي رأيناه سابقًا في ألعاب مثل الشطرنج، كما قال سيلفر. «يمكن لموزيرو البدء من الصفر، ومن خلال التجربة والخطأ فقط، اكتشاف قواعد العالم واستخدامها لتحقيق أداء خارق للطبيعة».
التطبيقات الممكنة
يمتلك الذكاء الاصطناعي القادر حقًا على تعلم قيود المهمة والعمل ضمن هذه القيود مجموعة متنوعة من التطبيقات الممكنة. يمكن استخدام MuZero في مهام مثل ضغط الفيديو ، والذي كان من الصعب تاريخياً أتمتة استخدام الذكاء الاصطناعي ، بسبب العديد من تنسيقات الفيديو المختلفة الممكنة وأنماط الضغط. كان MuZero قادرًا على تحقيق تحسين ضغط بنسبة 5 ٪ تقريبًا. قد يكون لذلك آثار على العدد الكبير من مقاطع الفيديو التي تستضيفها Google و YouTube. بالإضافة إلى مقاطع الفيديو ، يبحث DeepMind أيضًا في استخدام نفس تقنيات MuZero لتصميم بنية البروتين وبرمجة الروبوتات.
وفقًا لـ Wendy Hall ، أستاذ علوم الكمبيوتر بجامعة ساوثهامبتون ، يمثل MuZero "خطوة مهمة إلى الأمام" في تعزيز خوارزميات التعلم. ومع ذلك ، يشعر هول بالقلق من أن الخوارزميات يمكن أن يساء استخدامها. على سبيل المثال ، أشار سلاح الجو الأمريكي بالفعل إلى الأوراق البحثية المبكرة التي تغطي MuZero لإنشاء نظام ذكاء اصطناعي يمكنه إطلاق صواريخ من طائرات التجسس U-2. هذا على الرغم من أن باحثو DeepMind عبروا عن معارضتهم لاستخدام الخوارزميات الخاصة بهم لأي سلاح فتاك ، ووقعوا على تعهد الأسلحة الفتاكة ذاتية التشغيل للقول بأن أي تقنية قاتلة يجب أن تظل تحت سيطرة الإنسان.
أوضح سيلفر أن DeepMind يتطلع إلى المستقبل ، بهدف تطوير خوارزميات قوية ومتعددة الاستخدامات مثل الدماغ. تتمثل الخطوة الأولى في إنشاء خوارزميات مرنة ومتعددة الاستخدامات في فهم ما يعنيه أن يكون النظام ذكيًا ، والذكاء مرتبط بالقدرة على تمييز أنماط وقواعد البيئة المعقدة.












