Connect with us

تعليم روبوتات جوجل كيفية الحركة من خلال مشاهدة الكلاب

الذكاء الاصطناعي

تعليم روبوتات جوجل كيفية الحركة من خلال مشاهدة الكلاب

mm

لا تزال بعض أكثر الروبوتات تقدمًا اليوم تتحرك بطرق غير مريحة ومتقطعة إلى حد ما. من أجل جعل الروبوتات تتحرك بطرق أكثر واقعية وسلاسة، قام باحثون في جوجل بتطوير نظام ذكاء اصطناعي قادر على التعلم من حركات الحيوانات الحقيقية. نشر فريق البحث في جوجل ورقة مسودة متاحة للجمهور في الأسبوع الماضي. في الورقة ومدونة مصاحبة مدونة، يصف فريق البحث خلفية النظام. يعتقد مؤلفو الورقة أن منح الروبوتات حركة أكثر طبيعية يمكن أن يساعدهم على إنجاز مهام العالم الحقيقي التي تتطلب حركة دقيقة، مثل تسليم العناصر بين مستويات مختلفة من المبنى.

كما ذكرت VentureBeat، استخدم فريق البحث تعلم التعزيز لتدريب روبوتاتهم. بدأ الباحثون بجمع مقاطع فيديو لحيوانات حقيقية تتحرك واستخدام تقنيات التعلم بالتعزيز (RL) لدفع الروبوتات لتحاكي حركات الحيوانات في مقاطع الفيديو. في هذه الحالة، درب الباحثون الروبوتات على مقاطع فيديو لكلب، مصمم في محاكي فيزيائي، وتعليم روبوت Unitree Laikago ذي الأربعة أطراف لتحاكي حركات الكلب. بعد تدريب الروبوت، كان قادرًا على إنجاز حركات معقدة مثل القفز والتحرك بسرعة، بسرعة تبلغ حوالي 2.6 ميل في الساعة.

تكونت بيانات التدريب من حوالي 200 مليون عينة من الكلاب في حركة، تمت متابعتها في محاكي فيزيائي. ثم تم تشغيل الحركات المختلفة من خلال دوال مكافأة وسياسات تعلمها الوكلاء. بعد إنشاء السياسات في المحاكاة، تم نقلها إلى العالم الحقيقي باستخدام تقنية تسمى التكيف في الفضاء الكامن. نظرًا لأن محاكي الفيزياء المستخدمة لتدريب الروبوتات يمكن أن تتقرب فقط إلى جوانب معينة من الحركة في العالم الحقيقي، قام الباحثون بتطبيق اضطرابات مختلفة بشكل عشوائي على المحاكاة، بهدف محاكاة التشغيل في ظروف مختلفة.

وفقًا لفريق البحث، تمكنوا من تعديل سياسات المحاكاة على الروبوتات في العالم الحقيقي باستخدام بيانات تبلغ حوالي 8 دقائق تم جمعها من 50 تجربة مختلفة. تمكن الباحثون من إثبات أن الروبوتات في العالم الحقيقي قادرة على محاكاة مجموعة متنوعة من الحركات المحددة، مثل العدو والتحول والقفز والتمشي. حتى إنهم تمكنوا من محاكاة الرسوم المتحركة التي أنشأها فنانو الرسوم المتحركة، مثل مزيج من القفز والتحول.

يوجز الباحثون النتائج في الورقة:

“نُظهر أن من خلال الاستفادة من بيانات الحركة المرجعية، يمكن لمقاربة تعلم واحدة أن تولد تلقائيًا مراقبين لمجموعة متنوعة من السلوكيات لروبوتات الأرجل. من خلال دمج تقنيات التكيف في النطاق بفعالية العينة في عملية التدريب، يمكن لنظامنا تعلم السياسات التكيفية في المحاكاة التي يمكن تعديلها بسرعة لتنشر في العالم الحقيقي.”

كانت هناك قيود على سياسات التحكم المستخدمة خلال عملية التعلم بالتعزيز. بسبب القيود المفروضة بواسطة الأجهزة والخوارزميات، كانت هناك بعض الأشياء التي لا يمكن للروبوتات القيام بها. على سبيل المثال، لم يتمكنوا من الجري أو القفز بعيدًا. كما لم تظهر السياسات المكتسبة استقرارًا كبيرًا مقارنة بالحركات التي تم تصميمها يدويا. يريد فريق البحث أن يأخذ العمل إلى أبعد من ذلك من خلال جعل المراقبين أكثر متانة وقدرة على التعلم من أنواع مختلفة من البيانات. في المثالي، سوف تكون إصدارات مستقبلية من الإطار قادرة على التعلم من بيانات الفيديو.

مدون وبرمجي متخصص في مواضيع Machine Learning و Deep Learning. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الخير الاجتماعي.