الذكاء الاصطناعي
باحثون يتطلعون إلى الحيوانات لتزويد أنظمة التعلم التعزيزي بالحس السليم

يبحث باحثو الذكاء الاصطناعي من معاهد مثل كلية لندن الإمبراطورية، وجامعة كامبريدج، وغوغل ديب مايند إلى الحيوانات للاستلهام حول كيفية تحسين أداء أنظمة التعلم التعزيزي. في ورقة مشتركة نشرت في CellPress Reviews، بعنوان “الذكاء الاصطناعي والحس السليم للحيوانات”، يجادل الباحثون بأن إدراك الحيوانات يوفر معايير وطرق تقييم مفيدة للوكلاء التعلم التعزيزي ويمكن أن ي告诉 هندسة المهام والبيئات.
يبحث باحثو الذكاء الاصطناعي والمهندسون منذ زمن طويل إلى الشبكات العصبية البيولوجية للاستلهام عند تصميم الخوارزميات، باستخدام المبادئ من العلوم السلوكية وعلم الأعصاب لإعلام هيكل الخوارزميات. ومع ذلك، فإن معظم الإشارات التي يأخذها باحثو الذكاء الاصطناعي من مجالات العلوم العصبية / العلوم السلوكية تستند إلى البشر، مع служة إدراك الأطفال الصغار والرضع كمركز التركيز. لم يأخذ باحثو الذكاء الاصطناعي بعد الكثير من الإلهام من نماذج الحيوانات، ولكن إدراك الحيوانات هو مورد غير مستغل له القدرة على قيادة اختراقات مهمة في مجال التعلم التعزيزي.
تتم تدريب أنظمة التعلم التعزيزي العميق من خلال عملية من التجربة والخطأ، مدعومة بالمكافآت كلما كان وكيل التعلم التعزيزي أقرب إلى إكمال هدف مرغوب. هذا يشبه إلى حد كبير تعليم حيوان لتنفيذ مهمة معينة باستخدام الطعام كمكافأة. قام علماء الأحياء وخبراء إدراك الحيوانات بأداء العديد من التجارب تقييم القدرات الإدراكية لمختلف الحيوانات، بما في ذلك الكلاب والدببة والسنجاب والخنازير والغربان والدلافين والقطط والفئران والفيلة والأخطبوط. يعرض العديد من الحيوانات عروضًا مثيرة للإعجاب من الذكاء، ويمكن لبعض الحيوانات مثل الفيلة والدلافين الاحتفاظ بنظرية العقل.
ينظر إلى جسم البحث المنجز بشأن إدراك الحيوانات قد يلهم باحثي الذكاء الاصطناعي للاستفادة من المشكلات من زوايا مختلفة. مع تصبح التعلم التعزيزي العميق أكثر قوة وتطورًا، يبحث باحثو الذكاء الاصطناعي المتخصصون في هذا المجال عن طرق جديدة لاختبار القدرات الإدراكية للوكلاء التعلم التعزيزي. في ورقة البحث، يشير فريق البحث إلى أنواع التجارب التي أجريت مع الرئيسيات والطيور، مشيرًا إلى أنهم يهدفون إلى تصميم أنظمة قادرة على إنجاز مهام مماثلة، مما يعطي الذكاء الاصطناعي نوعًا من “الحس السليم”. وفقًا لمؤلفي الورقة، فإنهم “يطرحون نهجًا حيث يحصل وكلاء التعلم التعزيزي، ربما مع الهياكل التي لم يتم تطويرها بعد، على ما هو ضروري من خلال التفاعل الممتد مع البيئات الافتراضية الغنية”.
كما ذكر في VentureBeat، يجادل باحثو الذكاء الاصطناعي بأن الحس السليم ليس سمة فريدة من نوعها للبشر وأنها تعتمد على فهم الخواص الأساسية للعالم المادي، مثل كيف يشغل كائن نقطة ومساحة، ما هي القيود على حركة ذلك الكائن، والتقدير للسبب والنتيجة. تعرض الحيوانات هذه الصفات في الدراسات المختبرية. على سبيل المثال، يفهم الغربان أن الأشياء هي أشياء دائمة، لأنهم قادرين على استعادة البذور حتى عندما يتم إخفاء البذرة عنهم، مغطاة بآخر.
من أجل منح نظام التعلم التعزيزي هذه الخصائص، يجادل الباحثون بأنهم سوف يحتاجون إلى إنشاء مهام، عندما يتم تركيبها مع الهيكل الصحيح، سوف تخلق وكلاء قادرة على نقل المبادئ المكتسبة إلى مهام أخرى. يجادل الباحثون بأن تدريب مثل هذا النموذج يجب أن يتضمن تقنيات تتطلب من وكيل الحصول على فهم لمفهوم بعد التعرض لعدد قليل من الأمثلة، يسمى تدريب الشوط القليل. هذا يتناقض مع المئات أو الآلاف من التجارب التي عادة ما تدخل في تدريب وكيل التعلم التعزيزي بالتجربة والخطأ.
يواصل فريق البحث شرح أن بعض وكلاء التعلم التعزيزي الحديثين يمكنهم تعلم حل مهام متعددة، بعضها يتطلب نقل المبادئ المكتسبة، ولكن من غير الواضح أن وكلاء التعلم التعزيزي يمكنهم تعلم مفهومًا مجردًا مثل “الحس السليم”. إذا كان هناك وكيل محتمل القدرة على تعلم مثل هذا المفهوم، فسوف يحتاجون إلى اختبارات قادرة على تحديد ما إذا كان وكيل التعلم التعزيزي يفهم مفهوم الحاوية.
تعتبر ديب مايند على وجه الخصوص متحمسة للتعامل مع طرق جديدة ومختلفة لتطوير واختبار وكلاء التعلم التعزيزي. مؤخرًا، في مؤتمر ستانفورد هاي آي الذي أقيم في أكتوبر، حث رئيس أبحاث العلوم العصبية في ديب مايند، ماتيو بوتفينيك، باحثي التعلم الآلي والمهندسين على التعاون أكثر في مجالات العلوم الأخرى. أكد بوتفينيك على أهمية العمل المتعدد التخصصات مع علماء النفس وعلم الأعصاب لمجال الذكاء الاصطناعي في محاضرة بعنوان “تحديد الذكاء: دمج العلوم العصبية وعلم النفس والذكاء الاصطناعي”.












