رطم الباحثون يتطلعون إلى علماء الأعصاب للتغلب على تحيز مجموعة البيانات - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

الأخلاقيات

يتطلع الباحثون إلى علماء الأعصاب للتغلب على تحيز مجموعة البيانات

تم النشر

 on

بحث فريق من الباحثين في معهد ماساتشوستس للتكنولوجيا وجامعة هارفارد وفوجيتسو المحدودة عن كيفية التغلب على تحيز مجموعة البيانات لنموذج التعلم الآلي. لقد اعتمدوا على نهج علم الأعصاب لدراسة كيفية تأثير بيانات التدريب على ما إذا كانت الشبكة العصبية الاصطناعية يمكن أن تتعلم التعرف على الأشياء التي لم ترها من قبل. 

نشر البحث في المخابرات آلة الطبيعة

التنوع في بيانات التدريب

أظهرت نتائج الدراسة أن التنوع في بيانات التدريب يؤثر على ما إذا كانت الشبكة العصبية قادرة على التغلب على التحيز. ومع ذلك ، يمكن أن يكون لتنوع البيانات أيضًا تأثير سلبي على أداء الشبكة. أظهر الباحثون أيضًا أن الطريقة التي يتم بها تدريب الشبكة العصبية يمكن أن تؤثر أيضًا على ما إذا كان بإمكانها التغلب على مجموعة البيانات المتحيزة. 

Xavier Boix هو عالم أبحاث في قسم الدماغ والعلوم المعرفية (BCS) ومركز الأدمغة والعقول والآلات (CBMM). وهو أيضا مؤلف رئيسي للورقة. 

"يمكن للشبكة العصبية التغلب على تحيز مجموعة البيانات ، وهو أمر مشجع. لكن الخلاصة الرئيسية هنا هي أننا بحاجة إلى مراعاة تنوع البيانات. نحن بحاجة إلى التوقف عن التفكير في أنه إذا قمت فقط بجمع الكثير من البيانات الأولية ، فإن ذلك سيوصلك إلى مكان ما. نحن بحاجة إلى توخي الحذر الشديد بشأن كيفية تصميم مجموعات البيانات في المقام الأول "، كما يقول بويكس.

تبنى الفريق عقل عالم أعصاب لتطوير النهج الجديد. وفقًا لـ Boix ، من الشائع استخدام مجموعات البيانات الخاضعة للرقابة في التجارب ، لذلك قام الفريق ببناء مجموعات بيانات تحتوي على صور لأجسام مختلفة في أوضاع مختلفة. ثم قاموا بالتحكم في المجموعات ، لذا كانت بعض مجموعات البيانات أكثر تنوعًا من غيرها. تكون مجموعة البيانات التي تحتوي على المزيد من الصور التي تُظهر الكائنات من وجهة نظر واحدة فقط أقل تنوعًا ، بينما تكون مجموعة البيانات التي تحتوي على المزيد من الصور التي تعرض كائنات من وجهات نظر متعددة أكثر تنوعًا. 

أخذ الباحثون مجموعات البيانات هذه واستخدموها لتدريب شبكة عصبية على تصنيف الصور. ثم درسوا مدى جودة التعرف على الأشياء من وجهات النظر التي لم تراها الشبكة أثناء التدريب. 

ووجدوا أن مجموعات البيانات الأكثر تنوعًا تسمح للشبكة بتعميم الصور أو وجهات النظر الجديدة بشكل أفضل ، وهذا أمر بالغ الأهمية للتغلب على التحيز. 

"لكن الأمر لا يعني أن المزيد من تنوع البيانات هو الأفضل دائمًا ؛ هناك توتر هنا. عندما تتحسن الشبكة العصبية في التعرف على الأشياء الجديدة التي لم تراها ، سيصبح من الصعب عليها التعرف على الأشياء التي شاهدتها بالفعل "، كما يقول بويكس.

طرق تدريب الشبكات العصبية

وجد الفريق أيضًا أن النموذج الذي يتم تدريبه بشكل منفصل لكل مهمة يكون قادرًا بشكل أفضل على التغلب على التحيز مقارنة بالنموذج الذي تم تدريبه على كلتا المهمتين معًا. 

"كانت النتائج مذهلة حقًا. في الواقع ، في المرة الأولى التي أجرينا فيها هذه التجربة ، اعتقدنا أنها كانت خطأ. لقد استغرق الأمر منا عدة أسابيع لندرك أنها كانت نتيجة حقيقية لأنها كانت غير متوقعة "، يتابع بويكس.

كشف تحليل أعمق أن تخصص الخلايا العصبية متورط في هذه العملية. عندما يتم تدريب الشبكة العصبية على التعرف على الأشياء في الصور ، يظهر نوعان من الخلايا العصبية. تتخصص إحدى الخلايا العصبية في التعرف على فئة الكائن بينما تتخصص الأخرى في التعرف على وجهة النظر. 

تصبح الخلايا العصبية المتخصصة أكثر بروزًا عندما يتم تدريب الشبكة على أداء المهام بشكل منفصل. ومع ذلك ، عندما يتم تدريب الشبكة على إكمال كلتا المهمتين في نفس الوقت ، يتم تخفيف بعض الخلايا العصبية. هذا يعني أنهم لا يتخصصون في مهمة واحدة ، وهم أكثر عرضة للارتباك. 

لكن السؤال التالي الآن ، كيف وصلت هذه الخلايا العصبية إلى هناك؟ تقوم بتدريب الشبكة العصبية ويخرجون من عملية التعلم. لم يخبر أحد الشبكة بتضمين هذه الأنواع من الخلايا العصبية في بنيتها. هذا هو الشيء الرائع ، "يقول بويكس.

سيتطلع الباحثون إلى استكشاف هذا السؤال في عملهم المستقبلي ، بالإضافة إلى تطبيق النهج الجديد على المهام الأكثر تعقيدًا. 

أليكس ماكفارلاند صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في مجال الذكاء الاصطناعي. لقد تعاون مع العديد من الشركات الناشئة والمنشورات في مجال الذكاء الاصطناعي في جميع أنحاء العالم.