Connect with us

علماء الحاسوب يتصدون للتحيز في الذكاء الاصطناعي

الذكاء الاصطناعي

علماء الحاسوب يتصدون للتحيز في الذكاء الاصطناعي

mm

يعمل علماء الحاسوب من جامعة برينستون وستانفورد حاليًا على معالجة مشاكل التحيز في الذكاء الاصطناعي (AI). они يعملون على طرق تؤدي إلى مجموعات بيانات أكثر عدلاً تحتوي على صور للأشخاص. يعمل الباحثون بشكل وثيق مع ImageNet ، وهو قاعدة بيانات تضم أكثر من 13 مليون صورة. على مدار العقد الماضي ، ساعدت ImageNet في تقدم رؤية الكمبيوتر. باستخدام طرقهم ، أوصى الباحثون بتحسينات لقاعدة البيانات.

ImageNet تتضمن صورًا للكائنات والمناظر الطبيعية والأشخاص. يستخدم الباحثون الذين يخلقون خوارزميات التعلم الآلي التي تصنف الصور ImageNet كمصدر للبيانات. بسبب حجم قاعدة البيانات الهائل ، كان من الضروري وجود جمع صور آلي وتنقيح صور عبر الحشود. الآن ، تعمل فريق ImageNet على تصحيح التحيزات والمشاكل الأخرى. الصور غالبًا ما تحتوي على أشخاص الذين هم عواقب غير مقصودة لبناء ImageNet.

Olga Russakovsky هو نويسنده المشارك وأستاذ مساعد في علوم الحاسوب في برينستون.

“الرؤية الحاسوبية تعمل الآن بشكل جيد حقًا ، مما يعني أنها يتم نشرها في كل مكان في جميع السياقات” ، قال. “هذا يعني أن هذا هو الوقت المناسب للتحدث عن نوع التأثير الذي تحدثه على العالم والتفكير في هذه الأنواع من قضايا العدالة”.

في الورقة الجديدة ، حدد فريق ImageNet بشكل منهجي المفاهيم غير المرئية والفئات المسيئة. وشملت هذه الفئات التوصيفات العرقية والجنسية ، وأقترح الفريق إزالتها من قاعدة البيانات. كما طور الفريق أداة تتيح للمستخدمين تحديد مجموعات الصور للأشخاص ويمكنهم القيام بذلك حسب العمر وعبير الجنس ولون البشرة. الهدف هو إنشاء خوارزميات تصنف وجوه الأشخاص وأنشطتهم في الصور بشكل أكثر عدلاً.

تم تقديم عمل الباحثين في 30 يناير في مؤتمر Association for Computing Machinery حول العدالة والمساءلة والشفافية في برشلونة ، إسبانيا.

“هناك حاجة كبيرة للباحثين والمعاملات ذات الخبرة التقنية الأساسية في هذا المشاركة في هذه الأنواع من المحادثات” ، قال Russakovsky. “نظرًا للواقع الذي نحتاج إلى جمع البيانات على نطاق واسع ، نظرًا للواقع أنه سيتم القيام به من خلال الحشود لأن هذا هو أكثر خط أنابيب فعالة ومثبتة ، كيف نفعل ذلك بطريقة أكثر عدلاً – التي لا تقع في هذه الفخاخ السابقة؟ الرسالة الأساسية لهذه الورقة هي حول الحلول البنائية”.

تم إطلاق ImageNet في عام 2009 من قبل مجموعة من علماء الحاسوب في برينستون وستانفورد. كان من المفترض أن تكون بمثابة مورد للباحثين الأكاديميين والمعلمين. تمت قيادة إنشاء النظام بواسطة خريج برينستون وأعضاء هيئة التدريس Fei-Fei Li.

تمكنت ImageNet من أن تصبح قاعدة بيانات كبيرة من الصور الموجودة من خلال استخدام الحشود. كان أحد المنصات الرئيسية المستخدمة هو Amazon Mechanical Turk (MTurk) ، وتم دفع رواتب للعاملين لتأكيد الصور المرشحة. هذا تسبب في بعض المشاكل ، وكان هناك الكثير من التحيزات والتصنيفات غير المناسبة.

Kaiyu Yang هو نويسنده الرائد وطالب دراسات عليا في علوم الحاسوب.

“عندما تطلب من الناس التحقق من الصور عن طريق اختيار الصور الصحيحة من مجموعة كبيرة من المرشحين ، يشعر الناس بالضغط لاختيار بعض الصور وتكون هذه الصور عادةً تلك التي تحتوي على ميزات مميزة أو نمطية” ، قال.

شمل الجزء الأول من الدراسة تصفية الفئات المحتملة المسيئة أو الحساسة للأشخاص من ImageNet. تم تعريف الفئات المسيئة على أنها تلك التي تحتوي على كلمات بذيئة أو شتائم عرقية أو جنسية. واحدة من الفئات الحساسة كانت تصنيف الأشخاص على أساس الميول الجنسية أو الدين. تم جلب 12 طالبًا دراسات عليا من خلفيات متنوعة لتحديد الفئات ، وتم تعليمهم وضع علامة على الفئة الحساسة إذا كانوا غير متأكدين منها. تم إlimination ما يقرب من 54٪ من الفئات ، أو 1593 من أصل 2932 فئة شخص في ImageNet.

ثم قيم العاملون في MTurk “قابلية الصورة” للفئات المتبقية على مقياس من 1 إلى 5. تم تصنيف 158 فئة على أنها آمنة وقابلة للتصوير ، بتقييم 4 أو أعلى. شملت مجموعة الفئات المصفاة أكثر من 133000 صورة ، والتي يمكن أن تكون مفيدة جدًا لتدريب خوارزميات الرؤية الحاسوبية.

دراسة الباحثين التمثيل الديموغرافي للأشخاص في الصور ، وتم تقييم مستوى التحيز في ImageNet. غالبًا ما توفر محتويات البحث من محركات البحث نتائج تفرط في تمثيل الذكور والأشخاص ذوي البشرة الفاتحة والبالغين بين سن 18 و 40 عامًا.

“لقد وجد الناس أن توزيع الديموغرافية في نتائج بحث الصور متحيزة بشكل كبير ، وهذا هو السبب في أن التوزيع في ImageNet也是 متحيزًا” ، قال Yang. “في هذه الورقة حاولنا فهم كيف يكون التوزيع متحيزًا ، وأيضًا اقتراح طريقة للتوازن التوزيع”.

أخذ الباحثون في الاعتبار ثلاث سمات أيضًا محمية بموجب قوانين مكافحة التمييز في الولايات المتحدة: لون البشرة وعبير الجنس والعمر. ثم قام العاملون في MTurk بتحديد كل سمة من سمات كل شخص في الصورة.

أظهرت النتائج أن محتوى ImageNet يحتوي على تحيز كبير. كانت الأقل تمثيلًا هي الأشخاص ذوو البشرة الداكنة والإناث والبالغون فوق سن 40.

تم تصميم أداة واجهة ويب تتيح للمستخدمين الحصول على مجموعة من الصور المتوازنة ديموغرافيًا بطريقة يختارها المستخدم.

“لا نريد أن نقول ما هو الطريقة الصحيحة لتوازن الديموغرافية ، لأنها ليست قضية بسيطة” ، قال Yang. “يمكن أن يكون التوزيع مختلفًا في أجزاء مختلفة من العالم – توزيع الألوان في الولايات المتحدة مختلف عن البلدان في آسيا ، على سبيل المثال. لذلك نترك هذه المسألة للمستخدم ، ونقدم فقط أداة لاسترجاع مجموعة فرعية متوازنة من الصور”.

فريق ImageNet يعمل الآن على تحديثات تقنية لأجهزته وقاعدة البيانات. كما يحاولون تنفيذ تصفية فئات الأشخاص وأداة إعادة التوازن التي تم تطويرها في هذا البحث. من المقرر إعادة إصدار ImageNet مع التحديثات ، جنبًا إلى جنب مع دعوة لتقديم反馈 من مجتمع أبحاث الرؤية الحاسوبية.

كما تم التأليف المشترك للورقة من قبل طالب الدكتوراه في برينستون Klint Qinami وأستاذ مساعد في علوم الحاسوب Jia Deng. تم دعم البحث من قبل National Science Foundation.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.