Connect with us

علماء الحاسوب يتصدون للتحيز في الذكاء الاصطناعي

الذكاء الاصطناعي

علماء الحاسوب يتصدون للتحيز في الذكاء الاصطناعي

mm

يعمل علماء الحاسوب من جامعة برينستون وجامعة ستانفورد حاليًا على معالجة مشاكل التحيز في الذكاء الاصطناعي (AI). они يعملون على أساليب تؤدي إلى مجموعات بيانات أكثر عدلاً تحتوي على صور للأشخاص. يعمل الباحثون بشكل وثيق مع ImageNet، وهو قاعدة بيانات تحتوي على أكثر من 13 مليون صورة. على مدار العقد الماضي، ساعد ImageNet في تقدم رؤية الكمبيوتر. باستخدام أساليبهم، أوصى الباحثون بتحسينات لقاعدة البيانات.

ImageNet يتضمن صورًا للأجسام والمناظر الطبيعية والأشخاص. يستخدم الباحثون الذين يطورون خوارزميات التعلم الآلي التي تصنف الصور ImageNet كمصدر للبيانات. بسبب حجم قاعدة البيانات الكبير، كان من الضروري وجود جمع صور آلي وتعليقات صور من خلال الحشود. الآن، يعمل فريق ImageNet على تصحيح التحيزات والمشاكل الأخرى. الصور غالبًا ما تحتوي على أشخاص وهي نتائج غير مقصودة لبناء ImageNet.

Olga Russakovsky هو نويسنده المشارك وأستاذ مساعد في علوم الحاسوب في برينستون.

“الرؤية الحاسوبية تعمل الآن بشكل جيد حقًا، مما يعني أنها يتم نشرها في كل مكان في جميع السياقات،” قال. “هذا يعني أن الآن هو الوقت المناسب للتحدث عن نوع التأثير الذي تحققه على العالم والتفكير في هذه الأنواع من قضايا العدالة.”

في الورقة الجديدة، حدد فريق ImageNet بشكل منهجي مفاهيم غير بصرية وفئات مسيئة. وشملت هذه الفئات التوصيفات العرقية والجنسية، وقترح الفريق إزالتها من قاعدة البيانات. كما طور الفريق أداة تسمح للمستخدمين بتحديد مجموعات الصور للأشخاص ويمكنها القيام بذلك حسب العمر والجنس والتعبير واللون. الهدف هو إنشاء خوارزميات تصنف وجوه الأشخاص وأنشطتهم في الصور بطريقة أكثر عدلاً.

تم تقديم العمل الذي قام به الباحثون في 30 يناير في مؤتمر Association for Computing Machinery حول العدالة والمساءلة والشفافية في برشلونة، إسبانيا.

“هناك حاجة كبيرة لمشاركة الباحثين والمعاملات ذات الخبرة الفنية الأساسية في هذه الأنواع من المحادثات،” قال Russakovsky. “نظرًا للواقع الذي نحتاج إلى جمع البيانات على نطاق واسع، نظرًا للواقع أنه سيتم القيام به من خلال الحشود لأن هذا هو أكثر трубة فعالة ومنظمة، كيف نفعل ذلك بطريقة أكثر عدلاً – التي لا تقع في هذه الفخاخ السابقة؟ الرسالة الأساسية لهذه الورقة هي حول الحلول البنائية.”

تم إطلاق ImageNet في عام 2009 من قبل مجموعة من علماء الحاسوب في برينستون وستانفورد. كان من المفترض أن يخدم كمصدر للمحققين الأكاديميين والمعلمين. قاد إنشاء النظام خريج برينستون وأعضاء هيئة التدريس Fei-Fei Li.

كان من الممكن أن تصبح ImageNet قاعدة بيانات كبيرة من الصور المُ etiquetted من خلال استخدام الحشود. واحدة من المنصات الرئيسية المستخدمة كانت Amazon Mechanical Turk (MTurk)، وتم دفع رواتب للعاملين لتأكيد الصور المرشحة. هذا تسبب في بعض المشاكل، وهناك العديد من التحيزات والتصنيفات غير المناسبة.

Kaiyu Yang هو نويسنده المشارك وطالب دراسات عليا في علوم الحاسوب.

“عندما تطلب من الناس تأكيد الصور عن طريق اختيار الصور الصحيحة من مجموعة كبيرة من المرشحين، يشعر الناس بالضغط لاختيار بعض الصور وهذه الصور تميل إلى أن تكون تلك التي تحتوي على سمات مميزة أو نمطية،” قال.

شمل الجزء الأول من الدراسة تصفية الفئات المحتملة المسيئة أو الحساسة للأشخاص من ImageNet. تم تعريف الفئات المسيئة على أنها تلك التي تحتوي على كلمات بذيئة أو شتائم عرقية أو جنسية. واحدة من الفئات الحساسة كانت تصنيف الأشخاص根据 توجههم الجنسي أو دينهم. تم جلب 12 طالبًا دراسات عليا من خلفيات متنوعة لتعليق الفئات، وتم توجيههم لتحديد فئة حساسة إذا كانوا غير متأكدين منها. تم إزالة حوالي 54٪ من الفئات، أو 1593 من أصل 2932 فئة شخص في ImageNet.

قيم عمال MTurk “قابلية الصورة” للفئات المتبقية على مقياس من 1 إلى 5. تم تصنيف 158 فئة على أنها آمنة وقابلة للتصوير، بتقييم 4 أو أعلى. وشملت مجموعة الفئات المصفاة أكثر من 133000 صورة، والتي يمكن أن تكون مفيدة جدًا لتدريب خوارزميات الرؤية الحاسوبية.

درَس الباحثون التمثيل الديموغرافي للأشخاص في الصور، وتم تقييم مستوى التحيز في ImageNet. غالبًا ما توفر محتويات البحث من محركات البحث نتائج تفرط في تمثيل الذكور والأشخاص ذوي البشرة الفاتحة والبالغين بين سن 18 و 40 عامًا.

“لقد وجد الناس أن توزيع الديموغرافية في نتائج البحث بالصور متحيزة بشكل كبير، وهذا هو السبب في أن التوزيع في ImageNet也是 متحيزًا،” قال Yang. “في هذه الورقة حاولنا فهم كيف يكون التحيز كبيرًا، وأيضًا لاقتراح طريقة لتحقيق التوازن في التوزيع.”

أخذ الباحثون في الاعتبار ثلاث سمات محمية بموجب قوانين مكافحة التمييز في الولايات المتحدة: لون البشرة، والتعبير الجنسي، والعمر. ثم قام عمال MTurk بتعليق كل سمة من سمات كل شخص في الصورة.

أظهرت النتائج أن محتوى ImageNet متحيز بشكل كبير. كان الأقل تمثيلًا هو الأشخاص ذوو البشرة الداكنة، الإناث، والبالغون فوق سن 40 عامًا.

تم تصميم أداة واجهة ويب تسمح للمستخدمين بتحصل على مجموعة من الصور التي توازن ديموغرافيًا بطريقة يختارها المستخدم.

“نحن لا نريد أن نقول ما هو الطريقة الصحيحة لتحقيق التوازن في الديموغرافية، لأنها ليست قضية بسيطة،” قال Yang. “التوزيع يمكن أن يكون مختلفًا في أجزاء مختلفة من العالم – توزيع الألوان في الولايات المتحدة مختلف عن البلدان في آسيا، على سبيل المثال. لذلك نترك هذه القضية للمستخدم، ونقدم فقط أداة لاسترجاع مجموعة فرعية متوازنة من الصور.”

يعمل فريق ImageNet حاليًا على تحديثات تقنية لأجهزته وقاعدة بياناته. كما يحاولون تنفيذ تصفية فئات الأشخاص وأداة إعادة التوازن التي تم تطويرها في هذا البحث. من المقرر إعادة إصدار ImageNet مع التحديثات، إلى جانب دعوة لتقديم反馈 من مجتمع أبحاث الرؤية الحاسوبية.

كما تم 共著 الورقة من قبل طالب الدكتوراه في برينستون Klint Qinami وأستاذ مساعد في علوم الحاسوب Jia Deng. تم دعم البحث من قبل مؤسسة العلوم الوطنية.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.