Connect with us

نماذج الذكاء الاصطناعي المُدرَّبة على بيانات متحيزة جنسياً تؤدي أسوأ في تشخيص الأمراض

الرعاية الصحية

نماذج الذكاء الاصطناعي المُدرَّبة على بيانات متحيزة جنسياً تؤدي أسوأ في تشخيص الأمراض

mm

مؤخراً، نشرت دراسة في مجلة PNAS وأجراها باحثون من الأرجنتين، تشير إلى أن وجود بيانات تدريب متحيزة جنسياً يؤدي إلى أسوأ أداء للنموذج عند تشخيص الأمراض والمشاكل الطبية الأخرى. كما ذكرت Statnews، قام فريق الباحثين بتجربة تدريب النماذج حيث كانت المرضى الإناث ممثلة بشكل ضعيف أو مستبعدة تماماً، ووجدوا أن الخوارزمية أدت بشكل أسوأ عند تشخيصهم. نفس الشيء ينطبق على الحوادث التي يتم فيها استبعاد أو تمثيل المرضى الذكور بشكل ضعيف.

على مدى النصف العقد الماضي، مع انتشار نماذج الذكاء الاصطناعي وتعلم الآلة، أصبحت هناك المزيد من الاهتمام بمشاكل مجموعات البيانات المتحيزة ونمذجة تعلم الآلة المتحيزة الناتجة عنها. يمكن أن يؤدي تحيز البيانات في تعلم الآلة إلى تطبيقات ذكاء اصطناعي غير ملائمة وsociale وexclusive، ولكن عندما يتعلق الأمر بالتطبيقات الطبية، يمكن أن تكون الأرواح على المحك. ومع ذلك، على الرغم من المعرفة بمشكلة التحيز، قام عدد قليل من الدراسات بمحاولة量ification مدى ضرر مجموعات البيانات المتحيزة. وجدت الدراسة التي أجراها فريق البحث أن تحيز البيانات يمكن أن يكون له آثار أكثر حدة مما كان يعتقد العديد من الخبراء في السابق.

أحد أكثر الاستخدامات شعبية للذكاء الاصطناعي في السنوات القليلة الماضية، في السياقات الطبية، هو استخدام نماذج الذكاء الاصطناعي لتشخيص المرضى بناءً على الصور الطبية. قام فريق البحث بتحليل النماذج المستخدمة للكشف عن وجود حالات طبية مختلفة مثل الالتهاب الرئوي أو تضخم القلب أو الفتق من صور الأشعة السينية. درست فرق البحث ثلاثة هياكل مفتوحة المصدر: Inception-v3 و ResNet و DenseNet-121. تم تدريب النماذج على صور الأشعة السينية التي تم سحبها من مجموعتين مفتوحتين المصدر من جامعة ستانفورد والمعاهد الوطنية للصحة. على الرغم من أن مجموعات البيانات نفسها متوازنة بشكل معقول من حيث التمثيل الجنساني، إلا أن الباحثين أضافوا تحيزًا اصطناعيًا إلى البيانات من خلال تقسيمها إلى مجموعات فرعية فيها عدم توازن جنساني.

قام فريق البحث بإنشاء خمس مجموعات بيانات تدريبية مختلفة، كل منها يتكون من نسب مختلفة من مسح المرضى الذكور والإناث. تم تقسيم مجموعات التدريب الخمس على النحو التالي:

  • جميع الصور كانت لمرضى ذكور
  • جميع الصور كانت لمرضى إناث
  • 25٪ من المرضى الذكور و 75٪ من المرضى الإناث
  • 75٪ من المرضى الإناث و 25٪ من المرضى الذكور
  • نصف المرضى الذكور ونصف المرضى الإناث

بعد تدريب النموذج على واحدة من المجموعات الفرعية، تم اختباره على مجموعة من الصور من المرضى الذكور والإناث. كان هناك اتجاه ملحوظ موجود عبر الحالات الطبية المختلفة، وكان دقة النماذج أسوأ بكثير عندما كانت بيانات التدريب متحيزة جنسياً بشكل كبير. هناك شيء مثير للاهتمام هو أنه إذا كان أحد الجنسين ممثلاً بشكل زائد في بيانات التدريب، فلا يبدو أن هذا الجنس يستفيد من التمثيل الزائد. بغض النظر عما إذا كان النموذج مدربًا على بيانات متحيزة لجنس معين أو آخر، فإنه لا يؤدي بشكل أفضل على ذلك الجنس مقارنةً بالتدريب على مجموعة بيانات شاملة.

كان مؤلف الدراسة الرئيسي، Enzo Ferrante، مُتحدثًا مع Statnews، يشرح أن الدراسة تبرز مدى أهمية أن تكون بيانات التدريب متنوعة وممثلة لجميع السكان الذين تهدف إلى اختبار النموذج فيها.

ليس من الواضح تمامًا لماذا النماذج المُدرَّبة على جنس معين تؤدي أسوأ عند تنفيذها على جنس آخر. قد يكون بعض من التناقضات ناتجًا عن اختلافات فيزيولوجية، ولكن يمكن أن يكون هناك أيضًا عوامل اجتماعية وثقافية تُحسب لبعض من الفرق. على سبيل المثال، قد تتلقى النساء أشعة سينية في مرحلة مختلفة من مرضها عند مقارنتها بالرجال. إذا كان هذا صحيحًا، فإنه يمكن أن يؤثر على الميزات (والنماذج المُتعلمة من قبل النموذج) الموجودة في صور التدريب. إذا كان هذا هو الحال، فإنه يجعل من الصعب على الباحثين إزالة التحيز من مجموعات البيانات، لأن التحيز سيكون متأصلًا في مجموعة البيانات من خلال آليات جمع البيانات.

حتى الباحثون الذين يهتمون بتقدير تنوع البيانات قد لا يكون لديهم خيار آخر سوى العمل مع بيانات متحيزة أو متحيزة. الحالات التي توجد فيها عدم مساواة في كيفية تشخيص الحالات الطبية غالبًا ما تؤدي إلى عدم توازن في البيانات. على سبيل المثال، يتم جمع بيانات مرضى سرطان الثدي تقريبًا حصريًا من النساء. بشكل مماثل، يظهر مرض التوحد بشكل مختلف بين النساء والرجال، ونتيجة لذلك، يتم تشخيص الحالة بسرعة أكبر عند الأولاد منه عند البنات.

مع ذلك، من المهم جدًا للباحثين مراقبة البيانات المتحيزة وتحيز البيانات بأي طريقة يمكنهم. من أجل ذلك، سوف تساعد الدراسات المستقبلية الباحثين على量ification تأثير البيانات المتحيزة.

مدون وبرمجي متخصص في مواضيع Machine Learning و Deep Learning. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الخير الاجتماعي.