Sănătate
Modele AI antrenate pe date cu bias de sex au o performanță mai slabă la diagnosticarea bolilor

Recent, o studiu publicat în jurnalul PNAS și realizat de cercetători din Argentina, a sugerat că prezența datelor de antrenare cu bias de sex conduce la o performanță mai slabă a modelului la diagnosticarea bolilor și a altor probleme medicale. După cum a raportat Statnews, echipa de cercetători a experimentat cu modele de antrenare în care pacienții femei erau subreprezentați sau excluși în totalitate, și a constatat că algoritmul a avut o performanță substanțial mai slabă la diagnosticarea acestora. Același lucru s-a dovedit a fi valabil și pentru incidentele în care pacienții bărbați erau excluși sau subreprezentați.
În ultimul deceniu și jumătate, pe măsură ce modelele AI și învățarea automată au devenit mai ubiquue, s-a acordat mai multă atenție problemelor legate de seturile de date cu bias și modelele de învățare automată cu bias care rezultă din acestea. Biasul în datele de învățare automată poate conduce la aplicații AI jenante, sociale și dăunătoare, dar atunci când vine vorba de aplicații medicale, viețile pot fi în pericol. Cu toate acestea, în ciuda cunoașterii problemei, puține studii au încercat să cuantifice cât de dăunător poate fi biasul în seturile de date. Studiul realizat de echipa de cercetători a constatat că biasul în date poate avea efecte mai extreme decât se estima inițial.
Una dintre cele mai populare utilizări ale AI în ultimii ani, în contexte medicale, a fost utilizarea modelelor AI pentru diagnosticarea pacienților pe baza imaginilor medicale. Echipa de cercetători a analizat modele utilizate pentru detectarea prezenței diferitelor afecțiuni medicale, cum ar fi pneumonia, cardiomegalia sau herniile, din radiografii. Echipa de cercetători a studiat trei arhitecturi de modele deschise: Inception-v3, ResNet și DenseNet-121. Modelele au fost antrenate pe radiografii toracice extrase din două seturi de date deschise originare de la Universitatea Stanford și Institutul Național de Sănătate. Deși seturile de date în sine sunt destul de echilibrate în ceea ce privește reprezentarea sexului, cercetătorii au creat artificial un dezechilibru prin împărțirea lor în subseturi cu dezechilibru de sex.
Echipa de cercetători a creat cinci seturi de date de antrenare diferite, fiecare compus din raporturi diferite de scanări de pacienți bărbați și femei. Cele cinci seturi de antrenare au fost împărțite astfel:
- Toate imaginile erau de pacienți bărbați
- Toate imaginile erau de pacienți femei
- 25% pacienți bărbați și 75% pacienți femei
- 75% pacienți femei și 25% pacienți bărbați
- Jumătate pacienți bărbați și jumătate pacienți femei
După ce modelul a fost antrenat pe una dintre subseturi, a fost testat pe o colecție de scanări de la pacienți bărbați și femei. A existat o tendință notabilă prezentă în diferitele afecțiuni medicale, acuratețea modelelor a fost mult mai slabă atunci când datele de antrenare erau semnificativ dezechilibrate din punct de vedere al sexului. Un lucru interesant de remarcat este că, dacă un sex era suprareprezentat în datele de antrenare, acel sex nu părea să beneficieze de suprareprezentare. Indiferent dacă modelul a fost antrenat pe date dezechilibrate pentru un sex sau altul, nu a performant mai bine pe acel sex comparativ cu când a fost antrenat pe un set de date incluziv.
Autorul senior al studiului, Enzo Ferrante, a fost citat de Statnews ca explicând că studiul subliniază cât de important este ca datele de antrenare să fie diverse și reprezentative pentru toate populațiile pe care intenționați să testați modelul.
Nu este în întregime clar de ce modelele antrenate pe un sex tind să aibă o performanță mai slabă atunci când sunt implementate pe alt sex. Unele dintre discrepanțe ar putea fi cauzate de diferențe fiziologice, dar factorii sociali și culturali ar putea să contibuie și la unele dintre diferențe. De exemplu, femeile pot primi radiografii la o etapă diferită de progresie a bolii comparativ cu bărbații. Dacă acest lucru este adevărat, ar putea afecta caracteristicile (și, prin urmare, modelele învățate de model) găsite în imaginile de antrenare. Dacă acesta este cazul, devine mult mai dificil pentru cercetători să debiasizeze seturile de date, deoarece biasul ar fi încorporat în setul de date prin mecanismele de colectare a datelor.
Chiar și cercetătorii care acordă atenție deosebită diversității datelor nu au întotdeauna posibilitatea de a lucra cu date care nu sunt dezechilibrate sau biasate. Situațiile în care există o disparitate în ceea ce privește modul în care sunt diagnosticate afecțiunile medicale vor conduce adesea la date dezechilibrate. De exemplu, datele despre pacienții cu cancer de sân sunt colectate almost în întregime de la femei. Similar, autismul se manifestă diferit la femei și bărbați, și, ca urmare, afecțiunea este diagnosticată la un nivel mult mai ridicat la băieți decât la fete.
Cu toate acestea, este extrem de important ca cercetătorii să controleze datele dezechilibrate și biasul în orice mod posibil. În acest sens, studii viitoare vor ajuta cercetătorii să cuantifice impactul datelor biasate.












