taló Els models d'IA entrenats en dades esbiaixades pel sexe funcionen pitjor en el diagnòstic de malalties - Unite.AI
Connecteu-vos amb nosaltres

Salut

Els models d'IA entrenats en dades esbiaixades pel sexe tenen pitjor rendiment en el diagnòstic de malalties

mm

publicat

 on

Recentment, a estudi publicat a la revista PNAS i realitzada per investigadors de l'Argentina, va implicar que la presència de dades d'entrenament desviades pel sexe condueix a un pitjor rendiment del model a l'hora de diagnosticar malalties i altres problemes mèdics. Segons informa Statsnews, l'equip d'investigadors va experimentar amb models d'entrenament on les pacients estaven notablement subrepresentades o excloses del tot, i van trobar que l'algorisme funcionava substancialment pitjor en diagnosticar-los. El mateix també va passar per als incidents en què els pacients masculins estaven exclosos o poc representats.

Durant l'última mitja dècada, a mesura que els models d'IA i l'aprenentatge automàtic s'han tornat més omnipresents, s'ha prestat més atenció als problemes dels conjunts de dades esbiaixats i als models d'aprenentatge automàtic esbiaixats que se'n deriven. El biaix de les dades en l'aprenentatge automàtic pot conduir a aplicacions d'IA incòmodes, socialment perjudicials i exclusives, però quan es tracta d'aplicacions mèdiques, les vides poden estar en joc. Tanmateix, malgrat el coneixement del problema, pocs estudis han intentat quantificar fins a quin punt poden ser perjudicials els conjunts de dades esbiaixats. L'estudi realitzat per l'equip d'investigació va trobar que el biaix de les dades podria tenir efectes més extrems dels que molts experts estimaven anteriorment.

Un dels usos més populars de la IA en els últims anys, en contextos mèdics, ha estat l'ús de models d'IA per diagnosticar pacients a partir d'imatges mèdiques. L'equip d'investigació va analitzar models utilitzats per detectar la presència de diverses condicions mèdiques com la pneumònia, la cardiomegàlia o les hèrnies a partir de raigs X. Els equips de recerca van estudiar tres arquitectures de models de codi obert: Inception-v3, ResNet i DenseNet-121. Els models es van formar amb raigs X de tòrax extrets de dos conjunts de dades de codi obert procedents de la Universitat de Stanford i els Instituts Nacionals de Salut. Tot i que els conjunts de dades estan bastant equilibrats pel que fa a la representació del sexe, els investigadors van esbiaixar artificialment les dades dividint-les en subconjunts on hi havia un desequilibri sexual.

L'equip d'investigació va crear cinc conjunts de dades d'entrenament diferents, cadascun compost per diferents proporcions d'exploracions de pacients homes/femenes. Els cinc conjunts d'entrenament es van desglossar de la següent manera:

  • Totes les imatges eren de pacients homes
  • Totes les imatges eren de pacients femenines
  • 25% pacients homes i 75% dones
  • 75% pacients dones i 25% pacients homes
  • Meitat pacients homes i meitat pacients dones

Després d'entrenar el model en un dels subconjunts, es va provar en una col·lecció d'exploracions de pacients tant masculins com femenins. Hi va haver una tendència notable present a les diferents condicions mèdiques, la precisió dels models va ser molt pitjor quan les dades d'entrenament estaven significativament esbiaixades pel sexe. Una cosa interessant a destacar és que si un sexe estava sobrerepresentat a les dades d'entrenament, aquest sexe no semblava beneficiar-se de la sobrerepresentació. Independentment de si el model va ser entrenat o no amb dades esbiaixades per a un sexe o un altre, no va tenir un millor rendiment en aquest sexe en comparació amb quan es va entrenar en un conjunt de dades inclusiu.

L'autor principal de l'estudi, Enzo Ferrante, va ser citat per Statnews ja que explica que l'estudi subratlla la importància que les dades de formació siguin diverses i representatives per a totes les poblacions en què es vol provar el model.

No està del tot clar per què els models entrenats en un sexe tendeixen a tenir pitjor rendiment quan s'implementen en un altre sexe. Algunes de les discrepàncies poden ser degudes a diferències fisiològiques, però diversos factors socials i culturals també podrien explicar part de la diferència. Per exemple, les dones poden tendir a rebre raigs X en una etapa diferent de progressió de la seva malaltia en comparació amb els homes. Si això fos cert, podria afectar les característiques (i, per tant, els patrons apresos pel model) que es troben a les imatges d'entrenament. Si aquest és el cas, fa que sigui molt més difícil per als investigadors desviar els seus conjunts de dades, ja que el biaix s'incorporaria al conjunt de dades mitjançant els mecanismes de recollida de dades.

Fins i tot els investigadors que presten molta atenció a la diversitat de dades de vegades no tenen més remei que treballar amb dades esbiaixades o esbiaixades. Les situacions en què existeix una disparitat entre com es diagnostiquen les condicions mèdiques sovint conduiran a dades de desequilibri. Per exemple, les dades sobre pacients amb càncer de mama es recullen gairebé completament de dones. De la mateixa manera, l'autisme es manifesta de manera diferent entre dones i homes i, com a resultat, la malaltia es diagnostica a un índex molt més elevat en els nens que en les noies.

No obstant això, és extremadament important que els investigadors controlin les dades esbiaixades i el biaix de les dades de la manera que puguin. Amb aquesta finalitat, els estudis futurs ajudaran els investigadors a quantificar l'impacte de les dades esbiaixades.