Sanità
Dati Sintetici: Cambiare la Razza in Immagini Facce per Affrontare il Pregiudizio nei Set di Dati Medici

I ricercatori della UCLA hanno sviluppato un metodo per cambiare la razza apparente dei volti nei set di dati utilizzati per addestrare i sistemi di apprendimento automatico medico, nel tentativo di ridurre il pregiudizio razziale che molti set di dati comuni subiscono.
Il nuovo tecnica è in grado di produrre video sintetici fotorealistici e fisiologicamente accurati a un tasso medio di 0,005 secondi per frame, e si spera che aiuti lo sviluppo di nuovi sistemi di diagnostica per la diagnosi e il monitoraggio della salute a distanza – un settore che si è ampliato notevolmente sotto le restrizioni del COVID. Il sistema è destinato a migliorare l’applicabilità della fotopletismografia remota (rPPG), una tecnica di visione computerizzata che valuta il contenuto video facciale per rilevare i cambiamenti volumetrici nell’apporto di sangue in modo non invasivo.
Sebbene il lavoro, che utilizza reti neurali convoluzionali (CNN), incorpori il codice di ricerca precedente pubblicato dall’Università di Durham nel 2020, la nuova applicazione è destinata a preservare i segnali pulsanti nei dati di test originali, piuttosto che semplicemente cambiare visivamente la razza apparente dei dati, come fa la ricerca del 2020.
CNN per Trasformazione Razziale
La prima parte del sistema encoder-decoder utilizza il modello di trasferimento razziale di Durham, pre-addestrato su VGGFace2, per generare frame di destinazione proxy con il componente caucasico-africano della ricerca di Durham. Ciò produce un trasferimento piatto di caratteristiche razziali, ma non contiene le variazioni di colore e tono che rappresentano indicatori fisiologici visivi dello stato di flusso sanguigno del paziente.

La pipeline di trasformazione dalla ricerca del 2020 dell’Università di Durham, parte della quale è incorporata nella nuova ricerca della UCLA. Source: https://arxiv.org/pdf/2004.08945.pdf. Clicca per ingrandire.
Una seconda rete, chiamata PhysResNet (PRN), fornisce il componente rPPG. PhysResNet è addestrato per imparare sia l’aspetto visivo che le variazioni di colore che definiscono i movimenti del volume sanguigno sottocutaneo.

In basso a sinistra, i risultati ottenuti dalla ricerca del 2020 dell’Università di Durham, che mancano di informazioni PPG. Al centro sinistra, le informazioni PPG incorporate nella trasformazione razziale. Clicca per ingrandire.
L’architettura proposta dal progetto UCLA supera le tecniche rPPG concorrenti anche in assenza di aumento del colore della pelle, rappresentando un miglioramento del 31% rispetto a tecniche simili ottimizzate con MAE e RMSE.

La rete UCLA preserva con successo le informazioni di volume e distribuzione del sangue. Clicca per ingrandire.
I ricercatori della UCLA sperano che i lavori futuri affronteranno sfide più estensive per ridurre il pregiudizio razziale in questo settore dell’imaging medico, e sperano anche che schemi successivi produrranno video ad alta risoluzione, poiché il sistema in questione è limitato a una risoluzione di 80×80 pixel – adatta ragionevolmente bene alle limitazioni della telemedicina, ma non ideale.
Mancanza di Set di Dati Etnicamente Diversi
Le circostanze economiche e pratiche che portano a set di dati razzialmente diversi sono state un ostacolo alla ricerca medica per alcuni anni. I dati tendono a essere generati in modo parrocchiale, con molti fattori che contribuiscono a una frequente omogeneità caucasica dei soggetti dei dati. Ciò include la composizione delle minoranze demografiche nelle città in cui si svolge la ricerca, e altri fattori socioeconomici che possono influenzare la misura in cui i soggetti non bianchi appaiono nei set di dati occidentali che i ricercatori desidererebbero avere una maggiore applicabilità globale.
In paesi con una proporzione più alta di soggetti dalla pelle scura, l’attrezzatura e le risorse necessarie per raccogliere i dati sono spesso carenti.

Una mappa del tono della pelle per popolazioni indigene, dalla rivista American Journal of Physical Anthropology.
Attualmente i soggetti dalla pelle scura sono notevolmente sottorappresentati nei set di dati rPPG, rappresentando il 0%, il 5% e il 10% del contenuto dei tre database principali utilizzati a questo scopo.
Dati Caucasici Omogenei
Nel 2019 una nuova ricerca pubblicata su Science ha scoperto che un algoritmo ampiamente diffuso nelle cure ospedaliere negli Stati Uniti era fortemente distorto a favore dei soggetti caucasici. Lo studio ha scoperto che le persone nere erano meno probabili di essere indirizzate a cure specializzate nella triage e nei livelli più profondi di ammissione ospedaliera.
Ulteriori ricerche nello stesso anno da ricercatori in Malesia e Australia hanno stabilito il problema generale del ‘pregiudizio della propria razza’ per la generazione di set di dati in molte regioni del mondo, compresa l’Asia.
Potenziali Limitazioni di Scala e Architettura
Alcune delle limitazioni che hanno portato a set di dati a limitata etnia sono di natura pragmatica piuttosto che etica. Maggiore è la pluralità dei dati contribuenti, meglio si generalizza attraverso i soggetti presenti in quei dati, ma minore è la probabilità che la routine di addestramento intuisca modelli all’interno di qualsiasi caratteristica dei dati, compresa la razza, poiché una percentuale minore di tempo di addestramento, attenzione e risorse è disponibile per ogni subset identificabile dei dati.
Ciò può portare a modelli che sono ampiamente applicabili ma ottengono risultati meno specifici, a causa delle limitazioni della dimensione dei dati, dell’economia della dimensione del batch e delle limitazioni pratiche dello spazio latente come funzione delle limitazioni delle risorse hardware.
All’estremo opposto, sebbene i risultati efficaci e granulari possano essere ottenuti limitando i dati di input a un set di caratteristiche più limitate, compresa l’etnia, i risultati sono probabilmente ‘sovrapposti’ ai dati limitati e non ampiamente applicabili, forse neanche attraverso soggetti non visti nella stessa area geografica da cui sono stati ottenuti i soggetti del set di dati originale.
Avatar Sintetici per Simulazione PPG
La ricerca della UCLA nota anche il lavoro precedente della Microsoft Research nel 2020 sull’uso di avatar sintetici flessibili razzialmente, che sfrutta la sintesi di immagini 3D per creare video di facce ricchi di informazioni PPG.

Avatar sintetici creati dalla ricerca di Microsoft, con immagini ray-traced che contengono dati PPG. Source: https://arxiv.org/pdf/2010.12949.pdf. Clicca per ingrandire.













