Sanità
Creazione di set di dati sintetici di ferite con reti avversarie generative

Per la prima volta, una rete avversaria generativa viene utilizzata per creare set di dati sintetici di immagini di ferite, al fine di risolvere una carenza critica di contenuti diversi e accessibili di questo tipo nelle applicazioni di apprendimento automatico sanitario.
Il sistema, chiamato WG2AN, è una collaborazione tra il Batten College of Engineering & Technology e la società di intelligenza artificiale sanitaria eKare, che si specializza nell’applicazione di metodologie di apprendimento automatico alla misurazione e all’identificazione delle ferite.
La rete avversaria generativa è addestrata su 100-4000 immagini stereoscopiche di ferite croniche etichettate fornite da eKare, comprese immagini anonime di tipi di lesioni causate da pressione, chirurgia, incidenti linfovascolari, diabete e ustioni. Il materiale di origine variava in dimensione tra 1224×1224 e 2160×2160, tutte scattate con luce disponibile da medici.
Per adattarsi allo spazio latente disponibile nell’architettura di addestramento del modello, le immagini sono state ridimensionate a 512×512 e estratte dai loro sfondi. Per studiare l’effetto della dimensione del set di dati, sono stati eseguiti test su lotti di 100, 250, 500, 1000, 2000 e 4000 immagini.
L’immagine sopra mostra un aumento di dettaglio e granularità in base alla dimensione del set di addestramento e al numero di epoch eseguiti in ogni passaggio.

The architecture of WG2GAN. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
WG2AN funziona su PyTorch su un setup consumer relativamente leggero, con 8GB di VRAM su una GPU GTX 1080. L’addestramento ha richiesto tra 4-58 ore su una gamma di dimensioni di set di dati da 100-4000 immagini, e su una gamma di epoch, su un batch size di 64 come compromesso tra accuratezza e prestazioni. L’Adam Optimizer viene utilizzato per la prima metà dell’addestramento con un tasso di apprendimento di 0,0002, e concluso con un tasso di apprendimento lineare decrescente fino a quando non si raggiunge una perdita di zero.

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.
Nei set di dati medici, come in molti altri settori dell’apprendimento automatico, l’etichettatura è un collo di bottiglia inevitabile. In questo caso, i ricercatori hanno utilizzato un sistema di etichettatura semi-automatizzato che sfrutta ricerche precedenti di eKare, che hanno utilizzato modelli di ferite reali creati con Play-Doh e colorati approssimativamente per contesto semantico.

eKare Wound models
I ricercatori hanno notato un problema che si verifica frequentemente nelle fasi iniziali dell’addestramento, quando un set di dati è molto diversificato e i pesi sono casuali – il modello impiega molto tempo (75 epoch) per “stabilizzarsi”:

Dove i dati sono variegati, sia i modelli GAN che quelli encoder/decoder faticano a ottenere generalizzazione nelle fasi iniziali, come possiamo vedere evidenziato nel grafico dell’addestramento di WG2GAN, che traccia la timeline dell’addestramento dall’inizio alla perdita di zero.
È necessario prestare attenzione per assicurarsi che il processo di addestramento non si concentri sulle caratteristiche o sui caratteri di un’iterazione o di un’epoca specifica, ma continui a generalizzare a una perdita media utilizzabile senza produrre risultati che astraggono eccessivamente il materiale di origine. Nel caso di WG2GAN, ciò rischierebbe di creare ferite “fittizie” non limitate, concatenate tra una gamma troppo ampia di tipi di ferite non correlate, piuttosto che produrre una gamma precisa di variazioni all’interno di un particolare tipo di ferita.
Controllare l’ambito in un set di dati di apprendimento automatico
I modelli con set di addestramento più leggeri generalizzano più velocemente, e i ricercatori del paper sostengono che le immagini più realistiche potrebbero essere ottenute con impostazioni inferiori al massimo: un set di dati di 1000 immagini addestrate su 200 epoch.
Sebbene i set di dati più piccoli possano ottenere immagini molto realistiche in meno tempo, la gamma di immagini e i tipi di ferite generati saranno necessariamente più limitati. Esiste un equilibrio delicato nei regimi di addestramento GAN e encoder/decoder tra il volume e la varietà dei dati di input, la fedeltà delle immagini prodotte e la realismo delle immagini prodotte — questioni di ambito e ponderazione che non sono certamente limitate alla sintesi di immagini mediche.
Classi sbilanciate nei set di dati medici
In generale, l’apprendimento automatico sanitario è afflitto non solo da una carenza di set di dati, ma anche da classi sbilanciate, dove i dati essenziali su una specifica malattia costituiscono una percentuale così piccola del set di dati di riferimento che rischiano di essere scartati come dati outlier o di essere assimilati nel processo di generalizzazione durante l’addestramento.
Sono stati proposti diversi metodi per affrontare questo problema, come sottocampionamento o sovracampionamento. Tuttavia, il problema è spesso aggirato sviluppando set di dati specifici della malattia che sono interamente vincolati a un singolo problema medico. Sebbene questo approccio sia efficace su base caso per caso, contribuisce alla cultura di balkanizzazione nella sfera della ricerca sull’apprendimento automatico medico e rallenta probabilmente i progressi generali nel settore.













