Sundhedsvæsen
Oprettelse af syntetiske sårdataser med generative adversarial netværk

For første gang bliver et Generative Adversarial Network brugt til at oprette syntetiske dataser af sår billeder, for at imødekomme en kritisk mangel på diverse og tilgængelige indhold af denne type i sundhedsrelaterede maskinlæringsapplikationer.
Systemet, der hedder WG2AN, er et samarbejde mellem Batten College of Engineering & Technology og AI-sundhedsfirmaet eKare, der specialiserer sig i at anvende maskinlæringsmetoder til måling og identifikation af sår.
GAN’en er trænet på 100-4000 mærkede stereoskopiske kroniske sår billeder leveret af eKare, herunder anonymiserede billeder af skadetyper fra årsager som tryk, kirurgi, lymfødem-tilfælde, diabetes og brændsår. Kilde materialet varierede i størrelse mellem 1224×1224 til 2160×2160, alle taget under tilgængeligt lys af læger.
For at tilpasse den tilgængelige latente rum i modellens træningsarkitektur, blev billederne reskaleret til 512×512 og udtrukket fra deres baggrunde. For at studere effekten af datasætsstørrelse, blev testkørsler implementeret på batch af 100, 250, 500, 1000, 2000 og 4000 billeder.
Billedet ovenfor viser øgende detaljer og granularitet i forhold til størrelsen af det bidragende træningsset, og antallet af epochs kørt på hver passage.

The architecture of WG2GAN. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
WG2GAN kører på PyTorch på en relativt lean forbrugerstyle setup, med 8GB VRAM på en GTX 1080 GPU. Træningen tog mellem 4-58 timer over datasætsstørrelserne fra 100-4000 billeder, og over en række epochs, på en batch-størrelse på 64 som en balance mellem nøjagtighed og ydeevne. Adam Optimizer bliver brugt til den første halvdel af træningen med en læringsrate på 0,0002, og afsluttes med en lineær aftagende læringsrate indtil en tab på nul opnås.

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.
I medicinske dataser, som i mange andre områder af maskinlæring, er mærkning en uundgåelig flaskehals. I dette tilfælde brugte forskerne et semi-automatisk mærkningsystem, der udnytter tidligere forskning fra eKare, der anvendte virkelige modeller af sår, lavet i Play-Doh og omtrent farvet for semantisk kontekst.

eKare Wound models
Forskerne bemærkede et problem, der ofte opstår i de tidlige stadier af træning, når en datasæt er ret divers og vægte er tilfældigt valgt – modellen tager lang tid (75 epochs) at ‘sætte sig’:

Hvor data er varieret, kæmper både GAN og encoder/decoder-modeller med at opnå generalisering i de tidlige stadier, som vi kan se bevis i ovenstående graf over træningen af WG2GAN, der sporer træningstidslinjen fra start til nul tab.
Man skal være forsigtig for at sikre, at træningsprocessen ikke fastholder sig til funktionerne eller karakteristikkerne af en enkelt iteration eller epoch, men i stedet fortsætter med at generalisere til en brugbar gennemsnitlig tab uden at producere resultater, der for meget abstraherer kilde materialet. I tilfælde af WG2GAN ville det risikere at skabe ubundne, helt ‘fiktive’ sår, sammensat af for mange ulige sårtyper, i stedet for at producere en præcis række variationer inden for en bestemt sårtype.
Kontrol af omfang i en maskinlæringsdatasæt
Modeller med lettere træningssets generaliserer hurtigere, og papirets forskere hævder, at de mest realistiske billeder kunne opnås ved mindre end de maksimale indstillinger: en 1000 billed datasæt trænet over 200 epochs.
Selvom mindre dataser måske kan opnå meget realistiske billeder på kortere tid, vil rækkevidden af billeder og typer af sår, der genereres, nødvendigvis være mere begrænsede. Der er en delikat balance i GAN og encoder/decoder-træningsregimer mellem volumen og variation af inputdata, troværdigheden af de producerede billeder og realisme af de producerede billeder — spørgsmål om omfang og vægtning, der bestemt ikke er begrænset til medicinsk billedsynthese.
Klasse-ubalancer i medicinske dataser
I almindelighed er sundhedsrelateret maskinlæring ikke kun ramt af en mangel på dataser, men også af klasse-ubalancer, hvor væsentlig data om en bestemt sygdom udgør så lille en procentdel af dens værtsdatasæt, at den risikerer at blive afvist som outlier-data eller at blive assimileret i processen med generalisering under træning.
En række metoder er blevet foreslået for at imødekomme det sidstnævnte problem, såsom under-sampling eller over-sampling. Men problemet bliver ofte side-stillet ved at udvikle sygdomsspecifikke dataser, der er fuldstændigt bundet til en enkelt medicinsk problem. Selvom denne tilgang er effektiv på en per-case-basis, bidrager den til kulturen af Balkanisering i sfæren af medicinsk maskinlæringsforskning og kan muligvis langsommere den generelle fremgang i sektoren.













