stub Sintetinių žaizdų duomenų rinkinių kūrimas naudojant generuojančius priešpriešinius tinklus – Unite.AI
Susisiekti su mumis

Sveikatos apsauga

Sintetinių žaizdų duomenų rinkinių kūrimas naudojant generatyvius priešpriešinius tinklus

mm

paskelbta

 on

Pirmą kartą a Generacinis prieštaringų tinklas yra naudojamas kuriant sintetinius žaizdų vaizdų duomenų rinkinius, siekiant ištaisyti kritinį įvairaus ir prieinamo tokio tipo turinio trūkumą sveikatos priežiūros mašininio mokymosi programose.

Sistema, vadinama WG2AN, yra Batten College of Engineering & Technology ir AI sveikatos įmonės eKare, kurios specializacija yra mašininio mokymosi metodikos taikymas žaizdoms matuoti ir identifikuoti, bendradarbiavimas.

GAN yra apmokytas naudojant 100–4000 paženklintų stereoskopinių lėtinių žaizdų vaizdų, kuriuos pateikia „eKare“, įskaitant anoniminius sužalojimų, susijusių su tokiomis priežastimis kaip spaudimas, chirurgija, limfovaskuliniai incidentai, diabetas ir nudegimai, nuotraukas. Pradinės medžiagos dydis svyravo nuo 1224 × 1224 iki 2160 × 2160, o gydytojai visa tai apžvelgė turimoje šviesoje.

Siekiant pritaikyti turimą latentinę erdvę modelio mokymo architektūroje, vaizdai buvo pakeisti iki 512 × 512 ir išgauti iš jų fono. Norint ištirti duomenų rinkinio dydžio poveikį, buvo atlikti bandomieji 100, 250, 500, 1000, 2000 ir 4000 vaizdų paketai.

Šaltinis: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Šaltinis: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Aukščiau esančiame paveikslėlyje pavaizduota vis daugiau detalių ir detalumo, atsižvelgiant į treniruočių rinkinio dydį ir skaičių epochos bėgti kiekviename pravažiavime.

WG architektūra. Šaltinis: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN architektūra. Šaltinis: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN veikia „PyTorch“ naudojant santykinai nedidelę vartotojo stiliaus sąranką su 8 GB VRAM GTX 1080 GPU. Mokymas užtruko nuo 4 iki 58 valandų duomenų rinkinio dydžių diapazone nuo 100 iki 4000 64 vaizdų ir įvairiomis epochomis, kai partijos dydis buvo 0.0002, kaip kompromisą tarp tikslumo ir našumo. „Adam Optimizer“ naudojamas pirmoje treniruočių pusėje, kai mokymosi dažnis yra XNUMX, o baigiamas tiesiniu mažėjančiu mokymosi greičiu, kol pasiekiamas nulio praradimas.

Viršuje kairėje žaizdos srityje taikoma segmentacija. Virš centro – tikrosios žaizdos vaizdas; viršuje dešinėje – sintetinė žaizda, kurios tipas gali būti apibendrintas duomenų rinkinyje, remiantis pirminiu šaltiniu. Žemiau yra originali žaizda ir, dešinėje, WG2GAN sukurta žaizdos sintezė.

Viršuje kairėje žaizdos srityje taikoma segmentacija. Virš centro – tikrosios žaizdos vaizdas; viršuje dešinėje – sintetinė žaizda, kurios tipas gali būti apibendrintas duomenų rinkinyje, remiantis pirminiu šaltiniu. Žemiau yra originali žaizda ir, dešinėje, WG2GAN sukurta žaizdos sintezė.

Medicinos duomenų rinkiniuose, kaip ir daugelyje kitų mašininio mokymosi sektorių, ženklinimas yra neišvengiama kliūtis. Šiuo atveju mokslininkai naudojo pusiau automatinę ženklinimo sistemą, kuri svertų ankstesnius tyrimus iš „eKare“, kurioje buvo naudojami realaus pasaulio žaizdų modeliai, sukurti „Play-Doh“ ir grubiai nuspalvinti semantiniam kontekstui.

eKare Wound modeliai

eKare Wound modeliai

Tyrėjai atkreipė dėmesį į problemą, kuri dažnai iškyla pradinėse treniruočių stadijose, kai duomenų rinkinys yra gana įvairus ir svoriai yra atsitiktinai suskirstyti – modeliui reikia ilgai (75 epochos) „nustvirtinti“:

Kai duomenys yra įvairūs, tiek GAN, tiek kodavimo / dekodavimo modeliai stengiasi gauti apibendrinimą ankstesniuose etapuose, kaip matome aukščiau pateiktame WG mokymo grafike.2GAN, kuris seka treniruočių laiko juostą nuo pradžios iki nulinio praradimo.

Reikia pasirūpinti, kad mokymo procesas nebūtų susijęs su vienos iteracijos ar epochos ypatybėmis ar charakteristikomis, o būtų toliau apibendrintas iki naudingo vidutinio nuostolio, negaunant rezultatų, kurie pernelyg abstrahuoja pradinę medžiagą. WG atveju2GAN, dėl kurio kiltų grėsmė sukurti neapribotas, visiškai „išgalvotas“ žaizdas, susietas tarp per daug nesusijusių žaizdų tipų, o ne sukurti tikslią konkretaus žaizdos tipo variacijų diapazoną.

Apimties valdymas mašininio mokymosi duomenų rinkinyje

Modeliai su lengvesniais mokymo rinkiniais apibendrina greičiau, o straipsnio tyrėjai tvirtina, kad tikroviškiausius vaizdus galima gauti naudojant mažesnius nei maksimalius nustatymus: 1000 vaizdų duomenų rinkinys, parengtas per 200 epochų.

Nors naudojant mažesnius duomenų rinkinius galima gauti labai tikroviškus vaizdus per trumpesnį laiką, vaizdų ir sukurtų žaizdų tipų diapazonas taip pat bus ribotas. GAN ir kodavimo/dekoderio mokymo režimuose yra subtili pusiausvyra tarp įvesties duomenų apimties ir įvairovės, sukurtų vaizdų tikslumo ir sukurtų vaizdų tikroviškumo – apimties ir svorio problemos, kurios tikrai neapsiriboja medicininiu vaizdu. sintezė.

Klasės disbalansas medicinos duomenų rinkiniuose

Apskritai sveikatos priežiūros mašininis mokymasis yra apsunkintas ne tik a duomenų rinkinių trūkumas, bet iki klasių disbalansas, kai esminiai duomenys apie konkrečią ligą sudaro tokią mažą jos pagrindinio duomenų rinkinio procentą, kad jie gali būti atmesti kaip išskirtiniai duomenys arba būti asimiliuoti apibendrinimo procese mokymosi metu.

Pastarajai problemai spręsti buvo pasiūlyta nemažai metodų, pvz per maža arba per didelė atranka. Tačiau problema dažnai pašalinama sukuriant konkrečiai ligai būdingus duomenų rinkinius, kurie yra visiškai susieti su viena medicinine problema. Nors šis metodas yra veiksmingas kiekvienu atveju, jis prisideda prie kultūros Balkanizacija medicinos mašininio mokymosi tyrimų srityje ir, be abejo, lėtina bendrą pažangą šiame sektoriuje.