Connect with us

Sănătate

Crearea de seturi de date sintetice de răni cu rețele antagoniste generative

mm

Pentru prima dată, o Rețea Antagonistă Generativă este utilizată pentru a crea seturi de date sintetice de imagini de răni, în scopul de a remedia o lipsă critică de conținut divers și accesibil de acest tip în aplicațiile de învățare automată în sănătate.

Sistemul, numit WG2AN, este o colaborare între Batten College of Engineering & Technology și compania de sănătate AI eKare, care se specializează în aplicarea metodelor de învățare automată pentru măsurarea și identificarea rănilor.

Rețeaua Antagonistă Generativă este antrenată pe 100-4000 de imagini stereoscopice de răni cronice etichetate, furnizate de eKare, incluzând fotografii anonime de tipuri de leziuni cauzate de presiune, intervenții chirurgicale, incidente limfovasculare, diabet și arsuri. Materialul sursă variază în dimensiune între 1224×1224 și 2160×2160, toate fiind luate sub lumina disponibilă de către medici.

Pentru a se adapta la spațiul latent disponibil în arhitectura de antrenare a modelului, imaginile au fost redimensionate la 512×512 și extrase din fundal. Pentru a studia efectul dimensiunii setului de date, au fost efectuate teste pe loturi de 100, 250, 500, 1000, 2000 și 4000 de imagini.

Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Imaginea de mai sus arată un detaliu și o granulație crescute în funcție de dimensiunea setului de antrenare și de numărul de epoci efectuate pe fiecare trecere.

The architecture of WG. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Arhitectura WG2GAN. Source: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2AN rulează pe PyTorch pe un sistem de consumator relativ slab, cu 8GB de VRAM pe o placă grafică GTX 1080. Antrenarea a durat între 4-58 de ore pe o gamă de dimensiuni de set de date de la 100 la 4000 de imagini și pe o gamă de epoci, pe un lot de 64 ca o compromis între acuratețe și performanță. Optimizatorul Adam este utilizat pentru prima jumătate a antrenării la o rată de învățare de 0,0002 și încheiat cu o rată de învățare liniar descrescătoare până la o pierdere de zero.

Above left, segmentation applied to the wound area. Above center, image of the actual wound; above right, a synthetic wound of a type that can be generalized in a dataset, based on the original source. Below, the original wound, and, right, a synthesis of the wound generated by WG2GAN.

Sus-stânga, segmentarea aplicată zonei rănilor. Sus-centru, imaginea rănilor reale; sus-dreapta, o rană sintetică de un tip care poate fi generalizat într-un set de date, pe baza sursei originale. Jos, rana originală și, dreapta, o sinteză a rănilor generate de WG2GAN.

În seturile de date medicale, ca și în multe alte sectoare ale învățării automate, etichetarea este un blocaj inevitabil. În acest caz, cercetătorii au utilizat un sistem de etichetare semi-automatizat care valorifică cercetări anterioare de la eKare, care au utilizat modele de răni din lumea reală, create din Play-Doh și colorate aproximativ pentru context semantic.

eKare Wound models

Modele de răni eKare

Cercetătorii au remarcat o problemă care apare frecvent în stadiile inițiale de antrenare, atunci când un set de date este foarte divers și greutățile sunt randomizate – modelul necesită mult timp (75 de epoci) pentru a “se stabiliza”:

Atunci când datele sunt variate, atât modelele GAN, cât și cele encoder/decoder au dificultăți în a obține generalizarea în stadiile inițiale, așa cum se poate vedea în graficul de antrenare a WG2GAN, care urmărește cronologia antrenării de la început până la pierderea zero.

Trebuie să se acorde atenție pentru a se asigura că procesul de antrenare nu se fixează pe caracteristicile sau trăsăturile unei singure iterații sau epoci, ci continuă să generalizeze la o pierdere medie utilizabilă fără a produce rezultate care abstractizează excesiv materialul sursă. În cazul WG2GAN, acest lucru ar risca să creeze răni “fictive”, complet nelegate de tipurile de răni reale, în loc să producă o gamă realistă de variații în cadrul unui anumit tip de rană.

Controlul sferei într-un set de date de învățare automată

Modelele cu seturi de antrenare mai ușoare generalizează mai repede, iar cercetătorii susțin că imaginile cele mai realiste ar putea fi obținute la mai puțin de setările maxime: un set de date de 1000 de imagini antrenat pe 200 de epoci.

Deși seturile de date mai mici ar putea obține imagini foarte realiste în mai puțin timp, gama de imagini și tipurile de răni generate vor fi, de asemenea, mai limitate. Există un echilibru delicat în regimurile de antrenare GAN și encoder/decoder între volumul și varietatea datelor de intrare, fidelitatea imaginilor produse și realismul imaginilor produse — probleme de sferă și greutate care nu sunt deloc limitate la sinteza de imagini medicale.

Dezechilibrele de clasă în seturile de date medicale

În general, învățarea automată în sănătate este afectată nu numai de lipsa seturilor de date, ci și de dezechilibre de clasă, în care datele esențiale despre o anumită boală reprezintă o mică parte a setului de date gazdă, astfel încât riscă să fie respinse ca date outlier sau să fie asimilate în procesul de generalizare pe parcursul antrenării.

Au fost propuse o serie de metode pentru a aborda această problemă, cum ar fi sub-echantionarea sau supr-echantionarea. Cu toate acestea, problema este adesea ocolită prin dezvoltarea de seturi de date specifice bolilor care sunt legate de o singură problemă medicală. Deși această abordare este eficientă în fiecare caz, ea contribuie la cultura de balkanizare în sfera cercetării de învățare automată medicală și, probabil, încetinește progresul general în acest sector.

Scriitor pe machine learning, specialist în domeniul sintezei de imagini umane. Foster head of research content la Metaphysic.ai.