stub Өгөгдсөн сөрөг сүлжээнүүдийн тусламжтайгаар нийлэг шархны мэдээллийн багц үүсгэх нь - Unite.AI
бидэнтэй хамт холбоно

Эрүүл мэндийн

Үүсгэх сөрөг сүлжээнүүдээр нийлэг шархны мэдээллийн багц үүсгэх

mm

Нийтэлсэн

 on

Анх удаагаа А Гүйцэтгэх дайсны сүлжээ Эрүүл мэндийн машин сургалтын программуудад ийм төрлийн олон төрлийн, хүртээмжтэй контент дутагдаж байгааг арилгахын тулд шархны дүрсний синтетик мэдээллийн багцыг бий болгоход ашиглаж байна.

Систем гэж нэрлэдэг WG2AN, Баттен Инженер, Технологийн Коллеж болон AI эрүүл мэндийн eKare компанийн хамтын ажиллагаа бөгөөд шархыг хэмжих, тодорхойлоход машин сургалтын арга зүйг ашиглах чиглэлээр мэргэшсэн.

GAN нь даралт, мэс засал, тунгалагийн судасны эмгэг, чихрийн шижин, түлэгдэлт зэрэг шалтгааны улмаас үүссэн гэмтлийн төрлүүдийн нэргүй зургуудыг багтаасан eKare-аас олгодог стереоскопийн архаг шархны 100-4000 шошготой зураг дээр сургадаг. Эх материалын хэмжээ нь 1224×1224-аас 2160×2160 хооронд хэлбэлзэж байсан бөгөөд бүгдийг нь эмч нар боломжтой гэрлийн дор авсан.

Загварын сургалтын архитектурт байгаа далд орон зайг тохируулахын тулд зургуудын хэмжээг 512×512 болгон өөрчилж, дэвсгэрээс нь гаргаж авсан. Өгөгдлийн багцын хэмжээ нөлөөллийг судлахын тулд 100, 250, 500, 1000, 2000, 4000 зургийн багц дээр туршилтын туршилтуудыг хэрэгжүүлсэн.

Эх сурвалж: https://itresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Эх сурвалж: https://itresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Дээрх зураг нь тусалж буй сургалтын багцын хэмжээ, тооноос хамааран нэмэгдэж буй нарийвчилсан, нарийвчлалыг харуулж байна. эрин үе нэвтрүүлэх бүр дээр гүйх.

WG-ийн архитектур. Эх сурвалж: https://itresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN-ийн архитектур. Эх сурвалж: https://itresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN нь PyTorch дээр GTX 8 GPU дээр 1080 ГБ VRAM-тай, хэрэглэгчийн хэв маягийн харьцангуй энгийн тохиргоонд ажилладаг. Сургалт нь 4-58 зураг хүртэлх өгөгдлийн багцын хэмжээ, 100 багцын хэмжээтэй, нарийвчлал ба гүйцэтгэлийн хооронд 4000-64 цаг үргэлжилсэн. Adam Optimizer-ийг сургалтын эхний хагаст 0.0002 суралцах хурдаар ашигладаг бөгөөд тэг алдагдалд хүрэх хүртэл шугаман муудах сургалтын хурдаар дуусгадаг.

Зүүн талд, шархны хэсэгт сегментчилэн хэрэглэнэ. Төвөөс дээш, бодит шархны зураг; баруун дээд талд, анхны эх сурвалж дээр тулгуурлан өгөгдлийн багцад ерөнхийд нь оруулах боломжтой синтетик шарх. Доор, анхны шарх, баруун талд, WG2GAN-ийн үүсгэсэн шархны синтез.

Зүүн талд, шархны хэсэгт сегментчилэн хэрэглэнэ. Төвөөс дээш, бодит шархны зураг; баруун дээд талд, анхны эх сурвалж дээр тулгуурлан өгөгдлийн багцад ерөнхийд нь оруулах боломжтой синтетик шарх. Доор, анхны шарх, баруун талд, WG2GAN-ийн үүсгэсэн шархны синтез.

Эмнэлгийн мэдээллийн багцад машин сургалтын бусад олон салбарын нэгэн адил шошго нь зайлшгүй саад тотгор болдог. Энэ тохиолдолд судлаачид хөшүүрэг болох хагас автомат шошгын системийг ашигласан өмнөх судалгаа Play-Doh-д бүтээгдсэн шархны бодит загваруудыг ашигласан eKare-аас семантик контекстэд зориулж бараг өнгөөр ​​будсан.

eKare Wound загварууд

eKare Wound загварууд

Судлаачид сургалтын эхний үе шатанд өгөгдлийн багц нь нэлээд олон янз, жинг нь санамсаргүй байдлаар хуваах үед ихэвчлэн тохиолддог бэрхшээлийг тэмдэглэв - загвар нь "байх" хүртэл удаан хугацаа (75 эрин үе) шаарддаг:

Өгөгдөл янз бүр байгаа тохиолдолд GAN болон кодлогч/декодерийн загвар хоёулаа өмнөх үе шатанд ерөнхий ойлголтыг олж авахын тулд тэмцдэг бөгөөд үүнийг АХ-ын сургалтын дээрх графикаас харж болно.2Сургалт эхлэхээс эхлээд алдагдалгүй болтол нь хянадаг GAN.

Сургалтын үйл явц нь аль нэг давталт, эрин үеийн онцлог, шинж чанарт тулгуурлахгүй, харин эх материалыг хэт хийсвэрлэсэн үр дүнд хүргэхгүйгээр ашиглах боломжтой дундаж алдагдалд ерөнхийлөн чиглүүлэхийг анхаарах хэрэгтэй. АХ-ын хувьд2GAN, энэ нь тодорхой шархны төрөлд үнэн зөв хэлбэлзэл үүсгэхийн оронд хэт өргөн хүрээний хамааралгүй шархны төрлүүдийн дунд нэгтгэсэн, хязгааргүй, бүхэлдээ "зохиомол" шарх үүсгэх эрсдэлтэй.

Машин сургалтын мэдээллийн багц дахь хамрах хүрээг хянах

Хөнгөн сургалтын багц бүхий загваруудыг илүү хурдан нэгтгэдэг бөгөөд судлаачид хамгийн бодитой зургийг хамгийн дээд тохиргооноос бага хугацаанд авах боломжтой гэж үздэг: 1000 гаруй хугацаанд бэлтгэгдсэн 200 зургийн мэдээллийн багц.

Хэдийгээр жижиг өгөгдлийн багц нь богино хугацаанд маш бодитой дүрсийг олж авах боломжтой боловч үүссэн зураг, шархны төрөл нь илүү хязгаарлагдмал байх болно. GAN болон кодлогч/декодерын сургалтын горимд оролтын өгөгдлийн хэмжээ, олон янз байдал, үйлдвэрлэсэн зургийн үнэн зөв байдал, бүтээгдсэн зургийн бодит байдал зэрэг нарийн тэнцвэр байдаг - хамрах хүрээ, жингийн асуудал нь зөвхөн эмнэлгийн дүр төрхөөр хязгаарлагдахгүй. синтез.

Эмнэлгийн мэдээллийн багц дахь ангийн тэнцвэргүй байдал

Ерөнхийдөө эрүүл мэндийн машин сургалтыг зөвхөн a мэдээллийн багц дутмаг, гэхдээ ангийн тэнцвэргүй байдал, хэрэв тодорхой өвчний талаархи чухал өгөгдөл нь түүний үндсэн мэдээллийн багцын маш бага хувийг эзэлдэг бөгөөд энэ нь хэт давсан өгөгдөл гэж үгүйсгэгдэх эсвэл сургалтын явцад ерөнхийлөн боловсруулах явцад шингээх эрсдэлтэй.

гэх мэт сүүлийн асуудлыг шийдвэрлэх хэд хэдэн аргыг санал болгосон дутуу дээж авах эсвэл хэт дээж авах. Гэсэн хэдий ч, асуудал нь ихэвчлэн нэг эмнэлгийн асуудалтай бүхэлдээ холбоотой өвчний өвөрмөц мэдээллийн багцыг боловсруулах замаар хажуу тийшээ шийдэгддэг. Хэдийгээр энэ арга нь тус бүрдээ үр дүнтэй боловч соёлд хувь нэмэр оруулдаг Балканчлал Эмнэлгийн машин сургалтын судалгааны чиглэлээр ажиллаж байгаа бөгөөд энэ салбарын ерөнхий ахиц дэвшлийг удаашруулж байна.