saplama Üretici Düşman Ağlarla Sentetik Yara Veri Kümeleri Oluşturma - Unite.AI
Bizimle iletişime geçin

Sağlık hizmeti

Üretici Düşman Ağları ile Sentetik Yara Veri Kümeleri Oluşturma

mm

Yayınlanan

 on

İlk kez, bir Jeneratör Düşman Ağı sağlık hizmetleri makine öğrenimi uygulamalarında bu türden çeşitli ve erişilebilir içeriklerin kritik eksikliğini gidermek amacıyla yara görüntülerinin sentetik veri kümelerini oluşturmak için kullanılıyor.

adı verilen sistem WG2AN, Batten Mühendislik ve Teknoloji Koleji ile yaraların ölçümü ve tanımlanması için makine öğrenimi metodolojilerini uygulamada uzmanlaşmış AI sağlık şirketi eKare arasındaki bir işbirliğidir.

GAN, basınç, cerrahi, lenfovasküler olaylar, diyabet ve yanık yaralanmaları gibi nedenlere bağlı yaralanma türlerinin anonimleştirilmiş resimleri dahil olmak üzere eKare tarafından sağlanan 100-4000 etiketli stereoskopik kronik yara görüntüsü üzerinde eğitilmiştir. Kaynak malzemenin boyutu 1224×1224 ile 2160×2160 arasında değişiyordu ve tümü doktorlar tarafından mevcut ışık altında alındı.

Model eğitim mimarisindeki mevcut gizli alanı barındırmak için görüntüler 512×512'ye yeniden ölçeklendirildi ve arka planlarından çıkarıldı. Veri kümesi boyutunun etkisini incelemek için 100, 250, 500, 1000, 2000 ve 4000 görüntüden oluşan gruplar üzerinde test çalıştırmaları uygulandı.

Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Yukarıdaki resimde, katkıda bulunan eğitim setinin boyutuna ve eğitim setinin sayısına göre artan ayrıntı ve ayrıntı düzeyi gösterilmektedir. devirler her geçişte çalıştırın.

WG'nin mimarisi. Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN'ın mimarisi. Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN, GTX 8 GPU'da 1080 GB VRAM ile nispeten yalın bir tüketici tarzı kurulumda PyTorch üzerinde çalışır. Eğitim, doğruluk ve performans arasında bir denge olarak 4'lük toplu iş boyutunda, 58-100 görüntü arasındaki veri kümesi boyutları aralığında ve bir dizi dönemde 4000-64 saat arasında sürdü. Adam Optimizer, eğitimin ilk yarısında 0.0002'lik bir öğrenme oranında kullanılır ve sıfıra ulaşana kadar lineer azalan bir öğrenme oranıyla sonlandırılır.

Sol üstte, yara bölgesine uygulanan segmentasyon. Merkezin üstünde, gerçek yaranın görüntüsü; sağ üstte, orijinal kaynağa dayalı olarak bir veri kümesinde genelleştirilebilen türden sentetik bir yara. Aşağıda, orijinal yara ve sağda, WG2GAN tarafından oluşturulan yaranın bir sentezi.

Sol üstte, yara bölgesine uygulanan segmentasyon. Merkezin üstünde, gerçek yaranın görüntüsü; sağ üstte, orijinal kaynağa dayalı olarak bir veri kümesinde genelleştirilebilen türden sentetik bir yara. Aşağıda, orijinal yara ve sağda, WG2GAN tarafından oluşturulan yaranın bir sentezi.

Makine öğreniminin diğer pek çok sektöründe olduğu gibi tıbbi veri kümelerinde de etiketleme kaçınılmaz bir darboğazdır. Bu durumda, araştırmacılar yarı otomatik bir etiketleme sistemi kullandılar. önceki araştırma Play-Doh'ta oluşturulan ve semantik bağlam için kabaca renklendirilen gerçek dünyadaki yara modellerini kullanan eKare'den.

eKare Yara modelleri

eKare Yara modelleri

Araştırmacılar, bir veri kümesi oldukça çeşitli olduğunda ve ağırlıklar rastgele seçildiğinde, eğitimin ilk aşamalarında sıklıkla ortaya çıkan bir soruna dikkat çektiler - modelin 'yerleşmesi' uzun zaman alıyor (75 dönem):

Verilerin alacalı olduğu durumlarda, hem GAN hem de kodlayıcı/kod çözücü modelleri, ÇG eğitiminin yukarıdaki grafiğinde kanıtlandığını görebileceğimiz gibi, önceki aşamalarda genelleme elde etmek için mücadele eder.2Başlangıçtan sıfır kayba kadar eğitim zaman çizelgesini izleyen GAN.

Eğitim sürecinin herhangi bir yinelemenin veya çağın özelliklerine veya özelliklerine sabitlenmemesine, bunun yerine kaynak materyali aşırı derecede soyutlayan sonuçlar üretmeden kullanılabilir bir ortalama kayba genellemeye devam etmesine özen gösterilmelidir. WG durumunda2Belirli bir yara tipi içinde doğru bir varyasyon aralığı üretmek yerine, çok geniş bir ilgisiz yara tipleri yelpazesi arasında birleştirilmiş, sınırsız, tamamen 'kurgusal' yaralar yaratma riski taşıyan GAN.

Bir Makine Öğrenimi Veri Kümesinde Kapsamı Kontrol Etme

Daha hafif eğitim setlerine sahip modeller daha hızlı genelleme yapıyor ve makalenin araştırmacıları, en gerçekçi görüntülerin maksimum ayarlardan daha azıyla elde edilebileceğini iddia ediyor: 1000 çağda eğitilmiş 200 görüntü veri kümesi.

Daha küçük veri kümeleri daha kısa sürede oldukça gerçekçi görüntüler elde edebilse de, oluşturulan görüntü aralığı ve yara türleri de zorunlu olarak daha sınırlı olacaktır. GAN ve kodlayıcı/kod çözücü eğitim rejimlerinde girdi verilerinin hacmi ve çeşitliliği, üretilen görüntülerin aslına uygunluğu ve üretilen görüntülerin gerçekçiliği arasında hassas bir denge vardır - kesinlikle tıbbi görüntüyle sınırlı olmayan kapsam ve ağırlık sorunları sentez.

Tıbbi Veri Kümelerinde Sınıf Dengesizlikleri

Genel olarak, sağlık hizmetlerinde makine öğrenimi yalnızca bir veri seti eksikliği, ama tarafından sınıf dengesizlikleri, belirli bir hastalık hakkındaki temel verilerin, ana bilgisayar veri kümesinin çok küçük bir yüzdesini oluşturduğu, aykırı veriler olarak reddedilme veya eğitim boyunca genelleme sürecinde özümsenme riski taşıdığı durumlarda.

Son sorunu ele almak için bir dizi yöntem önerilmiştir, örneğin: yetersiz örnekleme veya aşırı örnekleme. Bununla birlikte, tamamen tek bir tıbbi soruna bağlı olan hastalığa özgü veri kümeleri geliştirilerek sorun sıklıkla gözden kaçmaktadır. Bu yaklaşım vaka bazında etkili olsa da, kültüre katkıda bulunur. balkanlaşmanın tıbbi makine öğrenimi araştırması alanında ve muhtemelen sektördeki genel ilerlemeyi yavaşlatıyor.