Sağlık

Sentetik Yara Veri Setlerini Oluşturmak İçin Çatışmalı Sinir Ağları Kullanma

Published April 22, 2021

Updated April 5, 2026

Martin Anderson

İlk kez, bir Çatışmalı Sinir Ağı sentetik yara görüntüsü veri setleri oluşturmak için kullanılmaktadır. Bu, sağlık makineleri öğrenimi uygulamalarında bu tür içeriğin çeşitli ve erişilebilir olmasını sağlamak için kritik bir eksikliği gidermek amacıyla yapılmaktadır.

Sistem, WG²AN olarak adlandırılmaktadır ve Batten Mühendislik ve Teknoloji Koleji ile sağlık şirketleri eKare arasında bir işbirliğidir. eKare, yara ölçümü ve tanımlamasına makine öğrenimi yöntemlerini uygulamaya chuyênlaşmıştır.

Çatışmalı Sinir Ağı, eKare tarafından sağlanan 100-4000 etiketli stereoskopik kronik yara görüntülerine dayanarak eğitilmiştir. Bu görüntüler, basıncın, cerrahi operasyonların, lenfovasküler olayların, diyabetin ve yanıkların neden olduğu various yara tiplerinin anonim resimlerini içermektedir. Kaynak materyalin boyutu 1224×1224 ile 2160×2160 arasında değişmekte ve tümü doktorlar tarafından mevcut ışık altında çekilmektedir.

Model eğitim mimarisindeki mevcut gizli uzayı kapsamak için, görüntüler 512×512’e ölçeklendirilmiş ve arka planlarından çıkarılmıştır. Veri seti boyutunun etkisini incelemek için, 100, 250, 500, 1000, 2000 ve 4000 görüntüden oluşan partiler üzerinde test çalışması yapılmıştır.

Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Üstteki resim, eğitim setinin boyutuna ve her geçişte yürütülen epoch sayısına göre artan ayrıntı ve granülasyonu göstermektedir.

<img class="wp-image-175205" src="https://www.unite.ai/wp-content/uploads/2021/04/architecture_of_wg2gan.jpg" alt="WG²AN mimarisi. Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033″ width=”700″ height=”397″ /> WG²AN mimarisi. Kaynak: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG²AN, PyTorch üzerinde çalışmakta ve tüketici tarzı bir kurulumda 8GB VRAM ve GTX 1080 GPU ile çalışmaktadır. Eğitim, 100-4000 görüntü boyutu aralığında ve çeşitli epoch sayılarında, 64’lik bir parti boyutunda gerçekleştirilmiş ve 4-58 saat arasında sürmüştür. İlk yarı eğitim için Adam Optimizer kullanılmış ve 0.0002’lik bir öğrenme oranı ile başlatılmıştır. Daha sonra, sıfır kayba ulaşılıncaya kadar lineer olarak azalan bir öğrenme oranı ile sona erdirilmiştir.

Üstte sol, yara alanına uygulanan segmentasyon. Üstte orta, gerçek yara resmi; üstte sağ, orijinal kaynak temelinde bir veri setinde genelleştirilebilecek bir yara tipi. Aşağıda, orijinal yara ve sağda WG2GAN tarafından üretilen yara sentezi.

Tıbbi veri setlerinde, etiketleme kaçınılmaz bir darboğazdır. Bu durumda, araştırmacılar, eKare’nin daha önceki bir araştırmasından yararlanan yarı otomatik bir etiketleme sistemi kullanmışlardır. Bu sistem, Play-Doh ile oluşturulan ve anlamsal bağlam için yaklaşık renklendirilen gerçekçi yara modellerini içermektedir.

eKare Yara Modelleri

Araştırmacılar, eğitim sürecinin ilk aşamalarında, özellikle veri seti oldukça çeşitli ve ağırlıklar rastgele olduğunda ortaya çıkan bir sorunu not etmişlerdir – modelin ‘yerleşmesi’ uzun zaman almaktadır:

Veriler çeşitli olduğunda, hem Çatışmalı Sinir Ağı hem de kodlayıcı/çözücü modeller, ilk aşamalarda genelleme elde etmekte zorlanmaktadır. Bu, WG²AN’ın eğitimini izleyen ve sıfır kayba ulaşana kadar eğitim zamanını takip eden yukarıdaki grafikte görüldüğü gibi evidence edilmiştir.

Eğitim sürecinin, herhangi bir iteration veya epoch’un özelliklerine veya özelliklerine takılmamasına dikkat etmek önemlidir. Bunun yerine, kaynak materyali aşırı soyutlamadan kaçınarak, kullanılabilir bir ortalama kayba genellemeye devam etmelidir. WG²AN’ın durumunda, bu, gerçekdışı, tamamen ‘kurgusal’ yaralar oluşturmak yerine, belirli bir yara tipi içinde varyasyonların doğru bir aralığını üretme riskini taşır.

Bir Makine Öğrenimi Veri Setinde Kapsam Kontrolü

Daha az eğitim setlerine sahip modeller daha hızlı genelleme elde etmektedir. Makaledeki araştırmacılar, en gerçekçi görüntülerin maksimum ayarların altında elde edilebileceğini iddia etmektedir: 1000 görüntü veri seti, 200 epoch üzerinde eğitilmiştir.

Daha küçük veri setleri, daha az zaman içinde yüksek gerçeklikte görüntüler elde edebilir, ancak üretilen görüntülerin aralığı ve yara tipleri doğal olarak daha sınırlı olacaktır. Çatışmalı Sinir Ağı ve kodlayıcı/çözücü eğitim rejimlerinde, girdi verilerinin hacmi ve çeşitliliği, üretilen görüntülerin doğruluğu ve gerçekliği arasında bir dengenin korunması gerekmektedir – bunlar, yalnızca tıbbi görüntü sentezine özgü olmayan, kapsam ve ağırlık konularıdır.

Tıbbi Veri Setlerinde Sınıf Dengesizlikleri

Genel olarak, sağlık makineleri öğrenimi, yalnızca veri setlerinin eksikliği ile değil, aynı zamanda sınıf dengesizlikleri ile de karşı karşıyadır. Burada, belirli bir hastalığa ilişkin temel veri, ana veri setinin çok küçük bir yüzdesini oluşturmaktadır ve bu, ya anomali verileri olarak reddedilmesine ya da eğitim sürecinde genelleme yoluyla asimile edilmesine neden olmaktadır.

Bu soruna çözüm olarak, alt-örnekleme veya üst-örnekleme gibi çeşitli yöntemler önerilmiştir. Ancak, bu sorun genellikle, tek bir tıbbi vấniye bağlı, hastalığa özgü veri setleri geliştirerek çözülmektedir. Bu yaklaşım, her bir vakada etkili olsa da, tıbbi makineleri öğrenimi araştırmalarında Balkanlaşma kültürüne katkıda bulunmakta ve sektördeki genel ilerlemeyi yavaşlatabilmektedir.

Related Topics:GAN GANs health healthcare image classification medical medical images

Martin Anderson

Makine öğrenimi üzerine yazar, insan görüntü sentezinde alan uzmanı. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel site: martinanderson.ai
İletişim: [email protected]

Unite.AI

Sentetik Yara Veri Setlerini Oluşturmak İçin Çatışmalı Sinir Ağları Kullanma

Bir Makine Öğrenimi Veri Setinde Kapsam Kontrolü

Tıbbi Veri Setlerinde Sınıf Dengesizlikleri

You may like