Vernetzen Sie sich mit uns

Gesundheitswesen

Erstellen synthetischer Wunddatensätze mit generativen gegnerischen Netzwerken

mm

Zum ersten Mal a Generative Adversarial Network wird verwendet, um synthetische Datensätze von Wundbildern zu erstellen, um einen kritischen Mangel an vielfältigen und zugänglichen Inhalten dieser Art in Anwendungen des maschinellen Lernens im Gesundheitswesen zu beheben.

Das System, genannt WG2ANist eine Zusammenarbeit zwischen dem Batten College of Engineering & Technology und dem KI-Gesundheitsunternehmen eKare, das sich auf die Anwendung maschineller Lernmethoden zur Messung und Identifizierung von Wunden spezialisiert hat.

Das GAN wird anhand von 100–4000 markierten stereoskopischen Bildern chronischer Wunden trainiert, die von eKare bereitgestellt werden, einschließlich anonymisierter Bilder von Verletzungstypen aufgrund von Ursachen wie Druck, Operation, lymphovaskulären Zwischenfällen, Diabetes und Verbrennungen. Die Größe des Quellmaterials variierte zwischen 1224×1224 und 2160×2160, alles wurde von Ärzten unter verfügbarem Licht aufgenommen.

Um den verfügbaren latenten Platz in der Modelltrainingsarchitektur zu berücksichtigen, wurden die Bilder auf 512 x 512 neu skaliert und aus ihren Hintergründen extrahiert. Um die Auswirkung der Datensatzgröße zu untersuchen, wurden Testläufe mit Stapeln von 100, 250, 500, 1000, 2000 und 4000 Bildern durchgeführt.

Quelle: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Quelle: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Das Bild oben zeigt zunehmende Details und Granularität entsprechend der Größe des beitragenden Trainingssatzes und der Anzahl Epochen bei jedem Durchgang laufen.

Die Architektur von WG. Quelle: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

Die Architektur von WG2GAN. Quelle: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033

WG2GAN läuft auf PyTorch in einem relativ schlanken Verbraucher-Setup mit 8 GB VRAM auf einer GTX 1080-GPU. Das Training dauerte zwischen 4 und 58 Stunden für den Bereich der Datensatzgrößen von 100 bis 4000 Bildern und über eine Reihe von Epochen bei einer Stapelgröße von 64 als Kompromiss zwischen Genauigkeit und Leistung. Der Adam-Optimierer wird in der ersten Hälfte des Trainings mit einer Lernrate von 0.0002 verwendet und endet mit einer linear abnehmenden Lernrate, bis ein Verlust von Null erreicht wird.

Oben links: Auf den Wundbereich angewendete Segmentierung. Oben in der Mitte Bild der tatsächlichen Wunde; Oben rechts eine synthetische Wunde, die auf der Grundlage der Originalquelle in einem Datensatz verallgemeinert werden kann. Unten die ursprüngliche Wunde und rechts eine Synthese der von WG2GAN erzeugten Wunde.

Oben links: Auf den Wundbereich angewendete Segmentierung. Oben in der Mitte Bild der tatsächlichen Wunde; Oben rechts eine synthetische Wunde, die auf der Grundlage der Originalquelle in einem Datensatz verallgemeinert werden kann. Unten die ursprüngliche Wunde und rechts eine Synthese der von WG2GAN erzeugten Wunde.

In medizinischen Datensätzen ist die Kennzeichnung wie in vielen anderen Bereichen des maschinellen Lernens ein unvermeidlicher Engpass. In diesem Fall verwendeten die Forscher ein halbautomatisches Etikettierungssystem, das die Vorteile nutzt frühere Forschung von eKare, das reale Wundmodelle verwendete, die in Play-Doh erstellt und für den semantischen Kontext grob eingefärbt wurden.

eKare Wundmodelle

eKare Wundmodelle

Die Forscher stellten ein Problem fest, das häufig in den Anfangsphasen des Trainings auftritt, wenn ein Datensatz sehr vielfältig ist und die Gewichte zufällig vergeben werden – das Modell braucht lange (75 Epochen), um sich zu „beruhigen“:

Wenn Daten vielfältig sind, haben sowohl GAN- als auch Encoder-/Decoder-Modelle Schwierigkeiten, in früheren Phasen eine Verallgemeinerung zu erreichen, wie wir in der obigen Grafik des WG-Trainings sehen können2GAN, das den Trainingszeitplan vom Beginn bis zum Nullverlust verfolgt.

Es muss darauf geachtet werden, dass sich der Trainingsprozess nicht auf die Merkmale oder Merkmale einer einzelnen Iteration oder Epoche fixiert, sondern stattdessen weiterhin auf einen nutzbaren mittleren Verlust verallgemeinert, ohne Ergebnisse zu erzeugen, die das Quellmaterial übermäßig abstrahieren. Im Fall von WG2GAN, das die Gefahr birgt, unbegrenzte, völlig „fiktive“ Wunden zu erzeugen, die mit einer zu großen Bandbreite nicht miteinander verbundener Wundtypen verknüpft sind, anstatt eine genaue Variationsbreite innerhalb eines bestimmten Wundtyps zu erzeugen.

Kontrollieren des Umfangs in einem Datensatz fĂĽr maschinelles Lernen

Modelle mit leichteren Trainingssätzen verallgemeinern schneller und die Forscher des Papiers behaupten, dass die realistischsten Bilder mit weniger als den maximalen Einstellungen erzielt werden könnten: einem Datensatz mit 1000 Bildern, der über 200 Epochen trainiert wurde.

Obwohl kleinere Datensätze in kürzerer Zeit sehr realistische Bilder liefern könnten, wird zwangsläufig auch die Bandbreite der erzeugten Bilder und Wundarten begrenzter sein. Bei GAN- und Encoder-/Decoder-Trainingssystemen besteht ein empfindliches Gleichgewicht zwischen der Menge und Vielfalt der Eingabedaten, der Genauigkeit der erzeugten Bilder und dem Realismus der erzeugten Bilder – Fragen des Umfangs und der Gewichtung, die sicherlich nicht auf medizinische Bilder beschränkt sind Synthese.

Klassenungleichgewichte in medizinischen Datensätzen

Im Allgemeinen ist das maschinelle Lernen im Gesundheitswesen nicht nur durch einen Mangel an Datensätzen beeinträchtigt, sondern auch durch Klassenungleichgewichte, wenn wesentliche Daten zu einer bestimmten Krankheit einen so geringen Prozentsatz des Wirtsdatensatzes ausmachen, dass die Gefahr besteht, dass sie entweder als Ausreißerdaten abgetan werden oder während des Trainings im Prozess der Generalisierung assimiliert werden.

Zur Lösung des letztgenannten Problems wurden eine Reihe von Methoden vorgeschlagen, z Unterabtastung oder Überabtastung. Das Problem wird jedoch häufig umgangen, indem krankheitsspezifische Datensätze entwickelt werden, die vollständig an ein einziges medizinisches Problem gebunden sind. Obwohl dieser Ansatz im Einzelfall wirksam ist, trägt er doch zur Kultur von bei Balkanisierung im Bereich der medizinischen maschinellen Lernforschung und verlangsamt wohl den allgemeinen Fortschritt in diesem Sektor.

Autor zum Thema maschinelles Lernen, Fachspezialist fĂĽr die Synthese menschlicher Bilder. Ehemaliger Leiter fĂĽr Forschungsinhalte bei Metaphysic.ai.
Persönliche Seite: martinanderson.ai
Kontakt: [E-Mail geschĂĽtzt]
Twitter: @manders_ai