Gesundheitswesen
Synthetische Daten: RassenÀnderung bei Gesichtsbildern, um Verzerrungen in medizinischen DatensÀtzen entgegenzuwirken

UCLA-Forscher haben eine Methode entwickelt, um die scheinbare Rasse von Gesichtern in DatensÀtzen zu Àndern, die zum Trainieren medizinischer maschineller Lernsysteme verwendet werden, um die Rassenvoreingenommenheit zu beseitigen, unter der viele gÀngige DatensÀtze leiden.
Der neue Technik ist in der Lage, fotorealistische und physiologisch genaue synthetische Videos mit einer durchschnittlichen Geschwindigkeit von 0.005 Sekunden pro Bild zu produzieren, und soll die Entwicklung neuer Diagnosesysteme fĂŒr die Ferndiagnose und -ĂŒberwachung im Gesundheitswesen unterstĂŒtzen â ein Bereich, der unter den COVID-BeschrĂ€nkungen stark expandiert hat. Das System soll die Anwendbarkeit der Fernphotoplethysmographie verbessern (rPPG), eine Computer-Vision-Technik, die Gesichtsvideoinhalte auswertet, um volumetrische VerĂ€nderungen der Blutversorgung auf nicht-invasive Weise zu erkennen.
Obwohl die Arbeit, die Convolutional Neural Networks (CNNs) nutzt, frĂŒheren Forschungscode einbezieht veröffentlicht Die neue Anwendung wurde 2020 von der britischen Durham University entwickelt und soll pulsierende Signale in den ursprĂŒnglichen Testdaten bewahren, anstatt nur die scheinbare Rasse der Daten visuell zu verĂ€ndern, wie es die Forschung aus dem Jahr 2020 tut.
CNNs fĂŒr Rassentransformation
Der erste Teil des Encoder-Decoder-Systems verwendet das vorab trainierte Durham-RennĂŒbertragungsmodell VGGface2, um Proxy-Zielrahmen mit der vorherigen kaukasisch-afrikanischen Komponente der Durham-Forschung zu generieren. Dies erzeugt eine flache Ăbertragung von Rassenmerkmalen, enthĂ€lt jedoch nicht die Variationen in Farbe und Ton, die visuelle physiologische Indikatoren fĂŒr den Blutflusszustand des Patienten darstellen.

Die Transformationspipeline aus der Forschung 2020 der Durham University, von der ein Teil in die neue UCLA-Forschung integriert ist. Quelle: https://arxiv.org/pdf/2004.08945.pdf. Klicken um zu vergröĂern.
Ein zweites Netzwerk namens PhysResNet (PRN) stellt die rPPG-Komponente bereit. PhysResNet ist darauf trainiert, sowohl das visuelle Erscheinungsbild als auch die Farbvariationen zu lernen, die die Bewegungen des subkutanen Blutvolumens definieren.

Unten links die Ergebnisse der Durham-Forschung 2020, ohne PPG-Informationen. Mitte links, die PPG-Informationen wurden in die Rassentransformation einbezogen. Zum VergröĂern anklicken.
Die vom UCLA-Projekt vorgeschlagene Architektur ĂŒbertrifft konkurrierende rPPG-Techniken auch ohne HautfarbverstĂ€rkung und stellt eine Verbesserung von 31 % gegenĂŒber Ă€hnlichen Techniken dar, die mit optimiert wurden MAE und RMSE.

Das UCLA-Netzwerk bewahrt erfolgreich Informationen zum Blutvolumen und zur Blutverteilung. Zum VergröĂern anklicken.
Die UCLA-Forscher hoffen, dass kĂŒnftige Arbeiten umfangreichere Herausforderungen zur Beseitigung rassistischer Vorurteile in diesem Bereich der medizinischen Bildgebung umfassen werden, und hoffen auch, dass spĂ€tere Systeme Videos mit höherer Auflösung ausgeben werden, da das betreffende System auf eine Auflösung von 80 x 80 Pixel beschrĂ€nkt ist â einigermaĂen gut fĂŒr die EinschrĂ€nkungen der Telemedizin geeignet, aber nicht ideal.
Mangel an ethnisch unterschiedlichen DatensÀtzen
Die wirtschaftlichen und praktischen UmstĂ€nde, die zu rassisch unterschiedlichen DatensĂ€tzen fĂŒhren, stellen seit einigen Jahren ein Hindernis fĂŒr die medizinische Forschung dar. Daten werden tendenziell provinziell generiert, wobei viele Faktoren zu einer hĂ€ufig kaukasisch-zentrierten HomogenitĂ€t der Datensubjekte beitragen. Dazu gehören die Zusammensetzung der Minderheitenbevölkerung in StĂ€dten, in denen Forschung stattfindet, und andere sozioökonomische Faktoren, die das AusmaĂ beeinflussen können, in dem nicht-weiĂe Subjekte auftreten in westlichen DatensĂ€tzen, von denen sich die Forscher eine globalere Anwendbarkeit wĂŒnschen.
In LĂ€ndern mit einem höheren Anteil dunkelhĂ€utiger Probanden mangelt es hĂ€ufig an der notwendigen AusrĂŒstung und den Ressourcen zur Datenerhebung.

Eine hautfarbene Weltkarte fĂŒr indigene Völker, aus dem American Journal of Physical Anthropology.
Derzeit sind dunkelhĂ€utige Personen in rPPG-DatensĂ€tzen deutlich unterreprĂ€sentiert und machen 0 %, 5 % und 10 % des Inhalts der drei primĂ€ren Datenbanken aus, die ĂŒblicherweise fĂŒr diesen Zweck verwendet werden.
Homogene kaukasische Daten
Im Jahr 2019 neue Forschung veröffentlicht in Forschung fanden heraus, dass ein in der Krankenhausversorgung in den USA weit verbreiteter Algorithmus stark zugunsten kaukasischer Probanden voreingenommen war. Die Studie ergab, dass schwarze Menschen bei der Triage seltener an eine spezialisierte Versorgung ĂŒberwiesen werden und hĂ€ufiger ins Krankenhaus eingeliefert werden.
Weitere Forschungen in diesem Jahr von Forschern in Malaysia und Australien etablierten das allgemeine Problem des âOwn Race Biasâ bei der Generierung von DatensĂ€tzen in vielen Regionen der Welt, einschlieĂlich Asien.
Mögliche EinschrĂ€nkungen hinsichtlich MaĂstab und Architektur
Einige der EinschrĂ€nkungen, die zu DatensĂ€tzen mit begrenzter EthnizitĂ€t gefĂŒhrt haben, sind eher pragmatischer als ethischer Natur. Je breiter die Vielzahl der beitragenden Daten ist, desto besser lĂ€sst sie sich auf die in diesen Daten enthaltenen Themen verallgemeinern, aber desto weniger ist es wahrscheinlich, dass die Trainingsroutine Muster innerhalb eines einzelnen Merkmals der Daten, einschlieĂlich der Rasse, erkennt, da ein geringerer Prozentsatz der Trainingszeit, Aufmerksamkeit und Ressourcen stehen fĂŒr jede identifizierbare Teilmenge der Daten zur VerfĂŒgung.
Dies kann zu Modellen fĂŒhren, die allgemein anwendbar sind, aber aufgrund der EinschrĂ€nkungen der DatengröĂe, der Wirtschaftlichkeit der StapelgröĂe und der praktischen EinschrĂ€nkungen des latenten Speicherplatzes aufgrund begrenzter Hardwareressourcen weniger spezifische Ergebnisse liefern.
Im anderen Extremfall lassen sich zwar effektive und granulare Ergebnisse erzielen, indem man die Eingabedaten auf einen begrenzteren Satz von Merkmalen, einschlieĂlich der ethnischen Zugehörigkeit, beschrĂ€nkt, die Ergebnisse passen jedoch wahrscheinlich nicht zu sehr zu den begrenzten Daten und sind möglicherweise nicht allgemein anwendbar ĂŒber unsichtbare Subjekte in demselben geografischen Gebiet, aus dem die Subjekte des ursprĂŒnglichen Datensatzes stammen.
Synthetische Avatare fĂŒr die PPG-Simulation
Das UCLA-Papier weist auch auf frĂŒhere Arbeiten von Microsoft Research aus dem Jahr 2020 zur Verwendung rassistisch nachgiebiger synthetischer Avatare hin, die die 3D-Bildsynthese nutzen, um Gesichtsvideos mit vielen PPG-Informationen zu erstellen.

Von Microsoft-Forschung erstellte synthetische Avatare mit Raytracing-Bildern, die PPG-Daten enthalten. Quelle: https://arxiv.org/pdf/2010.12949.pdf. Klicken um zu vergröĂern.