Vernetzen Sie sich mit uns

Gesundheitswesen

Diagnose psychischer Störungen durch KI-Bewertung des Gesichtsausdrucks

mm

Forscher aus Deutschland haben eine Methode zur Identifizierung psychischer Störungen entwickelt, die auf Gesichtsausdrücken basiert, die durch Computer Vision interpretiert werden.

Der neue Ansatz kann nicht nur zwischen nicht betroffenen und betroffenen Personen unterscheiden, sondern auch eine korrekte Unterscheidung zwischen Depression und Schizophrenie sowie dem Grad der aktuellen Betroffenheit des Patienten durch die Krankheit ermöglichen.

Die Forscher haben ein zusammengesetztes Bild bereitgestellt, das die Kontrollgruppe für ihre Tests (links im Bild unten) und die Patienten mit psychischen Störungen (rechts) darstellt. Die Identitäten mehrerer Personen werden in den Darstellungen vermischt, und keines der Bilder zeigt eine bestimmte Person:

Quelle: https://arxiv.org/pdf/2208.01369.pdf

Quelle: https://arxiv.org/pdf/2208.01369.pdf

Menschen mit affektiven Störungen neigen zu hochgezogenen Augenbrauen, bleiernen Blicken, geschwollenen Gesichtern und einem Ausdruck mit hängendem Mund. Um die Privatsphäre der Patienten zu schützen, sind diese zusammengesetzten Bilder die einzigen, die zur Unterstützung der neuen Arbeit zur Verfügung gestellt werden.

Bisher wurde die Erkennung von Gesichtsaffekten hauptsächlich als potenzielles Werkzeug für die Basisdiagnose eingesetzt. Der neue Ansatz bietet stattdessen eine mögliche Methode zur Bewertung des Patientenfortschritts während der gesamten Behandlung oder (möglicherweise, obwohl das Papier dies nicht vorschlägt) in seiner eigenen häuslichen Umgebung zur ambulanten Überwachung.

In dem Papier heißt es*:

„Über die maschinelle Diagnose von Depressionen hinaus geht das affektive Computing, das in entwickelt wurde früher Es wurden Studienzeigen wir, dass der mittels Computer Vision geschätzte messbare affektive Zustand weitaus mehr Informationen enthält als die reine kategorische Klassifizierung.‘

Die Forscher haben diese Technik getauft Optoelektronische Enzephalographie (OEG), eine völlig passive Methode zur Ableitung des Geisteszustands durch Gesichtsbildanalyse anstelle von topischen Sensoren oder strahlenbasierten medizinischen Bildgebungstechnologien.

Die Autoren kommen zu dem Schluss, dass OEG möglicherweise nicht nur ein sekundäres Hilfsmittel für Diagnose und Behandlung sein könnte, sondern langfristig ein potenzieller Ersatz für bestimmte evaluative Teile der Behandlungspipeline sein könnte und die für den Patienten erforderliche Zeit verkürzen könnte Überwachung und Erstdiagnose. Sie stellen fest:

„Insgesamt zeigen die von der Maschine vorhergesagten Ergebnisse im Vergleich zu den rein auf klinischen Beobachterbewertungen basierenden Fragebögen bessere Korrelationen und sind zudem objektiv. Bemerkenswert ist zudem die relativ kurze Messdauer von wenigen Minuten bei den Computer-Vision-Ansätzen, während für die klinischen Interviews teilweise Stunden benötigt werden.“

Die Autoren betonen jedoch, dass die Patientenversorgung in diesem Bereich multimodal ist und neben dem Gesichtsausdruck zahlreiche weitere Indikatoren für den Zustand des Patienten berücksichtigt werden müssen. Es sei noch zu früh, um davon auszugehen, dass ein solches System traditionelle Ansätze zur Behandlung psychischer Störungen vollständig ersetzen könnte. Dennoch halten sie die OEG für eine vielversprechende ergänzende Technologie, insbesondere als Methode zur Bewertung der Wirkung medikamentöser Behandlungen im Rahmen der Patientenverschreibung.

Die Krepppapier ist betitelt Das Gesicht affektiver Störungenund stammt von acht Forschern aus einem breiten Spektrum von Institutionen aus dem privaten und öffentlichen medizinischen Forschungssektor.

Datum

(Das neue Papier befasst sich hauptsächlich mit den verschiedenen Theorien und Methoden, die derzeit bei der Diagnose psychischer Störungen bei Patienten beliebt sind, wobei den tatsächlichen Technologien und Prozessen, die in den Tests und verschiedenen Experimenten verwendet werden, weniger Aufmerksamkeit geschenkt wird als üblich.)

Die Datenerhebung fand am Universitätsklinikum Aachen mit 100 Patienten mit ausgewogenem Geschlechterverhältnis und einer Kontrollgruppe aus 50 nicht betroffenen Personen statt. Unter den Patienten befanden sich 35 an Schizophrenie Erkrankte und 65 Menschen mit Depressionen.

Für den Patiententeil der Testgruppe wurden die ersten Messungen zum Zeitpunkt des ersten Krankenhausaufenthalts und die zweite vor der Entlassung aus dem Krankenhaus durchgeführt, im Durchschnitt über einen Zeitraum von 12 Wochen. Die Teilnehmer der Kontrollgruppe wurden willkürlich aus der lokalen Bevölkerung rekrutiert, wobei ihre eigene Einleitung und „Entlassung“ denen der tatsächlichen Patienten entsprach.

Tatsächlich müssen die wichtigsten „Grundwahrheiten“ für ein solches Experiment Diagnosen sein, die mit anerkannten und standardisierten Methoden gewonnen wurden, und dies war bei den OEG-Versuchen der Fall.

In der Datenerfassungsphase wurden jedoch zusätzliche Daten gewonnen, die sich besser für die maschinelle Interpretation eigneten: Interviews mit einer durchschnittlichen Länge von 90 Minuten wurden in drei Phasen mit einer Logitech c270 Consumer-Webcam mit 25 Bildern pro Sekunde aufgezeichnet.

Die erste Sitzung bestand aus einem Standard Hamilton-Interview (basierend auf Forschungen aus dem Jahr 1960), wie sie normalerweise bei der Aufnahme gegeben würden. In der zweiten Phase wurden den Patienten (und ihren Gegenstücken in der Kontrollgruppe) ungewöhnlicherweise Videos mit einer Reihe von Gesichtsausdrücken gezeigt und sie gebeten, jeden dieser Ausdrücke nachzuahmen und dabei ihre eigene Einschätzung ihres psychischen Zustands zu diesem Zeitpunkt, einschließlich der emotionalen Verfassung und Intensität, darzulegen. Diese Phase dauerte etwa zehn Minuten.

In der dritten und letzten Phase wurden den Teilnehmern 96 jeweils etwas mehr als zehn Sekunden lange Videos von Schauspielern gezeigt, die offenbar intensive emotionale Erlebnisse erzählten. Anschließend wurden die Teilnehmer gebeten, die in den Videos dargestellten Emotionen und Intensität sowie ihre eigenen entsprechenden Gefühle zu bewerten. Diese Phase dauerte etwa 15 Minuten.

Methodik

Um den Mittelwert der erfassten Gesichter zu ermitteln (siehe erstes Bild oben), wurden emotionale Orientierungspunkte mit erfasst EmoNet Rahmen. Anschließend wurde die Übereinstimmung zwischen der Gesichtsform und der mittleren (gemittelten) Gesichtsform bestimmt Stückweise affine Transformation.

Dimensionale Emotionserkennung mit einem Blickvorhersage wurde für jedes in der vorherigen Phase identifizierte Landmark-Segment durchgeführt.

An diesem Punkt hat die audiobasierte Emotionserkennung gezeigt, dass im mentalen Zustand des Patienten ein lehrreicher Moment gekommen ist. Die Aufgabe besteht nun darin, das entsprechende Gesichtsbild zu erfassen und diese Dimension und diesen Bereich seines Affektzustands zu entwickeln.

(Im Video oben sehen wir die Arbeit, die von den Autoren der dimensionalen Emotionserkennungstechnologien entwickelt wurde, die von den Forschern für die neue Arbeit verwendet wurden.)

Die geodätische Form des Materials wurde für jeden Datenrahmen berechnet und die Singularwertzerlegung (SVD) Ermäßigung angewendet. Die resultierenden Zeitreihendaten wurden schließlich als modelliert VAR Prozess, und dann weiter reduziert über SVD vor MAP-Anpassung.

Arbeitsablauf für den geodätischen Reduktionsprozess.

Arbeitsablauf für den geodätischen Reduktionsprozess.

Die Valenz- und Erregungswerte im EmoNet-Netzwerk wurden ebenfalls auf ähnliche Weise mit VAR-Modellierung und Sequenzkernberechnung verarbeitet.

Experimente

Wie bereits erläutert, handelt es sich bei der neuen Arbeit in erster Linie um eine medizinische Forschungsarbeit und nicht um eine Standardeinreichung im Bereich Computer Vision. Wir verweisen den Leser auf die Arbeit selbst, um eine ausführliche Berichterstattung über die verschiedenen OEG-Experimente der Forscher zu erhalten.

Dennoch, um eine Auswahl davon zusammenzufassen:

Hinweise auf affektive Störungen

Hier wurden 40 Teilnehmer (nicht aus der Kontroll- oder Patientengruppe) gebeten, die ausgewerteten mittleren Gesichter (siehe oben) in Bezug auf eine Reihe von Fragen zu bewerten, ohne über den Kontext der Daten informiert zu werden. Die Fragen waren:

Welches Geschlecht haben die beiden Gesichter?
Haben die Gesichter ein attraktives Aussehen?
Sind diese Gesichter vertrauenswürdige Personen?
Wie beurteilen Sie die Handlungsfähigkeit dieser Menschen?
Welche Emotionen vermitteln die beiden Gesichter?
Welches Hautbild haben die beiden Gesichter?
Welchen Eindruck hat der Blick?
Haben die beiden Gesichter hängende Mundwinkel?
Haben die beiden Gesichter erhabene braune Augen?
Sind diese Personen klinische Patienten?

Die Forscher fanden heraus, dass diese Blindauswertungen mit dem registrierten Zustand der verarbeiteten Daten korrelierten:

Boxplot-Ergebnisse für die „Mean Face“-Umfrage.

Boxplot-Ergebnisse für die „Mean Face“-Umfrage.

Klinische Untersuchung

Um den Nutzen von OEG bei der Erstbeurteilung zu beurteilen, bewerteten die Forscher zunächst, wie effektiv die klinische Standardbeurteilung allein ist, und maßen den Grad der Verbesserung zwischen der Einleitung und der zweiten Phase (zu diesem Zeitpunkt erhält der Patient typischerweise medikamentöse Behandlungen).

Die Forscher kamen zu dem Schluss, dass Status und Schwere der Symptome mit dieser Methode gut beurteilt werden könnten, und erreichten eine Korrelation von 0.82. Eine genaue Diagnose von Schizophrenie oder Depression erwies sich jedoch als schwieriger, da die Standardmethode in diesem frühen Stadium nur einen Wert von -0.03 erreichte.

Die Autoren kommentieren:

„Grundsätzlich lässt sich der Patientenstatus mit den üblichen Fragebögen relativ gut erfassen. Das ist aber auch schon alles, was sich daraus ableiten lässt. Ob jemand depressiv oder eher schizophren ist, lässt sich daraus nicht ableiten. Gleiches gilt für das Ansprechen auf die Behandlung.“

Die Ergebnisse des maschinellen Prozesses konnten in diesem Problembereich höhere Werte und vergleichbare Werte für den Aspekt der ersten Patientenbewertung erzielen:

Höhere Zahlen sind besser. Auf der linken Seite sind die standardmäßigen Ergebnisse der interviewbasierten Bewertungsgenauigkeit in vier Phasen der Testarchitektur zu sehen. rechts: maschinenbasierte Ergebnisse.

Höhere Zahlen sind besser. Auf der linken Seite sind die standardmäßigen Ergebnisse der interviewbasierten Bewertungsgenauigkeit in vier Phasen der Testarchitektur zu sehen. rechts: maschinenbasierte Ergebnisse.

Störungsdiagnose

Die Unterscheidung zwischen Depression und Schizophrenie anhand statischer Gesichtsbilder ist keine triviale Angelegenheit. Durch Kreuzvalidierung konnte der maschinelle Prozess in den verschiedenen Phasen der Versuche hohe Genauigkeitswerte erzielen:

In anderen Experimenten konnten die Forscher Beweise dafür vorlegen, dass OEG durch pharmakologische Behandlung und allgemeine Behandlung der Störung eine Verbesserung des Patienten wahrnehmen kann:

„Der kausale Rückschluss auf das empirische Vorwissen der Datenerhebung passte die pharmakologische Behandlung an, um eine Rückkehr zur physiologischen Regulierung der Gesichtsdynamik zu beobachten.“ Eine solche Rückkehr konnte während der klinischen Verschreibung nicht beobachtet werden.

„Derzeit ist nicht klar, ob eine solche maschinelle Empfehlung tatsächlich zu einem deutlich besseren Therapieerfolg führen würde.“ Vor allem, weil bekannt ist, welche Nebenwirkungen Medikamente über einen längeren Zeitraum haben können.

„Allerdings würden [diese Art] patientenspezifischer Ansätze die Barrieren des gängigen kategorischen Klassifizierungsschemas durchbrechen, das im täglichen Leben noch immer vorherrschend verwendet wird.“

 

* Meine Konvertierung der Inline-Zitate der Autoren in Hyperlinks.

Erstveröffentlichung am 3. August 2022.

Autor zum Thema maschinelles Lernen, Fachspezialist für die Synthese menschlicher Bilder. Ehemaliger Leiter für Forschungsinhalte bei Metaphysic.ai.
Persönliche Seite: martinanderson.ai
Kontakt: [E-Mail geschützt]
Twitter: @manders_ai