Stummel Diagnose psychischer Störungen durch KI-Bewertung des Gesichtsausdrucks – Unite.AI
Vernetzen Sie sich mit uns

Gesundheitswesen

Diagnose psychischer Störungen durch KI-Bewertung des Gesichtsausdrucks

mm
Aktualisiert on

Forscher aus Deutschland haben eine Methode zur Identifizierung psychischer Störungen entwickelt, die auf Gesichtsausdrücken basiert, die durch Computer Vision interpretiert werden.

Der neue Ansatz kann nicht nur zwischen nicht betroffenen und betroffenen Personen unterscheiden, sondern auch eine korrekte Unterscheidung zwischen Depression und Schizophrenie sowie dem Grad der aktuellen Betroffenheit des Patienten durch die Krankheit ermöglichen.

Die Forscher haben ein zusammengesetztes Bild bereitgestellt, das die Kontrollgruppe für ihre Tests (links im Bild unten) und die Patienten mit psychischen Störungen (rechts) darstellt. Die Identitäten mehrerer Personen werden in den Darstellungen vermischt, und keines der Bilder zeigt eine bestimmte Person:

Quelle: https://arxiv.org/pdf/2208.01369.pdf

Quelle: https://arxiv.org/pdf/2208.01369.pdf

Menschen mit affektiven Störungen neigen zu hochgezogenen Augenbrauen, bleiernen Blicken, geschwollenen Gesichtern und einem Ausdruck mit hängendem Mund. Um die Privatsphäre der Patienten zu schützen, sind diese zusammengesetzten Bilder die einzigen, die zur Unterstützung der neuen Arbeit zur Verfügung gestellt werden.

Bisher wurde die Erkennung von Gesichtsaffekten hauptsächlich als potenzielles Werkzeug für die Basisdiagnose eingesetzt. Der neue Ansatz bietet stattdessen eine mögliche Methode zur Bewertung des Patientenfortschritts während der gesamten Behandlung oder (möglicherweise, obwohl das Papier dies nicht vorschlägt) in seiner eigenen häuslichen Umgebung zur ambulanten Überwachung.

In dem Papier heißt es*:

„Über die maschinelle Diagnose von Depressionen hinaus geht das affektive Computing, das in entwickelt wurde früher Es wurden Studien„Wir zeigen, dass der mittels Computer Vision geschätzte messbare affektive Zustand weitaus mehr Informationen enthält als die reine kategoriale Klassifizierung.“

Die Forscher haben diese Technik getauft Optoelektronische Enzephalographie (OEG), eine völlig passive Methode zur Ableitung des Geisteszustands durch Gesichtsbildanalyse anstelle von topischen Sensoren oder strahlenbasierten medizinischen Bildgebungstechnologien.

Die Autoren kommen zu dem Schluss, dass OEG möglicherweise nicht nur ein sekundäres Hilfsmittel für Diagnose und Behandlung sein könnte, sondern langfristig ein potenzieller Ersatz für bestimmte evaluative Teile der Behandlungspipeline sein könnte und die für den Patienten erforderliche Zeit verkürzen könnte Überwachung und Erstdiagnose. Sie stellen fest:

„Insgesamt zeigen die von der Maschine vorhergesagten Ergebnisse bessere Korrelationen im Vergleich zu rein klinischen Beobachtern-Bewertungsfragebögen und sind zudem objektiv.“ Bemerkenswert ist auch der relativ kurze Messzeitraum von wenigen Minuten bei den Computer-Vision-Ansätzen, wohingegen bei den klinischen Interviews teilweise Stunden erforderlich sind.“

Die Autoren möchten jedoch betonen, dass die Patientenversorgung in diesem Bereich ein multimodales Unterfangen ist, bei dem viele andere Indikatoren für den Zustand des Patienten als nur sein Gesichtsausdruck berücksichtigt werden müssen, und dass es noch zu früh ist, darüber nachzudenken, dass ein solches System dies könnte traditionelle Ansätze zur Behandlung psychischer Störungen vollständig ersetzen. Dennoch halten sie OEG für eine vielversprechende Zusatztechnologie, insbesondere als Methode zur Abstufung der Wirkung einer pharmazeutischen Behandlung im Rahmen der einem Patienten verschriebenen Behandlung.

Das Krepppapier ist betitelt Das Gesicht affektiver Störungenund stammt von acht Forschern aus einem breiten Spektrum von Institutionen aus dem privaten und öffentlichen medizinischen Forschungssektor.

Datum

(Das neue Papier befasst sich hauptsächlich mit den verschiedenen Theorien und Methoden, die derzeit bei der Diagnose psychischer Störungen bei Patienten beliebt sind, wobei den tatsächlichen Technologien und Prozessen, die in den Tests und verschiedenen Experimenten verwendet werden, weniger Aufmerksamkeit geschenkt wird als üblich.)

Die Datenerhebung fand am Universitätsklinikum Aachen mit 100 Patienten mit ausgewogenem Geschlechterverhältnis und einer Kontrollgruppe aus 50 nicht betroffenen Personen statt. Unter den Patienten befanden sich 35 an Schizophrenie Erkrankte und 65 Menschen mit Depressionen.

Für den Patiententeil der Testgruppe wurden die ersten Messungen zum Zeitpunkt des ersten Krankenhausaufenthalts und zum zweiten Mal vor ihrer Entlassung aus dem Krankenhaus durchgeführt, und zwar über einen durchschnittlichen Zeitraum von 12 Wochen. Die Teilnehmer der Kontrollgruppe wurden willkürlich aus der lokalen Bevölkerung rekrutiert, wobei ihre eigene Einleitung und „Entlassung“ denen der tatsächlichen Patienten entsprach.

Tatsächlich müssen die wichtigste „Grundwahrheit“ für ein solches Experiment Diagnosen sein, die mit anerkannten Standardmethoden ermittelt wurden, und dies war bei den OEG-Versuchen der Fall.

In der Datenerfassungsphase wurden jedoch zusätzliche Daten gewonnen, die sich besser für die maschinelle Interpretation eigneten: Interviews mit einer durchschnittlichen Länge von 90 Minuten wurden in drei Phasen mit einer Logitech c270 Consumer-Webcam mit 25 Bildern pro Sekunde aufgezeichnet.

Die erste Sitzung bestand aus einem Standard Hamilton-Interview (basierend auf Forschung entstand um 1960), wie er normalerweise bei der Aufnahme ausgehändigt wird. In der zweiten Phase wurden ungewöhnlicherweise die Patienten (und ihre Kollegen in der Kontrollgruppe) gezeigt Videos einer Reihe von Gesichtsausdrücken und wurden gebeten, jeden dieser Gesichtsausdrücke nachzuahmen und gleichzeitig ihre eigene Einschätzung ihres geistigen Zustands zu diesem Zeitpunkt, einschließlich des emotionalen Zustands und der Intensität, anzugeben. Diese Phase dauerte etwa zehn Minuten.

In der dritten und letzten Phase wurden den Teilnehmern 96 jeweils etwas mehr als zehn Sekunden lange Videos von Schauspielern gezeigt, die offenbar intensive emotionale Erlebnisse erzählten. Anschließend wurden die Teilnehmer gebeten, die in den Videos dargestellten Emotionen und Intensität sowie ihre eigenen entsprechenden Gefühle zu bewerten. Diese Phase dauerte etwa 15 Minuten.

Versandart

Um den Mittelwert der erfassten Gesichter zu ermitteln (siehe erstes Bild oben), wurden emotionale Orientierungspunkte mit erfasst EmoNet Rahmen. Anschließend wurde die Übereinstimmung zwischen der Gesichtsform und der mittleren (gemittelten) Gesichtsform bestimmt Stückweise affine Transformation.

Dimensionale Emotionserkennung und Blickvorhersage wurde für jedes in der vorherigen Phase identifizierte Landmark-Segment durchgeführt.

An diesem Punkt hat die audiobasierte Emotionsinferenz gezeigt, dass ein lehrbarer Moment im mentalen Zustand des Patienten angekommen ist und die Aufgabe darin besteht, das entsprechende Gesichtsbild zu erfassen und diese Dimension und diesen Bereich seines Affektzustands zu entwickeln.

Automatische Emotionsanalyse von Gesichtern in freier Wildbahn

(Im Video oben sehen wir die Arbeit, die von den Autoren der dimensionalen Emotionserkennungstechnologien entwickelt wurde, die von den Forschern für die neue Arbeit verwendet wurden.)

Die geodätische Form des Materials wurde für jeden Datenrahmen berechnet und die Singularwertzerlegung (SVD) Ermäßigung angewendet. Die resultierenden Zeitreihendaten wurden schließlich als modelliert VAR Prozess, und dann weiter reduziert über SVD vor MAP-Anpassung.

Arbeitsablauf für den geodätischen Reduktionsprozess.

Arbeitsablauf für den geodätischen Reduktionsprozess.

Die Valenz- und Erregungswerte im EmoNet-Netzwerk wurden ebenfalls auf ähnliche Weise mit VAR-Modellierung und Sequenzkernberechnung verarbeitet.

Experimente

Wie bereits erläutert, handelt es sich bei der neuen Arbeit in erster Linie um eine medizinische Forschungsarbeit und nicht um eine Standardeinreichung im Bereich Computer Vision. Wir verweisen den Leser auf die Arbeit selbst, um eine ausführliche Berichterstattung über die verschiedenen OEG-Experimente der Forscher zu erhalten.

Dennoch, um eine Auswahl davon zusammenzufassen:

Hinweise auf affektive Störungen

Hier wurden 40 Teilnehmer (nicht aus der Kontroll- oder Patientengruppe) gebeten, die ausgewerteten mittleren Gesichter (siehe oben) in Bezug auf eine Reihe von Fragen zu bewerten, ohne über den Kontext der Daten informiert zu werden. Die Fragen waren:

Welches Geschlecht haben die beiden Gesichter?
Haben die Gesichter ein attraktives Aussehen?
Sind diese Gesichter vertrauenswürdige Personen?
Wie beurteilen Sie die Handlungsfähigkeit dieser Menschen?
Welche Emotionen vermitteln die beiden Gesichter?
Welches Hautbild haben die beiden Gesichter?
Welchen Eindruck hat der Blick?
Haben die beiden Gesichter hängende Mundwinkel?
Haben die beiden Gesichter erhabene braune Augen?
Sind diese Personen klinische Patienten?

Die Forscher fanden heraus, dass diese Blindauswertungen mit dem registrierten Zustand der verarbeiteten Daten korrelierten:

Boxplot-Ergebnisse für die „Mean Face“-Umfrage.

Boxplot-Ergebnisse für die „Mean Face“-Umfrage.

Klinische Untersuchung

Um den Nutzen von OEG bei der Erstbeurteilung zu beurteilen, bewerteten die Forscher zunächst, wie effektiv die klinische Standardbeurteilung allein ist, und maßen den Grad der Verbesserung zwischen der Einleitung und der zweiten Phase (zu diesem Zeitpunkt erhält der Patient typischerweise medikamentöse Behandlungen).

Die Forscher kamen zu dem Schluss, dass Status und Schwere der Symptome mit dieser Methode gut beurteilt werden könnten, und erreichten eine Korrelation von 0.82. Eine genaue Diagnose von Schizophrenie oder Depression erwies sich jedoch als schwieriger, da die Standardmethode in diesem frühen Stadium nur einen Wert von -0.03 erreichte.

Die Autoren kommentieren:

„Grundsätzlich lässt sich der Patientenstatus mit den üblichen Fragebögen relativ gut ermitteln.“ Das ist jedoch im Wesentlichen alles, was man daraus schließen kann. Ob jemand depressiv oder eher schizophren ist, wird nicht angegeben. Das Gleiche gilt für das Ansprechen auf die Behandlung.“

Die Ergebnisse des maschinellen Prozesses konnten in diesem Problembereich höhere Werte und vergleichbare Werte für den Aspekt der ersten Patientenbewertung erzielen:

Höhere Zahlen sind besser. Auf der linken Seite sind die standardmäßigen Ergebnisse der interviewbasierten Bewertungsgenauigkeit in vier Phasen der Testarchitektur zu sehen. rechts: maschinenbasierte Ergebnisse.

Höhere Zahlen sind besser. Auf der linken Seite sind die standardmäßigen Ergebnisse der interviewbasierten Bewertungsgenauigkeit in vier Phasen der Testarchitektur zu sehen. rechts: maschinenbasierte Ergebnisse.

Störungsdiagnose

Die Unterscheidung zwischen Depression und Schizophrenie anhand statischer Gesichtsbilder ist keine triviale Angelegenheit. Durch Kreuzvalidierung konnte der maschinelle Prozess in den verschiedenen Phasen der Versuche hohe Genauigkeitswerte erzielen:

In anderen Experimenten konnten die Forscher Beweise dafür vorlegen, dass OEG durch pharmakologische Behandlung und allgemeine Behandlung der Störung eine Verbesserung des Patienten wahrnehmen kann:

„Der kausale Rückschluss auf das empirische Vorwissen der Datenerhebung passte die pharmakologische Behandlung an, um eine Rückkehr zur physiologischen Regulierung der Gesichtsdynamik zu beobachten.“ Eine solche Rückkehr konnte während der klinischen Verschreibung nicht beobachtet werden.

„Derzeit ist nicht klar, ob eine solche maschinelle Empfehlung tatsächlich zu einem deutlich besseren Therapieerfolg führen würde.“ Vor allem, weil bekannt ist, welche Nebenwirkungen Medikamente über einen längeren Zeitraum haben können.

„Allerdings würden [solche] auf den Patienten zugeschnittenen Ansätze die Barrieren des gängigen kategorialen Klassifizierungsschemas durchbrechen, das im täglichen Leben noch immer überwiegend verwendet wird.“

 

* Meine Umwandlung der Inline-Zitate der Autoren in Hyperlinks.

Erstveröffentlichung am 3. August 2022.