talón Diagnóstico de trastornos de salud mental a través de la evaluación de la expresión facial con IA - Unite.AI
Contáctanos

Healthcare

Diagnóstico de trastornos de salud mental a través de la evaluación de la expresión facial con IA

mm
Actualizado on

Investigadores alemanes han desarrollado un método para identificar trastornos mentales basándose en expresiones faciales interpretadas mediante visión por computadora.

El nuevo enfoque no solo puede distinguir entre sujetos afectados y no afectados, sino que también puede distinguir correctamente la depresión de la esquizofrenia, así como el grado en que el paciente está actualmente afectado por la enfermedad.

Los investigadores han proporcionado una imagen compuesta que representa el grupo de control para sus pruebas (a la izquierda en la imagen de abajo) y los pacientes que sufren trastornos mentales (derecha). Las identidades de varias personas se mezclan en las representaciones, y ninguna de las imágenes representa a un individuo en particular:

Fuente: https://arxiv.org/pdf/2208.01369.pdf

Fuente: https://arxiv.org/pdf/2208.01369.pdf

Las personas con trastornos afectivos tienden a tener cejas arqueadas, miradas plomizas, caras hinchadas y expresiones de boca de perro avergonzado. Para proteger la privacidad del paciente, estas imágenes compuestas son las únicas disponibles para respaldar el nuevo trabajo.

Hasta ahora, el reconocimiento de afecto facial se ha utilizado principalmente como una herramienta potencial para el diagnóstico básico. El nuevo enfoque, en cambio, ofrece un posible método para evaluar el progreso del paciente a lo largo del tratamiento, o bien (potencialmente, aunque el documento no lo sugiere) en su propio entorno doméstico para el seguimiento ambulatorio.

El documento dice*:

'Yendo más allá del diagnóstico automático de la depresión en la computación afectiva, que se ha desarrollado en anterior estudios, mostramos que el estado afectivo medible estimado por medio de visión artificial contiene mucha más información que la clasificación categórica pura.'

Los investigadores han denominado a esta técnica Encefalografía optoelectrónica (OEG), un método completamente pasivo para inferir el estado mental mediante el análisis de imágenes faciales en lugar de sensores tópicos o tecnologías de imágenes médicas basadas en rayos.

Los autores concluyen que la OEG podría ser potencialmente no solo una mera ayuda secundaria para el diagnóstico y el tratamiento, sino, a largo plazo, un reemplazo potencial para ciertas partes evaluativas del proceso de tratamiento, y que podría reducir el tiempo necesario para que el paciente seguimiento y diagnóstico inicial. Ellos notan:

'En general, los resultados predichos por la máquina muestran mejores correlaciones en comparación con los cuestionarios basados ​​únicamente en la calificación del observador clínico y también son objetivos. El período de medición relativamente corto de unos pocos minutos para los enfoques de visión por computadora también es digno de mención, mientras que a veces se requieren horas para las entrevistas clínicas.'

Sin embargo, los autores desean enfatizar que la atención al paciente en este campo es una búsqueda multimodal, con muchos otros indicadores del estado del paciente a considerar además de sus expresiones faciales, y que es demasiado pronto para considerar que tal sistema podría sustituir por completo los enfoques tradicionales de los trastornos mentales. No obstante, consideran que OEG es una tecnología complementaria prometedora, particularmente como un método para clasificar los efectos del tratamiento farmacéutico en el régimen prescrito de un paciente.

El se titula El rostro de los trastornos afectivos, y proviene de ocho investigadores de una amplia gama de instituciones del sector de investigación médica público y privado.

Datos

(El nuevo documento trata principalmente de las diversas teorías y métodos que son actualmente populares en el diagnóstico de pacientes con trastornos mentales, con menos atención de lo habitual a las tecnologías y procesos reales utilizados en las pruebas y diversos experimentos)

La recopilación de datos se llevó a cabo en el Hospital Universitario de Aachen, con 100 pacientes de género equilibrado y un grupo de control de 50 personas no afectadas. Los pacientes incluyeron 35 personas que sufrían de esquizofrenia y 65 personas que sufrían de depresión.

Para la porción de pacientes del grupo de prueba, las mediciones iniciales se tomaron en el momento de la primera hospitalización y la segunda antes de su alta hospitalaria, durante un intervalo promedio de 12 semanas. Los participantes del grupo de control fueron reclutados arbitrariamente de la población local, con su propia inducción y "alta" reflejando la de los pacientes reales.

En efecto, la 'verdad básica' más importante para un experimento de este tipo debe ser el diagnóstico obtenido mediante métodos estándar y aprobados, y este fue el caso de los ensayos OEG.

Sin embargo, la etapa de recopilación de datos obtuvo datos adicionales más adecuados para la interpretación automática: se capturaron entrevistas con un promedio de 90 minutos en tres fases con una cámara web de consumo Logitech c270 funcionando a 25 fps.

La primera sesión comprendió un estándar entrevista hamilton (basado en investigaciones originada alrededor de 1960), como normalmente se daría en el momento de la admisión. En la segunda fase, inusualmente, los pacientes (y sus contrapartes en el grupo de control) se mostraron videos de una serie de expresiones faciales, y se les pidió que imitaran cada una de ellas, mientras expresaban su propia estimación de su condición mental en ese momento, incluido el estado emocional y la intensidad. Esta fase duró alrededor de diez minutos.

En la tercera y última fase, se mostraron a los participantes 96 vídeos de actores, de poco más de diez segundos de duración cada uno, que aparentemente relataban intensas experiencias emocionales. Luego se pidió a los participantes que evaluaran la emoción y la intensidad representadas en los videos, así como sus propios sentimientos correspondientes. Esta fase duró alrededor de 15 minutos.

Método

Para llegar al promedio promedio de las caras capturadas (ver la primera imagen, arriba), se capturaron hitos emocionales con el Emonet estructura. Posteriormente, se determinó la correspondencia entre la forma de la cara y la forma de la cara media (promediada) a través de transformación afín por partes.

Reconocimiento de emociones dimensionales y predicción de la mirada se realizó sobre cada segmento de hito identificado en la etapa anterior.

En este punto, la inferencia de emociones basada en audio ha indicado que ha llegado un momento de enseñanza en el estado mental del paciente, y la tarea es capturar la imagen facial correspondiente y desarrollar esa dimensión y dominio de su estado afectivo.

Análisis automático de emociones de caras en estado salvaje

(En el video de arriba, vemos el trabajo desarrollado por los autores de las tecnologías de reconocimiento de emociones dimensionales utilizadas por los investigadores para el nuevo trabajo).

La forma geodésica del material se calculó para cada cuadro de los datos y la Descomposición de valores singulares (SVD) reducción aplicada. Los datos de series de tiempo resultantes finalmente se modelaron como un VAR proceso, y luego reducido aún más a través de SVD antes de Adaptación MAPA.

Flujo de trabajo para el proceso de reducción geodésica.

Flujo de trabajo para el proceso de reducción geodésica.

Los valores de valencia y excitación en la red EmoNet también se procesaron de manera similar con el modelado VAR y el cálculo del kernel de secuencia.

Experimentos

Como se explicó anteriormente, el nuevo trabajo es principalmente un documento de investigación médica en lugar de una presentación estándar de visión por computadora, y remitimos al lector al documento en sí para una cobertura detallada de los diversos experimentos OEG realizados por los investigadores.

No obstante, para resumir una selección de ellos:

Señales de trastorno afectivo

Aquí se pidió a 40 participantes (no del grupo de control o de pacientes) que calificaran las caras medias evaluadas (ver arriba) con respecto a una serie de preguntas, sin ser informados del contexto de los datos. Las preguntas fueron:

¿Cuál es el género de las dos caras?
¿Las caras tienen una apariencia atractiva?
¿Son estas caras personas de confianza?
¿Cómo evalúa la capacidad de acción de estas personas?
¿Cuál es la emoción de las dos caras?
¿Cuál es el aspecto de la piel de las dos caras?
¿Cuál es la impresión de la mirada?
¿Las dos caras tienen las comisuras de los labios caídas?
¿Las dos caras tienen los ojos marrones levantados?
¿Son estas personas pacientes clínicos?

Los investigadores encontraron que estas evaluaciones ciegas se correlacionaban con el estado registrado de los datos procesados:

Resultados del diagrama de caja para la encuesta de 'cara media'.

Resultados del diagrama de caja para la encuesta de 'cara media'.

Evaluación clínica

Para medir la utilidad de OEG en la evaluación inicial, los investigadores primero evaluaron qué tan efectiva es la evaluación clínica estándar por sí misma, midiendo los niveles de mejora entre la inducción y la segunda fase (momento en el cual el paciente generalmente recibe tratamientos basados ​​en medicamentos).

Los investigadores concluyeron que el estado y la gravedad de los síntomas podían evaluarse bien con este método, logrando una correlación de 0.82. Sin embargo, un diagnóstico preciso de esquizofrenia o depresión resultó más desafiante, ya que el método estándar solo obtuvo una puntuación de -0.03 en esta etapa temprana.

Los autores comentan:

'En esencia, el estado del paciente se puede determinar relativamente bien utilizando los cuestionarios habituales. Sin embargo, eso es esencialmente todo lo que se puede concluir de él. No se indica si alguien está deprimido o más bien esquizofrénico. Lo mismo se aplica a la respuesta al tratamiento.

Los resultados del proceso de la máquina pudieron obtener puntajes más altos en esta área problemática y puntajes comparables para el aspecto de evaluación inicial del paciente:

Los números más altos son mejores. A la izquierda, resultados de precisión de evaluación estándar basados ​​en entrevistas en cuatro fases de la arquitectura de prueba; a la derecha, resultados basados ​​en máquinas.

Los números más altos son mejores. A la izquierda, resultados de precisión de evaluación estándar basados ​​en entrevistas en cuatro fases de la arquitectura de prueba; a la derecha, resultados basados ​​en máquinas.

Diagnóstico del trastorno

Distinguir la depresión de la esquizofrenia a través de imágenes faciales estáticas no es un asunto trivial. Con validación cruzada, el proceso de la máquina pudo obtener puntajes de alta precisión en las diversas fases de las pruebas:

En otros experimentos, los investigadores pudieron demostrar evidencia de que OEG puede percibir una mejoría del paciente a través del tratamiento farmacológico y el tratamiento general del trastorno:

'La inferencia causal sobre el conocimiento previo empírico de la recolección de datos ajustó el tratamiento farmacológico para observar un retorno a la regulación fisiológica de la dinámica facial. Tal retorno no pudo ser observado durante la prescripción clínica.

“Por el momento, no está claro si una recomendación basada en una máquina de este tipo realmente daría como resultado un éxito significativamente mayor de la terapia. Sobre todo porque se sabe qué efectos secundarios pueden tener los medicamentos durante un largo período de tiempo.

"Sin embargo, [este tipo] de enfoques adaptados al paciente romperían las barreras del esquema de clasificación categórico común que todavía se usa predominantemente en la vida diaria".

 

* Mi conversión de las citas en línea de los autores a hipervínculos.

Publicado por primera vez el 3 de agosto de 2022.