toco Diagnosticando Distúrbios de Saúde Mental Através da Avaliação de Expressão Facial por IA - Unite.AI
Entre em contato

Assistência médica

Diagnosticando distúrbios de saúde mental por meio da avaliação de expressão facial por IA

mm
Atualização do on

Pesquisadores da Alemanha desenvolveram um método para identificar transtornos mentais com base em expressões faciais interpretadas por visão computacional.

A nova abordagem pode não apenas distinguir entre indivíduos não afetados e afetados, mas também pode distinguir corretamente a depressão da esquizofrenia, bem como o grau em que o paciente está atualmente afetado pela doença.

Os pesquisadores forneceram uma imagem composta que representa o grupo de controle para seus testes (à esquerda na imagem abaixo) e os pacientes que sofrem de transtornos mentais (à direita). As identidades de várias pessoas são misturadas nas representações, e nenhuma das imagens retrata um indivíduo em particular:

Fonte: https://arxiv.org/pdf/2208.01369.pdf

Fonte: https://arxiv.org/pdf/2208.01369.pdf

Indivíduos com transtornos afetivos tendem a ter sobrancelhas levantadas, olhar pesado, rostos inchados e expressões de boca de cachorro. Para proteger a privacidade do paciente, essas imagens compostas são as únicas disponibilizadas para apoiar o novo trabalho.

Até agora, o reconhecimento de afeto facial tem sido usado principalmente como uma ferramenta potencial para o diagnóstico básico. A nova abordagem, em vez disso, oferece um método possível para avaliar o progresso do paciente ao longo do tratamento, ou então (potencialmente, embora o artigo não o sugira) em seu próprio ambiente doméstico para monitoramento ambulatorial.

O jornal afirma*:

'Indo além da máquina de diagnóstico de depressão na computação afetiva, que foi desenvolvida em anterior caso, mostramos que o estado afetivo mensurável estimado por meio de visão computacional contém muito mais informações do que a classificação categórica pura.'

Os pesquisadores apelidaram essa técnica Encefalografia Opto Eletrônica (OEG), um método completamente passivo de inferir estado mental por análise de imagem facial em vez de sensores tópicos ou tecnologias de imagens médicas baseadas em raios.

Os autores concluem que o OEG poderia ser não apenas um mero auxiliar secundário para diagnóstico e tratamento, mas, a longo prazo, um substituto potencial para certas partes avaliativas do pipeline de tratamento e que poderia reduzir o tempo necessário para o paciente acompanhamento e diagnóstico inicial. Eles observam:

'No geral, os resultados previstos pela máquina mostram melhores correlações em comparação com os questionários baseados em avaliação de observadores clínicos puros e também são objetivos. O período de medição relativamente curto de alguns minutos para as abordagens de visão computacional também é digno de nota, enquanto às vezes são necessárias horas para as entrevistas clínicas.'

No entanto, os autores enfatizam que o atendimento ao paciente neste campo é uma busca multimodal, com muitos outros indicadores do estado do paciente a serem considerados além de suas expressões faciais, e que é muito cedo para considerar que tal sistema poderia substituem inteiramente as abordagens tradicionais para transtornos mentais. No entanto, eles consideram a OEG uma tecnologia adjunta promissora, particularmente como um método para graduar os efeitos do tratamento farmacêutico no regime prescrito ao paciente.

A papel é intitulado A face dos transtornos afetivos, e vem de oito pesquisadores em uma ampla gama de instituições do setor de pesquisa médica público e privado.

Data

(O novo artigo trata principalmente das várias teorias e métodos que são atualmente populares no diagnóstico de pacientes com transtornos mentais, com menos atenção do que o habitual às tecnologias e processos reais usados ​​nos testes e vários experimentos)

A coleta de dados ocorreu no Hospital Universitário de Aachen, com 100 pacientes com gênero equilibrado e um grupo de controle de 50 pessoas não afetadas. Os pacientes incluíam 35 pessoas com esquizofrenia e 65 pessoas com depressão.

Para a porção de pacientes do grupo de teste, as medições iniciais foram feitas no momento da primeira internação e a segunda antes da alta hospitalar, abrangendo um intervalo médio de 12 semanas. Os participantes do grupo de controle foram recrutados arbitrariamente da população local, com sua própria indução e 'alta' espelhando a dos pacientes reais.

Com efeito, a "verdade fundamental" mais importante para tal experimento deve ser diagnósticos obtidos por métodos aprovados e padrão, e este foi o caso dos ensaios OEG.

No entanto, o estágio de coleta de dados obteve dados adicionais mais adequados para a interpretação da máquina: entrevistas com média de 90 minutos foram capturadas em três fases com uma webcam de consumidor Logitech c270 rodando a 25 fps.

A primeira sessão consistiu de um padrão entrevista com Hamilton (com base em pesquisas originado por volta de 1960), como normalmente seria dado na admissão. Na segunda fase, de forma incomum, os pacientes (e suas contrapartes no grupo de controle) foram mostrados vídeos de uma série de expressões faciais e solicitados a imitar cada uma delas, enquanto declaravam sua própria estimativa de sua condição mental naquele momento, incluindo estado emocional e intensidade. Esta fase durou cerca de dez minutos.

Na terceira e última fase, foram exibidos aos participantes 96 vídeos de atores, com duração de pouco mais de dez segundos cada, aparentemente relatando intensas experiências emocionais. Os participantes foram então solicitados a avaliar a emoção e a intensidade representadas nos vídeos, bem como seus próprios sentimentos correspondentes. Esta fase durou cerca de 15 minutos.

Forma

Para chegar à média dos rostos capturados (ver primeira imagem, acima), marcos emocionais foram capturados com o EmoNetName estrutura. Posteriormente, a correspondência entre a forma da face e a forma média (média) da face foi determinada por meio de transformação afim por partes.

Reconhecimento dimensional de emoções e previsão do olhar foi realizada em cada segmento de referência identificado na etapa anterior.

Neste ponto, a inferência de emoções baseada em áudio indicou que um momento de aprendizado chegou ao estado mental do paciente, e a tarefa é capturar a imagem facial correspondente e desenvolver essa dimensão e domínio de seu estado afetivo.

Análise automática de emoções de rostos selvagens

(No vídeo acima, vemos o trabalho desenvolvido pelos autores das tecnologias de reconhecimento dimensional de emoções utilizadas pelos pesquisadores para o novo trabalho).

A forma geodésica do material foi calculada para cada quadro dos dados, e a Decomposição de Valor Singular (SVD) redução aplicada. Os dados resultantes da série temporal foram finalmente modelados como um VAR processo e, em seguida, reduzido ainda mais via SVD antes de Adaptação do mapa.

Workflow para o processo de redução geodésica.

Workflow para o processo de redução geodésica.

Os valores de valência e excitação na rede EmoNet também foram processados ​​de forma semelhante com modelagem VAR e computação de kernel de sequência.

Experimentos

Conforme explicado anteriormente, o novo trabalho é principalmente um artigo de pesquisa médica, em vez de um envio padrão de visão computacional, e encaminhamos o leitor ao próprio artigo para uma cobertura aprofundada dos diversos experimentos OEG executados pelos pesquisadores.

No entanto, para resumir uma seleção deles:

Sinais de transtorno afetivo

Aqui, 40 participantes (não do grupo de controle ou paciente) foram solicitados a avaliar as faces médias avaliadas (veja acima) em relação a uma série de perguntas, sem serem informados sobre o contexto dos dados. As perguntas eram:

Qual é o gênero das duas faces?
Os rostos têm uma aparência atraente?
Esses rostos são pessoas confiáveis?
Como você avalia a capacidade de ação dessas pessoas?
Qual é a emoção dos dois rostos?
Qual é a aparência da pele dos dois rostos?
Qual é a impressão do olhar?
Os dois rostos têm cantos da boca caídos?
Os dois rostos têm olhos castanhos levantados?
Essas pessoas são pacientes clínicos?

Os pesquisadores descobriram que essas avaliações cegas se correlacionavam com o estado registrado dos dados processados:

Resultados do gráfico de caixa para a pesquisa 'face média'.

Resultados do gráfico de caixa para a pesquisa 'face média'.

Avaliação clínica

Para avaliar a utilidade da OEG na avaliação inicial, os pesquisadores primeiro avaliaram a eficácia da avaliação clínica padrão por si só, medindo os níveis de melhora entre a indução e a segunda fase (momento em que o paciente normalmente recebe tratamentos à base de medicamentos.

Os pesquisadores concluíram que o estado e a gravidade dos sintomas podem ser bem avaliados por esse método, alcançando uma correlação de 0.82. No entanto, um diagnóstico preciso de esquizofrenia ou depressão provou ser mais desafiador, com o método padrão obtendo apenas uma pontuação de -0.03 neste estágio inicial.

Os autores comentam:

'Em essência, o estado do paciente pode ser determinado relativamente bem usando os questionários usuais. No entanto, isso é essencialmente tudo o que pode ser concluído a partir dele. Se alguém está deprimido ou esquizofrênico não é indicado. O mesmo se aplica à resposta ao tratamento.'

Os resultados do processo da máquina foram capazes de obter pontuações mais altas nessa área problemática e pontuações comparáveis ​​​​para o aspecto inicial da avaliação do paciente:

Números mais altos são melhores. À esquerda, a precisão da avaliação baseada em entrevista padrão resulta em quatro fases da arquitetura de teste; à direita, resultados baseados em máquina.

Números mais altos são melhores. À esquerda, a precisão da avaliação baseada em entrevista padrão resulta em quatro fases da arquitetura de teste; à direita, resultados baseados em máquina.

Diagnóstico de Transtorno

Distinguir depressão de esquizofrenia por meio de imagens faciais estáticas não é uma questão trivial. Com validação cruzada, o processo da máquina foi capaz de obter altas pontuações de precisão nas várias fases dos testes:

Em outros experimentos, os pesquisadores conseguiram demonstrar evidências de que a OEG pode perceber a melhora do paciente por meio do tratamento farmacológico e do tratamento geral do distúrbio:

'A inferência causal sobre o conhecimento empírico prévio da coleta de dados ajustou o tratamento farmacológico para observar um retorno à regulação fisiológica da dinâmica facial. Tal retorno não pôde ser observado durante a prescrição clínica.

“No momento, não está claro se tal recomendação baseada em máquina resultaria de fato em um sucesso significativamente melhor da terapia. Até porque se sabe quais são os efeitos colaterais que os medicamentos podem ter por um longo período de tempo.

'No entanto, [esses tipos] de abordagens adaptadas ao paciente quebrariam as barreiras do esquema de classificação categórica comum ainda predominantemente usado na vida diária.'

 

* Minha conversão das citações inline dos autores em hiperlinks.

Publicado pela primeira vez em 3 de agosto de 2022.