Взгляд Anderson

Диагностика психических расстройств с помощью оценки выражения лица с помощью ИИ

mm

Исследователи из Германии разработали метод выявления психических расстройств на основе выражения лица, интерпретируемого с помощью компьютерного зрения.

Новый подход не только может различать людей без расстройств и тех, кто страдает от них, но также может правильно различать депрессию и шизофрению, а также степень, в которой пациент в настоящее время страдает от заболевания.

Исследователи предоставили композитное изображение, представляющее контрольную группу для их тестов (слева на изображении ниже) и пациентов, страдающих психическими расстройствами (справа). Идентификаторы нескольких людей объединены в представлениях, и ни одно изображение не изображает конкретного человека:

Источник: https://arxiv.org/pdf/2208.01369.pdf

Источник: https://arxiv.org/pdf/2208.01369.pdf

Люди с аффективными расстройствами, как правило, имеют приподнятые брови, тусклый взгляд, опухшие лица и выражение «песчаной собаки». Чтобы защитить конфиденциальность пациентов, эти композитные изображения являются единственными, которые доступны в поддержку новой работы.

До сих пор распознавание эмоций на лице в основном использовалось как потенциальный инструмент для основной диагностики. Новый подход, однако, предлагает возможный метод оценки прогресса пациента во время лечения или, возможно (хотя статья не предполагает этого), в их домашней среде для амбулаторного мониторинга.

В статье говорится*:

«Выходя за рамки машинной диагностики депрессии в аффективных вычислениях, которая была разработана в предыдущих исследованиях, мы показываем, что измеряемое аффективное состояние, оцененное с помощью компьютерного зрения, содержит намного больше информации, чем чистая категориальная классификация».

Исследователи назвали эту технику Опто-электронная энцефалография (ОЭГ), полностью пассивный метод вывода психического состояния путем анализа изображения лица вместо топических датчиков или технологий медицинской визуализации на основе лучей.

Авторы приходят к выводу, что ОЭГ может потенциально не только быть второстепенным средством для диагностики и лечения, но и, в долгосрочной перспективе, потенциальной заменой для определенных оценочных частей процесса лечения, и что это может сократить время, необходимое для мониторинга пациентов и первоначальной диагностики. Они отмечают:

«В целом, результаты, предсказанные машиной, показывают лучшие корреляции по сравнению с чистой клинической оценкой на основе опросников и также объективны. Относительно короткий период измерения в несколько минут для подходов компьютерного зрения также заметен, тогда как для клинических интервью иногда требуются часы».

Однако авторы подчеркивают, что уход за пациентами в этой области является многомодальным, с многими другими индикаторами состояния пациента, которые необходимо учитывать, кроме их выражения лица, и что слишком рано считать, что такая система может полностью заменить традиционные подходы к психическим расстройствам. Тем не менее, они считают ОЭГ перспективной вспомогательной технологией, особенно как метод оценки эффектов фармакологического лечения в режиме пациента.

Статья называется Лицо аффективных расстройств, и исходит от восьми исследователей из широкого спектра учреждений частного и государственного медицинского исследовательского сектора.

Данные

(Новая статья в основном занимается различными теориями и методами, которые в настоящее время популярны в диагностике психических расстройств у пациентов, с меньшим вниманием, чем обычно, к фактическим технологиям и процессам, используемым в тестах и различных экспериментах)

Сбор данных проводился в Университетской больнице в Аахене, с 100 пациентами, сбалансированными по половому признаку, и контрольной группой из 50 не затронутых людей. Пациенты включали 35 страдающих от шизофрении и 65 человек, страдающих от депрессии.

Для части пациентов тестирования были сделаны первоначальные измерения в момент первой госпитализации, и вторые — перед их выпиской из больницы, охватывая средний интервал в 12 недель. Участники контрольной группы были набраны произвольно из местного населения, с их собственным введением и «выпиской», отражающей то, что было у фактических пациентов.

По сути, наиболее важная «фактическая истина» для такого эксперимента должна быть диагноз, полученный одобренными и стандартными методами, и это было так для испытаний ОЭГ.

Однако стадия сбора данных получила дополнительные данные, более подходящие для интерпретации машиной: интервью, продолжающиеся в среднем 90 минут, были захвачены в три фазы с помощью веб-камеры Logitech c270, работающей на частоте 25 кадров в секунду.

Первая сессия состояла из стандартного интервью по Хэмилтону (основанного на исследованиях, начатых около 1960 года), такого, как обычно проводится при поступлении. На втором этапе, необычно, пациентам (и их аналогам в контрольной группе) были показаны видео с рядом выражений лица, и они были попросили имитировать каждое из этих выражений, одновременно оценивая свое собственное психическое состояние в тот момент, включая эмоциональное состояние и интенсивность. Эта фаза длилась около десяти минут.

В третьей и последней фазе участникам были показаны 96 видео с актерами, продолжающихся чуть более десяти секунд каждый, якобы пересказывающих интенсивные эмоциональные переживания. Затем участников попросили оценить эмоцию и интенсивность, представленные в видео, а также их собственные соответствующие чувства. Эта фаза длилась около 15 минут.

Метод

Чтобы прийти к среднему значению захваченных лиц (см. первое изображение выше), эмоциональные ориентиры были захвачены с помощью фреймворка EmoNet. Затем была определена связь между формой лица и средней (усредненной) формой лица с помощью постепенной афинной трансформации.

Распознавание эмоций в размерности и предсказание взгляда глаза было выполнено на каждом сегменте ориентиров, выявленном на предыдущем этапе.

На этом этапе эмоциональный вывод на основе аудио указал, что наступил «учебный момент» в психическом состоянии пациента, и задача заключалась в захвате соответствующего изображения лица и разработке этого измерения и области его аффективного состояния.

(В видео выше мы видим работу, разработанную авторами технологий распознавания эмоций размерности, используемых исследователями для новой работы).

Геодезический контур материала был рассчитан для каждого кадра данных, и была применена уменьшенная аппроксимация по сингулярным значениям (SVD). Полученные временные ряды данных были в конечном итоге смоделированы как VAR-процесс, и затем еще больше уменьшены с помощью SVD до адаптации MAP.

Поток геодезического уменьшения.

Поток геодезического уменьшения.

Значения валентности и возбуждения в сети EmoNet также были обработаны аналогично с помощью модели VAR и вычисления ядерной последовательности.

Эксперименты

Как объяснялось ранее, новая работа в основном является медицинским исследовательским документом, а не стандартной статьей по компьютерному зрению, и мы направляем читателя к самой статье для углубленного освещения разнообразных экспериментов ОЭГ, проведенных исследователями.

Тем не менее, чтобы суммировать некоторые из них:

Сигналы аффективных расстройств

Здесь 40 участников (не из контрольной или пациентской группы) были попросили оценить средние лица (см. выше) по отношению к ряду вопросов, не зная контекста данных. Вопросы были:

Какой пол у двух лиц?
Имеют ли лица привлекательный вид?
Являются ли эти лица достойными доверия?
Как вы оцениваете способность этих людей действовать?
Какова эмоция двух лиц?
Каков вид кожи двух лиц?
Какое впечатление от взгляда?
Имеют ли два лица опущенные углы рта?
Имеют ли два лица приподнятые брови?
Являются ли эти люди клиническими пациентами?

Исследователи обнаружили, что эти слепые оценки коррелировали с зарегистрированным состоянием обработанных данных:

Результаты опроса «среднего лица».

Результаты опроса «среднего лица».

Клиническая оценка

Чтобы оценить полезность ОЭГ в первоначальной оценке, исследователи сначала оценили, насколько эффективна стандартная клиническая оценка сама по себе, измеряя уровни улучшения между индукцией и вторым этапом (к моменту, когда пациент обычно получает лекарственные препараты.

Исследователи пришли к выводу, что статус и тяжесть симптомов можно хорошо оценить с помощью этого метода, достигнув корреляции 0,82. Однако точный диагноз либо шизофрении, либо депрессии оказался более сложным, и стандартный метод получил счет только 0,03 на этом раннем этапе.

Авторы комментируют:

«По сути, состояние пациента можно относительно хорошо определить с помощью обычных опросников. Однако это практически все, что можно заключить из него. То, страдает ли кто-то от депрессии или шизофрении, не указано. То же самое относится к реакции на лечение».

Результаты машинного процесса смогли получить более высокие баллы в этой проблемной области и сравнимые баллы для первоначальной оценки пациента:

Более высокие числа лучше. Слева — результаты точности оценки на основе интервью по четырем фазам архитектуры тестирования; справа — результаты, основанные на машине.

Более высокие числа лучше. Слева — результаты точности оценки на основе интервью по четырем фазам архитектуры тестирования; справа — результаты, основанные на машине.

Диагностика расстройств

Различие депрессии от шизофрении с помощью статических изображений лица не является тривиальной задачей. С помощью перекрестной проверки машинный процесс смог получить высокие баллы точности на различных этапах испытаний:

В других экспериментах исследователи смогли продемонстрировать доказательства того, что ОЭГ может воспринимать улучшение пациента через фармакологическое лечение и общее лечение расстройства:

«Каузальное вывод о эмпирических знаниях данных сбора корректировало фармакологическое лечение, чтобы наблюдать возвращение к физиологической регуляции динамики лица. Такое возвращение не могло быть наблюдаемо во время клинического назначения».

«В настоящее время неясно, приведет ли такое машинное рекомендации к значительному лучшему успеху терапии. Особенно потому, что известно, какие побочные эффекты могут иметь препараты за долгое время».

«Однако [такие] подходы, адаптированные к пациенту, бы разрушили барьеры обычной категориальной классификационной схемы, все еще доминирующей в повседневной жизни».

 

* Мое преобразование внутренних цитат авторов в гиперссылки.

Опубликовано впервые 3 августа 2022 года.

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.