スタブ AI の表情評価による精神的健康障害の診断 - Unite.AI
私達と接続

ヘルスケア

AI表情評価でメンタルヘルス不調を診断

mm
更新中 on

ドイツの研究者が、コンピュータービジョンで読み取られる顔の表情に基づいて精神疾患を特定する方法を開発した。

新しいアプローチは、罹患していない被験者と罹患している被験者を区別できるだけでなく、うつ病と統合失調症、さらには患者が現在この病気に罹患している程度を正確に区別することもできる。

研究者らは、テストの対照群(下の画像の左側)と精神障害に苦しむ患者(右)を表す合成画像を提供しました。 複数の人物のアイデンティティが表現に混在しており、どちらの画像も特定の個人を描いていません。

出典:https://arxiv.org/pdf/2208.01369.pdf

出典:https://arxiv.org/pdf/2208.01369.pdf

感情障害のある人は、眉毛が上がり、鉛色の視線、顔が腫れ、口が垂れ下がったような表情をしている傾向があります。 患者のプライバシーを保護するため、新しい研究をサポートするために利用できるのはこれらの合成画像のみです。

これまで、顔の感情認識は主に、基本的な診断のための潜在的なツールとして使用されてきました。 その代わりに、新しいアプローチは、患者の治療全体を通しての経過を評価する、あるいは(論文では示唆されていないが、潜在的には)自宅の環境で外来モニタリングのために患者の経過を評価する可能性のある方法を提供する。

論文には次のように書かれています*:

「感情コンピューティングによるうつ病の機械診断を超えて、 研究我々は、コンピュータビジョンによって推定された測定可能な感情状態には、純粋なカテゴリ分類よりもはるかに多くの情報が含まれていることを示します。

研究者らはこの技術を「 光電子脳波検査 (OEG) は、局所センサーや光線ベースの医療画像技術の代わりに、顔画像分析によって精神状態を推測する完全に受動的な方法です。

著者らは、OEGは潜在的に診断と治療の単なる二次的な補助ではなく、長期的には治療パイプラインの特定の評価部分の代替となる可能性があり、患者に必要な時間を短縮できる可能性があると結論付けています。モニタリングと初期診断。 彼らは次のように指摘しています。

「全体として、機械によって予測された結果は、純粋な臨床観察者の評価に基づくアンケートと比較して、より良い相関関係を示しており、また客観的でもあります。 コンピュータビジョンアプローチの測定時間が数分と比較的短いことも注目に値しますが、臨床面接では数時間かかることもあります。」

しかし、著者らは、この分野での患者ケアは多面的な取り組みであり、患者の状態を表す指標は顔の表情だけでなく多くのものが考慮されるべきであり、そのようなシステムが可能であると考えるのは時期尚早であることを強調したいと考えています。精神障害に対する従来のアプローチを完全に置き換えます。 それにもかかわらず、彼らは OEG が、特に患者の処方計画における薬物治療の効果を段階的に評価する方法として、有望な補助技術であると考えています。

  というタイトルです 感情障害の顔、民間および公的医療研究部門の幅広い機関の XNUMX 人の研究者から構成されています。

且つ

(新しい論文は主に、精神障害の患者の診断において現在普及しているさまざまな理論や方法を扱っており、検査やさまざまな実験で使用される実際の技術やプロセスには通常よりもあまり注目されていません。)

データ収集はアーヘンの大学病院で、性別のバランスがとれた患者 100 名と、影響を受けていない 50 名の対照群を対象に行われました。 患者には統合失調症患者35名、うつ病患者65名が含まれていた。

試験グループの患者部分については、最初の測定は最初の入院時に行われ、12回目の測定は退院前に平均XNUMX週間の間隔で行われました。 対照群の参加者は地元住民から恣意的に集められ、彼ら自身の導入と「退院」は実際の患者のそれを反映したものでした。

実際、そのような実験にとって最も重要な「真実」は、承認された標準的な方法によって得られた診断でなければならず、これが OEG 試験の場合でした。

ただし、データ収集段階では、機械解釈により適した追加データが得られました。平均 90 分のインタビューが、270 fps で動作する Logitech c25 コンシューマ ウェブカメラを使用して XNUMX つのフェーズにわたってキャプチャされました。

最初のセッションは標準的な内容で構成されます ハミルトンのインタビュー (調査に基づく 発信 1960 年頃)、通常は入学時に与えられるようなものです。 第 XNUMX 段階では、珍しいことに、患者 (および対照群の対応者) が示されました。 ビデオ 一連の表情を提示し、感情状態や激しさなど、そのときの自分の精神状態についての独自の評価を述べながら、それぞれの表情を真似するように依頼しました。 このフェーズは約 XNUMX 分間続きました。

最終の第 96 段階では、参加者にはそれぞれ 15 秒強の俳優の XNUMX 本のビデオが見せられ、明らかに激しい感情的な体験を語った。 次に、参加者は、ビデオに表現されている感情と激しさ、およびそれに対応する自分自身の感情を評価するよう求められました。 この段階は約 XNUMX 分間続きました。

方法

キャプチャされた顔の平均を求めるために (上の最初の画像を参照)、感情的なランドマークが次の方法でキャプチャされました。 エモネット フレームワーク。 次に、顔の形状と平均(平均)の顔の形状の間の対応関係を次の方法で決定しました。 区分的アフィン変換.

次元感情認識 および 視線予測 前の段階で特定された各ランドマークセグメントに対して実行されました。

この時点で、音声ベースの感情推論は、患者の精神状態に教育可能な瞬間が到来したことを示しており、その課題は、対応する顔の画像をキャプチャし、感情状態のその次元と領域を開発することです。

自然界の顔からの自動感情分析

(上のビデオでは、研究者が新しい研究に使用した次元感情認識技術の作者が開発した成果が見られます)。

マテリアルの形状測地線はデータのフレームごとに計算され、特異値分解 (SVD) 軽減が適用されます。 結果として得られた時系列データは、最終的に次のようにモデル化されました。 VAR プロセスを経て、SVD を介してさらに削減されます。 MAP適応.

測地線縮小プロセスのワークフロー。

測地線縮小プロセスのワークフロー。

EmoNet ネットワークの価数と覚醒値も、VAR モデリングとシーケンス カーネル計算で同様に処理されました。

実験

前に説明したように、新しい研究は標準的なコンピュータ ビジョンの投稿ではなく、主に医学研究論文であり、研究者によって実行されたさまざまな OEG 実験の詳細な報道については、読者に論文そのものを参照していただくよう案内します。

それにもかかわらず、それらの選択を要約すると、次のようになります。

情動障害の合図

ここでは、40 人の参加者 (対照群や患者グループからではない) が、データのコンテキストを知らされることなく、いくつかの質問に関して評価された平均顔 (上記を参照) を評価するように求められました。 質問は次のとおりです。

二人の顔の性別は何でしょうか?
顔は魅力的な外観をしていますか?
これらの顔は信頼できる人物ですか?
これらの人々の行動能力をどのように評価しますか?
二人の顔に込められた感情とは?
二人の顔の肌の様子はどうですか?
視線の印象は?
二人の顔は口角が垂れていませんか?
二人の顔の目の茶色は盛り上がっていますか?
この人たちは臨床患者ですか?

研究者らは、これらのブラインド評価が、処理されたデータの登録状態と相関していることを発見しました。

「平均顔」調査の箱ひげ図の結果。

「平均顔」調査の箱ひげ図の結果。

臨床評価

初期評価における OEG の有用性を評価するために、研究者らはまず、標準的な臨床評価自体がどの程度有効であるかを評価し、導入期と第 XNUMX 期の間の改善レベル (この時点までに患者は通常、薬物ベースの治療を受けられるようになる) を測定しました。

研究者らは、この方法によって状態と症状の重症度を適切に評価でき、相関関係が 0.82 であると結論付けました。 しかし、統合失調症またはうつ病の正確な診断はさらに困難であることが判明し、標準的な方法ではこの初期段階では -0.03 のスコアしか得られませんでした。

著者らは次のようにコメントしています。

「本質的に、患者の状態は通常のアンケートを使用して比較的適切に判断できます。 ただし、そこから結論付けられるのは本質的にこれだけです。 誰かがうつ病なのか、それとも統合失調症なのかは示されていません。 同じことが治療反応にも当てはまります。」

機械プロセスの結果は、この問題領域でより高いスコアを取得することができ、初期の患者評価の側面では同等のスコアを得ることができました。

数値が大きいほど優れています。 左側は、テスト アーキテクチャの XNUMX つのフェーズにわたる標準的なインタビュー ベースの評価精度の結果です。 右側はマシンベースの結果。

数値が大きいほど優れています。 左側は、テスト アーキテクチャの XNUMX つのフェーズにわたる標準的なインタビュー ベースの評価精度の結果です。 右側はマシンベースの結果。

疾患の診断

静止した顔画像からうつ病と統合失調症を区別することは簡単な問題ではありません。 相互検証により、機械プロセスはトライアルのさまざまな段階で高い精度のスコアを取得できました。

他の実験では、研究者らは、OEG が薬物療法や疾患の一般的な治療を通じて患者の改善を認識できるという証拠を実証することができました。

「データ収集の経験的な事前知識に対する因果推論により、顔のダイナミクスの生理学的調節への回帰を観察するために薬理学的治療が調整されました。」 このような戻りは臨床処方中には観察されませんでした。

「現時点では、そのような機械ベースの推奨が本当に治療の大幅な成功につながるかどうかは明らかではありません。 特に、薬が長期間にわたってどのような副作用を引き起こす可能性があるかがわかっているためです。

「しかし、[この種の]患者に合わせたアプローチは、日常生活で依然として支配的に使用されている一般的なカテゴリー分類図の壁を打ち破るでしょう。」

 

* 著者のインライン引用をハイパーリンクに変換しました。

初版は3年2022月XNUMX日に発行されました。