Chăm sóc sức khỏe

Chẩn đoán Rối loạn Sức khỏe Tâm thần Thông qua Đánh giá Biểu hiện Khuôn mặt AI

cập nhật on Tháng Tám 3, 2022

Các nhà nghiên cứu từ Đức đã phát triển một phương pháp xác định các rối loạn tâm thần dựa trên nét mặt được diễn giải bằng thị giác máy tính.

Phương pháp mới không chỉ có thể phân biệt giữa các đối tượng không bị ảnh hưởng và bị ảnh hưởng, mà còn có thể phân biệt chính xác trầm cảm với tâm thần phân liệt, cũng như mức độ mà bệnh nhân hiện đang bị ảnh hưởng bởi căn bệnh này.

Các nhà nghiên cứu đã cung cấp một hình ảnh tổng hợp đại diện cho nhóm đối chứng trong các thử nghiệm của họ (bên trái trong hình bên dưới) và những bệnh nhân bị rối loạn tâm thần (bên phải). Danh tính của nhiều người được trộn lẫn trong các hình ảnh đại diện và không hình ảnh nào mô tả một cá nhân cụ thể:

Nguồn: https://arxiv.org/pdf/2208.01369.pdf

Những người mắc chứng rối loạn cảm xúc có xu hướng nhướng mày, ánh mắt lạnh lùng, khuôn mặt sưng húp và biểu cảm miệng như treo cổ. Để bảo vệ quyền riêng tư của bệnh nhân, những hình ảnh tổng hợp này là những hình ảnh duy nhất được cung cấp để hỗ trợ cho công việc mới.

Cho đến nay, nhận dạng khuôn mặt chủ yếu được sử dụng như một công cụ tiềm năng để chẩn đoán cơ bản. Thay vào đó, cách tiếp cận mới đưa ra một phương pháp khả thi để đánh giá sự tiến bộ của bệnh nhân trong suốt quá trình điều trị, hoặc nếu không (có khả năng, mặc dù bài báo không đề xuất điều đó) trong môi trường gia đình của chính họ để theo dõi bệnh nhân ngoại trú.

Bài báo nêu rõ *:

'Vượt xa hơn chẩn đoán trầm cảm của máy trong điện toán tình cảm, đã được phát triển trong trước nghiên cứu, chúng tôi chỉ ra rằng trạng thái cảm xúc có thể đo lường được ước tính bằng phương tiện thị giác máy tính chứa nhiều thông tin hơn so với phân loại thuần túy.'

Các nhà nghiên cứu đã đặt tên cho kỹ thuật này Điện não đồ Opto (OEG), một phương pháp suy đoán trạng thái tinh thần hoàn toàn thụ động bằng cách phân tích hình ảnh khuôn mặt thay vì các cảm biến tại chỗ hoặc công nghệ hình ảnh y tế dựa trên tia.

Các tác giả kết luận rằng OEG có khả năng không chỉ là một công cụ hỗ trợ thứ cấp đơn thuần cho chẩn đoán và điều trị, mà về lâu dài còn là một sự thay thế tiềm năng cho một số phần đánh giá nhất định của quy trình điều trị và có thể cắt giảm thời gian cần thiết cho bệnh nhân. theo dõi và chẩn đoán ban đầu. Họ lưu ý:

'Nhìn chung, kết quả do máy dự đoán cho thấy mối tương quan tốt hơn so với bảng câu hỏi dựa trên đánh giá của người quan sát lâm sàng thuần túy và cũng mang tính khách quan. Thời gian đo lường tương đối ngắn trong vài phút đối với các phương pháp thị giác máy tính cũng rất đáng chú ý, trong khi đôi khi cần hàng giờ cho các cuộc phỏng vấn lâm sàng.'

Tuy nhiên, các tác giả rất muốn nhấn mạnh rằng chăm sóc bệnh nhân trong lĩnh vực này là một hoạt động theo đuổi đa phương thức, với nhiều chỉ số khác về trạng thái bệnh nhân cần được xem xét ngoài biểu hiện trên khuôn mặt của họ và còn quá sớm để cho rằng một hệ thống như vậy có thể thay thế hoàn toàn các cách tiếp cận truyền thống đối với rối loạn tâm thần. Tuy nhiên, họ coi OEG là một công nghệ bổ sung đầy hứa hẹn, đặc biệt là một phương pháp để phân loại hiệu quả của việc điều trị bằng dược phẩm trong chế độ kê đơn của bệnh nhân.

Sản phẩm giấy có tiêu đề Bộ mặt của rối loạn cảm xúc, và đến từ tám nhà nghiên cứu trên nhiều tổ chức từ lĩnh vực nghiên cứu y tế tư nhân và công cộng.

Ngày

(Bài báo mới chủ yếu đề cập đến các lý thuyết và phương pháp khác nhau hiện đang phổ biến trong chẩn đoán bệnh nhân rối loạn tâm thần, ít chú ý hơn bình thường đến các công nghệ và quy trình thực tế được sử dụng trong các xét nghiệm và các thí nghiệm khác nhau)

Việc thu thập dữ liệu diễn ra tại Bệnh viện Đại học ở Aachen, với 100 bệnh nhân cân bằng giới tính và một nhóm kiểm soát gồm 50 người không bị ảnh hưởng. Các bệnh nhân bao gồm 35 người mắc bệnh tâm thần phân liệt và 65 người mắc bệnh trầm cảm.

Đối với phần bệnh nhân của nhóm thử nghiệm, các phép đo ban đầu được thực hiện tại thời điểm nhập viện đầu tiên và lần thứ hai trước khi họ xuất viện, kéo dài trong khoảng thời gian trung bình là 12 tuần. Những người tham gia nhóm kiểm soát được tuyển dụng tùy ý từ người dân địa phương, với cảm ứng và 'xuất viện' của riêng họ phản ánh cảm ứng của bệnh nhân thực tế.

Trên thực tế, 'sự thật cơ bản' quan trọng nhất đối với một thử nghiệm như vậy phải là các chẩn đoán thu được bằng các phương pháp tiêu chuẩn và đã được phê duyệt, và đây là trường hợp của các thử nghiệm OEG.

Tuy nhiên, giai đoạn thu thập dữ liệu thu được dữ liệu bổ sung phù hợp hơn cho việc diễn giải máy: các cuộc phỏng vấn kéo dài trung bình 90 phút được ghi lại trong ba giai đoạn bằng webcam dành cho người tiêu dùng Logitech c270 chạy ở tốc độ 25 khung hình/giây.

Phiên đầu tiên bao gồm một tiêu chuẩn cuộc phỏng vấn Hamilton (dựa trên nghiên cứu nguồn gốc khoảng năm 1960), chẳng hạn như thông thường sẽ được đưa ra khi nhập học. Trong giai đoạn thứ hai, một cách bất thường, các bệnh nhân (và các đối tác của họ trong nhóm kiểm soát) đã được hiển thị video một loạt biểu cảm trên khuôn mặt và được yêu cầu bắt chước từng biểu cảm này, đồng thời nêu ước tính của riêng họ về tình trạng tinh thần của họ tại thời điểm đó, bao gồm cả trạng thái và cường độ cảm xúc. Giai đoạn này kéo dài khoảng mười phút.

Trong giai đoạn thứ ba và cũng là giai đoạn cuối cùng, những người tham gia được xem 96 video của các diễn viên, mỗi video chỉ kéo dài hơn 15 giây, dường như kể lại những trải nghiệm cảm xúc mãnh liệt. Sau đó, những người tham gia được yêu cầu đánh giá cảm xúc và cường độ thể hiện trong video, cũng như cảm xúc tương ứng của chính họ. Giai đoạn này kéo dài khoảng XNUMX phút.

Phương pháp

Để đạt được mức trung bình trung bình của các khuôn mặt được chụp (xem hình ảnh đầu tiên ở trên), các mốc cảm xúc đã được ghi lại bằng EmoNet khuôn khổ. Sau đó, sự tương ứng giữa hình dạng khuôn mặt và hình dạng khuôn mặt trung bình (trung bình) được xác định thông qua phép biến đổi affine từng phần.

Nhận dạng cảm xúc theo chiều và dự đoán ánh mắt được thực hiện trên từng phân đoạn mốc được xác định trong giai đoạn trước.

Tại thời điểm này, suy luận cảm xúc dựa trên âm thanh đã chỉ ra rằng một thời điểm có thể dạy được đã đến trong trạng thái tinh thần của bệnh nhân và nhiệm vụ là chụp ảnh khuôn mặt tương ứng và phát triển chiều và miền trạng thái cảm xúc của họ.

Tự động phân tích cảm xúc từ khuôn mặt trong tự nhiên

Automatic emotion analysis from faces in-the-wild

Watch this video on YouTube

(Trong video ở trên, chúng ta thấy tác phẩm được phát triển bởi các tác giả của các công nghệ nhận dạng cảm xúc chiều được các nhà nghiên cứu sử dụng cho tác phẩm mới).

Hình dạng trắc địa của vật liệu được tính toán cho từng khung dữ liệu và Phân tách giá trị số ít (SVD) áp dụng giảm. Dữ liệu chuỗi thời gian kết quả cuối cùng đã được mô hình hóa thành một VAR quá trình, và sau đó giảm thêm thông qua SVD trước khi thích ứng MAP.

Quy trình làm việc cho quá trình giảm trắc địa.

Các giá trị hóa trị và kích thích trong mạng EmoNet cũng được xử lý tương tự với mô hình VAR và tính toán nhân trình tự.

Thí nghiệm

Như đã giải thích trước đó, công trình mới chủ yếu là một bài báo nghiên cứu y học chứ không phải là một bài nộp thị giác máy tính tiêu chuẩn và chúng tôi giới thiệu người đọc đến chính bài báo để biết chi tiết về các thí nghiệm OEG đa dạng do các nhà nghiên cứu thực hiện.

Tuy nhiên, để tóm tắt một lựa chọn của họ:

Dấu hiệu rối loạn cảm xúc

Tại đây, 40 người tham gia (không thuộc nhóm kiểm soát hoặc bệnh nhân) được yêu cầu xếp hạng các khuôn mặt trung bình được đánh giá (xem ở trên) đối với một số câu hỏi mà không được thông báo về ngữ cảnh của dữ liệu. Các câu hỏi là:

Giới tính của hai khuôn mặt là gì?
Khuôn mặt có ngoại hình hấp dẫn không?
Những khuôn mặt này có phải là những người đáng tin cậy không?
Bạn đánh giá thế nào về khả năng hành động của những người này?
Cảm xúc của hai khuôn mặt là gì?
Hình dạng da của hai khuôn mặt là gì?
Ấn tượng của cái nhìn là gì?
Hai mặt có xệ khóe miệng không?
Làm hai khuôn mặt có nâng mắt nâu?
Những người này có phải là bệnh nhân lâm sàng không?

Các nhà nghiên cứu phát hiện ra rằng những đánh giá mù quáng này tương quan với trạng thái đã đăng ký của dữ liệu được xử lý:

Kết quả biểu đồ hộp cho cuộc khảo sát 'khuôn mặt bình thường'.

Đánh giá lâm sàng

Để đánh giá tiện ích của OEG trong đánh giá ban đầu, trước tiên, các nhà nghiên cứu đã đánh giá mức độ hiệu quả của đánh giá lâm sàng tiêu chuẩn, đo lường mức độ cải thiện giữa giai đoạn khởi phát và giai đoạn thứ hai (vào thời điểm đó bệnh nhân thường được điều trị bằng thuốc).

Các nhà nghiên cứu kết luận rằng tình trạng và mức độ nghiêm trọng của triệu chứng có thể được đánh giá tốt bằng phương pháp này, đạt được mối tương quan là 0.82. Tuy nhiên, chẩn đoán chính xác tâm thần phân liệt hoặc trầm cảm tỏ ra khó khăn hơn, với phương pháp tiêu chuẩn chỉ đạt được điểm -0.03 ở giai đoạn đầu này.

Các tác giả nhận xét:

'Về bản chất, tình trạng bệnh nhân có thể được xác định tương đối tốt bằng cách sử dụng các bảng câu hỏi thông thường. Tuy nhiên, về cơ bản đó là tất cả những gì có thể được kết luận từ nó. Cho dù ai đó bị trầm cảm hay đúng hơn là tâm thần phân liệt không được chỉ định. Điều tương tự cũng áp dụng cho phản ứng điều trị.'

Kết quả từ quy trình máy có thể đạt được điểm số cao hơn trong lĩnh vực vấn đề này và điểm số tương đương cho khía cạnh đánh giá bệnh nhân ban đầu:

Số cao hơn là tốt hơn. Ở bên trái, kết quả đánh giá độ chính xác dựa trên phỏng vấn tiêu chuẩn qua bốn giai đoạn của kiến trúc thử nghiệm; ở bên phải, kết quả dựa trên máy.

Chẩn đoán rối loạn

Phân biệt trầm cảm với tâm thần phân liệt thông qua hình ảnh khuôn mặt tĩnh không phải là vấn đề nhỏ. Được xác thực chéo, quy trình máy có thể đạt được điểm số chính xác cao qua các giai đoạn thử nghiệm khác nhau:

Trong các thí nghiệm khác, các nhà nghiên cứu đã có thể chứng minh bằng chứng rằng OEG có thể cảm nhận được sự cải thiện của bệnh nhân thông qua điều trị bằng thuốc và điều trị rối loạn nói chung:

'Suy luận nhân quả đối với kiến thức thực nghiệm trước đó về việc thu thập dữ liệu đã điều chỉnh phương pháp điều trị dược lý để quan sát sự quay trở lại quy định sinh lý của động lực học trên khuôn mặt. Sự trở lại như vậy không thể được quan sát thấy trong quá trình kê đơn lâm sàng.

'Hiện tại vẫn chưa rõ liệu một khuyến nghị dựa trên máy móc như vậy có thực sự dẫn đến thành công trị liệu tốt hơn đáng kể hay không. Đặc biệt là vì người ta đã biết những tác dụng phụ mà thuốc có thể gây ra trong một thời gian dài.

'Tuy nhiên, [những loại] phương pháp phù hợp với bệnh nhân này sẽ phá vỡ các rào cản của sơ đồ phân loại phân loại phổ biến vẫn được sử dụng chủ yếu trong cuộc sống hàng ngày.'

* Việc tôi chuyển đổi các trích dẫn nội tuyến của tác giả thành các siêu liên kết.

Xuất bản lần đầu vào ngày 3 tháng 2022 năm XNUMX.