Connect with us

Y tế

Chẩn đoán Rối loạn Sức khỏe Tâm thần thông qua Đánh giá Biểu cảm Mặt bằng Trí tuệ Nhân tạo

mm

Các nhà nghiên cứu từ Đức đã phát triển một phương pháp để xác định các rối loạn tâm thần dựa trên biểu cảm khuôn mặt được giải thích bởi thị giác máy tính.

Phương pháp mới này không chỉ có thể phân biệt giữa các đối tượng không bị ảnh hưởng và bị ảnh hưởng, mà còn có thể phân biệt chính xác giữa trầm cảm và tâm thần phân liệt, cũng như mức độ mà bệnh nhân hiện đang bị ảnh hưởng bởi bệnh.

Các nhà nghiên cứu đã cung cấp một hình ảnh tổng hợp đại diện cho nhóm kiểm soát trong các thử nghiệm của họ (bên trái trong hình dưới) và các bệnh nhân đang mắc các rối loạn tâm thần (bên phải). Các bản dạng của nhiều người được trộn lẫn trong các biểu diễn, và không có hình ảnh nào mô tả một cá nhân cụ thể:

Source: https://arxiv.org/pdf/2208.01369.pdf

Source: https://arxiv.org/pdf/2208.01369.pdf

Các cá nhân bị rối loạn cảm xúc có xu hướng có lông mày nâng lên, ánh mắt nặng nề, khuôn mặt sưng và biểu cảm miệng u sầu. Để bảo vệ quyền riêng tư của bệnh nhân, những hình ảnh tổng hợp này là những hình ảnh duy nhất được cung cấp để hỗ trợ công việc mới.

Cho đến nay, nhận dạng cảm xúc khuôn mặt đã được sử dụng chủ yếu như một công cụ chẩn đoán cơ bản. Phương pháp mới, thay vào đó, cung cấp một phương pháp có thể đánh giá tiến trình của bệnh nhân trong quá trình điều trị, hoặc có thể (nhưng giấy tờ không đề xuất) trong môi trường gia đình của họ để theo dõi ngoại trú.

Tài liệu cho biết*:

‘Đi vượt quá chẩn đoán máy của trầm cảm trong tính toán cảm xúc, đã được phát triển trong trước nghiên cứu, chúng tôi cho thấy rằng trạng thái cảm xúc có thể đo lường được ước tính bằng cách sử dụng thị giác máy tính chứa nhiều thông tin hơn so với phân loại danh mục thuần túy.’

Các nhà nghiên cứu đã đặt tên cho kỹ thuật này là Điện tử Quang học Não (OEG), một phương pháp hoàn toàn thụ động để suy luận trạng thái tâm thần bằng phân tích hình ảnh khuôn mặt thay vì cảm biến tại chỗ hoặc công nghệ hình ảnh y tế dựa trên tia.

Các tác giả kết luận rằng OEG có thể không chỉ là một công cụ hỗ trợ thứ yếu cho chẩn đoán và điều trị, mà còn có thể là một công cụ thay thế cho một số phần đánh giá của quy trình điều trị, và một công cụ có thể giảm thời gian cần thiết cho việc theo dõi và chẩn đoán ban đầu của bệnh nhân. Họ lưu ý:

‘Tổng thể, kết quả dự đoán bởi máy cho thấy sự tương quan tốt hơn so với đánh giá thuần túy dựa trên bảng câu hỏi của người quan sát lâm sàng và cũng là khách quan. Thời gian đo lường tương đối ngắn của vài phút cho các phương pháp thị giác máy tính cũng đáng chú ý, trong khi đôi khi cần vài giờ để thực hiện các cuộc phỏng vấn lâm sàng.’

Tuy nhiên, các tác giả muốn nhấn mạnh rằng chăm sóc bệnh nhân trong lĩnh vực này là một quá trình đa phương thức, với nhiều chỉ số khác về trạng thái bệnh nhân cần được xem xét hơn là chỉ biểu cảm khuôn mặt, và rằng vẫn còn quá sớm để xem xét rằng một hệ thống như vậy có thể thay thế hoàn toàn các phương pháp truyền thống để chẩn đoán rối loạn tâm thần. Tuy nhiên, họ coi OEG là một công nghệ hỗ trợ đầy hứa hẹn, đặc biệt là như một phương pháp để đánh giá hiệu quả của điều trị dược phẩm trong chế độ điều trị của bệnh nhân.

Tài liệu này có tiêu đề Khuôn mặt của Rối loạn Cảm xúc, và đến từ tám nhà nghiên cứu từ một loạt các cơ quan thuộc lĩnh vực nghiên cứu y tế tư nhân và công.

Dữ liệu

(Tài liệu mới này chủ yếu liên quan đến các lý thuyết và phương pháp hiện đang phổ biến trong chẩn đoán bệnh nhân rối loạn tâm thần, với ít chú ý hơn đến các công nghệ và quy trình thực tế được sử dụng trong các thử nghiệm và thí nghiệm)

Quá trình thu thập dữ liệu diễn ra tại Bệnh viện Đại học Aachen, với 100 bệnh nhân cân bằng giới tính và một nhóm kiểm soát gồm 50 người không bị ảnh hưởng. Các bệnh nhân bao gồm 35 người mắc tâm thần phân liệt và 65 người mắc trầm cảm.

Đối với phần bệnh nhân của nhóm thử nghiệm, các phép đo ban đầu được thực hiện tại thời điểm nhập viện đầu tiên, và phép đo thứ hai trước khi họ được xuất viện, với khoảng thời gian trung bình là 12 tuần. Các tham gia nhóm kiểm soát được tuyển dụng một cách tùy ý từ dân số địa phương, với quá trình nhập viện và “xuất viện” của họ phản ánh những của bệnh nhân thực sự.

Trên thực tế, “điểm chuẩn” quan trọng nhất cho một thí nghiệm như vậy phải là chẩn đoán được thu thập bằng các phương pháp chuẩn và tiêu chuẩn, và đó là trường hợp của các thử nghiệm OEG.

Tuy nhiên, giai đoạn thu thập dữ liệu đã thu được thêm dữ liệu phù hợp hơn cho việc giải thích máy: các cuộc phỏng vấn trung bình 90 phút được ghi lại trong ba giai đoạn với một webcam Logitech c270 tiêu dùng chạy tại 25fps.

Giai đoạn đầu tiên bao gồm một cuộc phỏng vấn tiêu chuẩn Hamilton (dựa trên nghiên cứu có nguồn gốc từ năm 1960), như thường được thực hiện khi nhập viện. Trong giai đoạn thứ hai, không thường xuyên, các bệnh nhân (và các đối tác của họ trong nhóm kiểm soát) được hiển thị các video về một loạt biểu cảm khuôn mặt, và được yêu cầu bắt chước từng biểu cảm này, trong khi tuyên bố đánh giá của họ về tình trạng tâm lý của họ tại thời điểm đó, bao gồm cả trạng thái cảm xúc và cường độ. Giai đoạn này kéo dài khoảng mười phút.

Trong giai đoạn thứ ba và cuối cùng, các tham gia được hiển thị 96 video của các diễn viên, kéo dài vừa hơn mười giây mỗi video, dường như đang kể lại các trải nghiệm cảm xúc mãnh liệt. Các tham gia sau đó được yêu cầu đánh giá cảm xúc và cường độ được thể hiện trong các video, cũng như cảm xúc của họ. Giai đoạn này kéo dài khoảng 15 phút.

Phương pháp

Để đạt được giá trị trung bình của các khuôn mặt được chụp (xem hình đầu tiên ở trên), các điểm mốc cảm xúc được chụp bằng khuôn khổ EmoNet. Sau đó, sự tương ứng giữa hình dạng khuôn mặt và hình dạng khuôn mặt trung bình (trung bình) được xác định thông qua biến đổi affine từng phần.

Nhận dạng cảm xúc theo chiều dimensionaldự đoán ánh mắt được thực hiện trên mỗi đoạn điểm mốc được xác định trong giai đoạn trước.

Tại thời điểm này, suy luận cảm xúc dựa trên âm thanh đã chỉ ra rằng một khoảnh khắc có thể dạy được đã đến trong trạng thái tâm lý của bệnh nhân, và nhiệm vụ là chụp hình ảnh khuôn mặt tương ứng và phát triển chiều và lĩnh vực của trạng thái cảm xúc của họ.

(Trong video trên, chúng ta thấy công việc được phát triển bởi các tác giả của công nghệ nhận dạng cảm xúc theo chiều được các nhà nghiên cứu sử dụng cho công việc mới).

Độ cong hình học của vật liệu được tính toán cho mỗi khung hình của dữ liệu, và giảm chiều SVD được áp dụng. Dữ liệu chuỗi thời gian kết quả cuối cùng được mô hình hóa như một VAR quá trình, và sau đó giảm thêm qua SVD trước khi MAP thích nghi.

Quy trình giảm độ cong hình học.

Quy trình giảm độ cong hình học.

Các giá trị valence và arousal trong mạng EmoNet cũng được xử lý tương tự với mô hình VAR và tính toán kernel chuỗi.

Thí nghiệm

Như đã giải thích trước đó, công việc mới này chủ yếu là một tài liệu nghiên cứu y tế chứ không phải là một bài nộp tiêu chuẩn về thị giác máy tính, và chúng tôi đề cập người đọc đến tài liệu chính để cócoverage sâu về các thí nghiệm OEG đa dạng được các nhà nghiên cứu thực hiện.

Tuy nhiên, để tóm tắt một số thí nghiệm:

Dấu hiệu Rối loạn Cảm xúc

Ở đây, 40 người tham gia (không từ nhóm kiểm soát hoặc bệnh nhân) được yêu cầu đánh giá các khuôn mặt trung bình được đánh giá (xem ở trên) về một số câu hỏi, mà không được thông báo về bối cảnh của dữ liệu. Các câu hỏi là:

Giới tính của hai khuôn mặt là gì?
Hai khuôn mặt có vẻ ngoài hấp dẫn không?
Hai khuôn mặt có phải là những người đáng tin cậy không?
Bạn đánh giá khả năng hành động của những người này như thế nào?
Cảm xúc của hai khuôn mặt là gì?
Hai khuôn mặt có vẻ ngoài da như thế nào?
Ấn tượng về ánh mắt là gì?
Hai khuôn mặt có góc miệng u sầu không?
Hai khuôn mặt có lông mày nâng lên không?
Hai người này có phải là bệnh nhân lâm sàng không?

Các nhà nghiên cứu đã tìm thấy rằng những đánh giá mù này tương quan với trạng thái đã đăng ký của dữ liệu được xử lý:

Kết quả biểu đồ hộp cho cuộc khảo sát 'khuôn mặt trung bình'.

Kết quả biểu đồ hộp cho cuộc khảo sát ‘khuôn mặt trung bình’.

Đánh giá Lâm sàng

Để đo lường tính hữu dụng của OEG trong đánh giá ban đầu, các nhà nghiên cứu đầu tiên đánh giá hiệu quả của đánh giá lâm sàng chuẩn bằng cách đo lường mức độ cải thiện giữa giai đoạn nhập viện và giai đoạn thứ hai (khi bệnh nhân thường đang nhận điều trị bằng thuốc).

Các nhà nghiên cứu kết luận rằng trạng thái và mức độ nghiêm trọng của triệu chứng có thể được đánh giá tốt bằng phương pháp này, đạt được sự tương quan là 0,82. Tuy nhiên, việc chẩn đoán chính xác về tâm thần phân liệt hoặc trầm cảm chứng tỏ khó khăn hơn, với phương pháp chuẩn chỉ đạt được điểm số là -0,03 ở giai đoạn đầu này.

Các tác giả nhận xét:

‘Về bản chất, trạng thái của bệnh nhân có thể được xác định tương đối tốt bằng cách sử dụng các bảng câu hỏi thông thường. Tuy nhiên, đó基本 là tất cả những gì có thể được kết luận từ nó. Liệu ai đó có bị trầm cảm hay tâm thần phân liệt không được chỉ ra. Điều tương tự cũng áp dụng cho phản hồi điều trị.’

Kết quả từ quá trình máy có thể đạt được điểm số cao hơn trong lĩnh vực này và điểm số tương đương cho khía cạnh đánh giá bệnh nhân ban đầu:

Số cao hơn là tốt hơn. Ở bên trái, kết quả độ chính xác của đánh giá dựa trên phỏng vấn chuẩn trong bốn giai đoạn của kiến trúc thử nghiệm; ở bên phải, kết quả dựa trên máy.

Số cao hơn là tốt hơn. Ở bên trái, kết quả độ chính xác của đánh giá dựa trên phỏng vấn chuẩn trong bốn giai đoạn của kiến trúc thử nghiệm; ở bên phải, kết quả dựa trên máy.

Chẩn đoán Rối loạn

Phân biệt trầm cảm với tâm thần phân liệt thông qua hình ảnh khuôn mặt tĩnh không phải là một vấn đề đơn giản. Với việc xác thực chéo, quá trình máy có thể đạt được điểm số chính xác cao trên các giai đoạn khác nhau của các thử nghiệm:

Trong các thí nghiệm khác, các nhà nghiên cứu đã có thể chứng minh bằng chứng rằng OEG có thể nhận thức được sự cải thiện của bệnh nhân thông qua điều trị dược phẩm, và điều trị chung của rối loạn:

‘Sự suy luận nguyên nhân trên kiến thức trước kinh nghiệm của việc thu thập dữ liệu điều chỉnh điều trị dược phẩm để quan sát sự trở lại điều chỉnh sinh lý của động lực học khuôn mặt. Một sự trở lại như vậy không thể quan sát được trong quá trình kê đơn lâm sàng.

‘Hiện tại, không rõ liệu một khuyến nghị dựa trên máy như vậy có thực sự dẫn đến thành công điều trị tốt hơn đáng kể. Đặc biệt là vì nó được biết rằng các loại thuốc có thể có tác dụng phụ trong thời gian dài.

‘Tuy nhiên, [loại] tiếp cận được tùy chỉnh cho bệnh nhân như vậy sẽ phá vỡ các rào cản của sơ đồ phân loại danh mục thông thường vẫn đang được sử dụng chủ yếu trong cuộc sống hàng ngày.’

 

* Tôi chuyển đổi các trích dẫn nội tuyến của tác giả thành liên kết.

Được xuất bản lần đầu tiên vào ngày 3 tháng 8 năm 2022.

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]