ठूंठ एआई चेहरे की अभिव्यक्ति के मूल्यांकन के माध्यम से मानसिक स्वास्थ्य विकारों का निदान - Unite.AI
हमसे जुडे

हेल्थकेयर

एआई चेहरे की अभिव्यक्ति के मूल्यांकन के माध्यम से मानसिक स्वास्थ्य विकारों का निदान

mm
Updated on

जर्मनी के शोधकर्ताओं ने कंप्यूटर दृष्टि द्वारा व्याख्या किए गए चेहरे के भावों के आधार पर मानसिक विकारों की पहचान करने के लिए एक विधि विकसित की है।

नया दृष्टिकोण न केवल अप्रभावित और प्रभावित विषयों के बीच अंतर कर सकता है, बल्कि सिज़ोफ्रेनिया से अवसाद को भी सही ढंग से अलग कर सकता है, साथ ही रोगी वर्तमान में बीमारी से किस हद तक प्रभावित है।

शोधकर्ताओं ने एक समग्र छवि प्रदान की है जो उनके परीक्षणों के लिए नियंत्रण समूह (नीचे की छवि में बाईं ओर) और मानसिक विकारों से पीड़ित रोगियों (दाएं) का प्रतिनिधित्व करती है। अभ्यावेदन में कई लोगों की पहचान मिश्रित होती है, और कोई भी छवि किसी विशेष व्यक्ति को नहीं दर्शाती है:

स्रोत: https://arxiv.org/pdf/2208.01369.pdf

स्रोत: https://arxiv.org/pdf/2208.01369.pdf

भावात्मक विकार वाले व्यक्तियों की भौहें उभरी हुई, तिरछी निगाहें, सूजे हुए चेहरे और लटके हुए मुँह के भाव होते हैं। रोगी की गोपनीयता की रक्षा के लिए, ये समग्र छवियां ही नए कार्य के समर्थन में उपलब्ध कराई गई हैं।

अब तक, चेहरे पर प्रभाव की पहचान का उपयोग मुख्य रूप से बुनियादी निदान के लिए एक संभावित उपकरण के रूप में किया जाता रहा है। इसके बजाय, नया दृष्टिकोण, उपचार के दौरान रोगी की प्रगति का मूल्यांकन करने के लिए एक संभावित तरीका प्रदान करता है, या फिर (संभवतः, हालांकि पेपर इसका सुझाव नहीं देता है) बाह्य रोगी निगरानी के लिए अपने घरेलू वातावरण में।

पेपर में कहा गया है*:

'भावात्मक कंप्यूटिंग में अवसाद के मशीन निदान से परे जाकर, जिसे विकसित किया गया है पिछला पढ़ाई, हम दिखाते हैं कि कंप्यूटर दृष्टि के माध्यम से अनुमानित मापनीय भावात्मक स्थिति में शुद्ध श्रेणीबद्ध वर्गीकरण की तुलना में कहीं अधिक जानकारी होती है।'

शोधकर्ताओं ने इस तकनीक को नाम दिया है ऑप्टो इलेक्ट्रॉनिक एन्सेफैलोग्राफी (ओईजी), सामयिक सेंसर या किरण-आधारित चिकित्सा इमेजिंग प्रौद्योगिकियों के बजाय चेहरे की छवि विश्लेषण द्वारा मानसिक स्थिति का अनुमान लगाने की एक पूरी तरह से निष्क्रिय विधि।

लेखकों ने निष्कर्ष निकाला है कि ओईजी संभावित रूप से निदान और उपचार के लिए केवल एक माध्यमिक सहायक नहीं हो सकता है, बल्कि लंबी अवधि में, उपचार पाइपलाइन के कुछ मूल्यांकन भागों के लिए एक संभावित प्रतिस्थापन हो सकता है, और जो रोगी के लिए आवश्यक समय में कटौती कर सकता है। निगरानी और प्रारंभिक निदान. वे ध्यान दें:

'कुल मिलाकर, मशीन द्वारा अनुमानित परिणाम शुद्ध नैदानिक ​​​​पर्यवेक्षक रेटिंग आधारित प्रश्नावली की तुलना में बेहतर सहसंबंध दिखाते हैं और वस्तुनिष्ठ भी होते हैं। कंप्यूटर विज़न दृष्टिकोण के लिए कुछ मिनटों की अपेक्षाकृत कम माप अवधि भी उल्लेखनीय है, जबकि नैदानिक ​​​​साक्षात्कार के लिए कभी-कभी घंटों की आवश्यकता होती है।'

हालाँकि, लेखक इस बात पर ज़ोर देना चाहते हैं कि इस क्षेत्र में रोगी की देखभाल एक बहु-मॉडल खोज है, जिसमें केवल उनके चेहरे के भावों के अलावा रोगी की स्थिति के कई अन्य संकेतकों पर भी विचार किया जाना चाहिए, और यह विचार करना जल्दबाजी होगी कि ऐसी प्रणाली हो सकती है मानसिक विकारों के लिए पारंपरिक दृष्टिकोण को पूरी तरह से प्रतिस्थापित करें। फिर भी, वे ओईजी को एक आशाजनक सहायक तकनीक मानते हैं, विशेष रूप से रोगी के निर्धारित शासन में फार्मास्युटिकल उपचार के प्रभावों को वर्गीकृत करने की एक विधि के रूप में।

RSI काग़ज़ शीर्षक है भावात्मक विकारों का चेहरा, और निजी और सार्वजनिक चिकित्सा अनुसंधान क्षेत्र के संस्थानों की एक विस्तृत श्रृंखला के आठ शोधकर्ताओं से आता है।

जानकारी

(नया पेपर ज्यादातर उन विभिन्न सिद्धांतों और तरीकों से संबंधित है जो वर्तमान में मानसिक विकारों के रोगी निदान में लोकप्रिय हैं, परीक्षणों और विभिन्न प्रयोगों में उपयोग की जाने वाली वास्तविक प्रौद्योगिकियों और प्रक्रियाओं पर सामान्य से कम ध्यान दिया गया है)

100 लिंग-संतुलित रोगियों और 50 गैर-प्रभावित लोगों के एक नियंत्रण समूह के साथ, आचेन के विश्वविद्यालय अस्पताल में डेटा-एकत्रीकरण हुआ। मरीजों में सिज़ोफ्रेनिया से पीड़ित 35 और अवसाद से पीड़ित 65 लोग शामिल थे।

परीक्षण समूह के रोगी भाग के लिए, प्रारंभिक माप पहले अस्पताल में भर्ती होने के समय लिया गया था, और दूसरा अस्पताल से छुट्टी देने से पहले, 12 सप्ताह के औसत अंतराल पर लिया गया था। नियंत्रण समूह के प्रतिभागियों को स्थानीय आबादी से मनमाने ढंग से भर्ती किया गया था, उनके स्वयं के प्रेरण और 'डिस्चार्ज' वास्तविक रोगियों को प्रतिबिंबित करते थे।

वास्तव में, ऐसे प्रयोग के लिए सबसे महत्वपूर्ण 'जमीनी सच्चाई' अनुमोदित और मानक तरीकों से प्राप्त निदान होना चाहिए, और ओईजी परीक्षणों के मामले में भी यही था।

हालाँकि, डेटा-एकत्रीकरण चरण ने मशीन व्याख्या के लिए अधिक उपयुक्त अतिरिक्त डेटा प्राप्त किया: 90 मिनट के औसत साक्षात्कार को 270fps पर चलने वाले लॉजिटेक c25 उपभोक्ता वेबकैम के साथ तीन चरणों में कैप्चर किया गया।

पहले सत्र में एक मानक शामिल था हैमिल्टन साक्षात्कार (शोध पर आधारित) उत्पन्न हुई 1960 के आसपास), जैसे कि आम तौर पर प्रवेश पर दिया जाता था। दूसरे चरण में, असामान्य रूप से, रोगियों (और नियंत्रण समूह में उनके समकक्षों) को दिखाया गया वीडियो चेहरे के भावों की एक श्रृंखला, और भावनात्मक स्थिति और तीव्रता सहित उस समय उनकी मानसिक स्थिति का अपना अनुमान बताते हुए, उनमें से प्रत्येक की नकल करने के लिए कहा गया। यह दौर करीब दस मिनट तक चला।

तीसरे और अंतिम चरण में, प्रतिभागियों को अभिनेताओं के 96 वीडियो दिखाए गए, जिनमें से प्रत्येक केवल दस सेकंड से अधिक समय का था, जिसमें स्पष्ट रूप से गहन भावनात्मक अनुभवों का वर्णन किया गया था। फिर प्रतिभागियों को वीडियो में दर्शाई गई भावना और तीव्रता के साथ-साथ उनकी अपनी भावनाओं का मूल्यांकन करने के लिए कहा गया। यह दौर करीब 15 मिनट तक चला.

विधि

कैप्चर किए गए चेहरों के औसत औसत पर पहुंचने के लिए (ऊपर पहली छवि देखें), भावनात्मक स्थलों को कैप्चर किया गया इमोनेट रूपरेखा। इसके बाद, चेहरे के आकार और माध्य (औसत) चेहरे के आकार के बीच पत्राचार निर्धारित किया गया टुकड़े-टुकड़े एफ़िन परिवर्तन.

आयामी भावना पहचान और आँख टकटकी भविष्यवाणी पिछले चरण में पहचाने गए प्रत्येक ऐतिहासिक खंड पर किया गया था।

इस बिंदु पर, ऑडियो-आधारित भावना अनुमान ने संकेत दिया है कि रोगी की मानसिक स्थिति में एक सीखने योग्य क्षण आ गया है, और कार्य संबंधित चेहरे की छवि को पकड़ना और उनकी प्रभावित स्थिति के उस आयाम और डोमेन को विकसित करना है।

जंगली चेहरों से स्वचालित भावना विश्लेषण

(उपरोक्त वीडियो में, हम नए काम के लिए शोधकर्ताओं द्वारा उपयोग की जाने वाली आयामी भावना पहचान प्रौद्योगिकियों के लेखकों द्वारा विकसित कार्य देखते हैं)।

सामग्री के आकार जियोडेसिक की गणना डेटा के प्रत्येक फ्रेम के लिए की गई थी, और एकवचन मूल्य अपघटन (SVD) कमी लागू की गई. परिणामी समय श्रृंखला डेटा को अंततः एक के रूप में मॉडल किया गया था वर प्रक्रिया, और फिर पहले एसवीडी के माध्यम से और कम किया गया मानचित्र अनुकूलन.

जियोडेसिक कटौती प्रक्रिया के लिए वर्कफ़्लो।

जियोडेसिक कटौती प्रक्रिया के लिए वर्कफ़्लो।

EmoNet नेटवर्क में वैलेंस और उत्तेजना मूल्यों को भी VAR मॉडलिंग और अनुक्रम कर्नेल गणना के साथ इसी तरह संसाधित किया गया था।

प्रयोगों

जैसा कि पहले बताया गया है, नया काम मुख्य रूप से एक मानक कंप्यूटर विज़न सबमिशन के बजाय एक मेडिकल शोध पत्र है, और हम शोधकर्ताओं द्वारा चलाए गए विविध ओईजी प्रयोगों की गहन कवरेज के लिए पाठक को पेपर में ही संदर्भित करते हैं।

फिर भी, उनमें से एक चयन को संक्षेप में प्रस्तुत करने के लिए:

भावात्मक विकार संकेत

यहां 40 प्रतिभागियों (नियंत्रण या रोगी समूह से नहीं) को डेटा के संदर्भ के बारे में सूचित किए बिना, कई प्रश्नों के संबंध में मूल्यांकन किए गए औसत चेहरों (ऊपर देखें) को रेट करने के लिए कहा गया था। प्रश्न थे:

दोनों चेहरों का लिंग क्या है?
क्या चेहरे आकर्षक दिखते हैं?
क्या ये चेहरे भरोसेमंद व्यक्ति हैं?
आप इन लोगों की कार्य करने की क्षमता का आकलन कैसे करते हैं?
दोनों चेहरों का भाव क्या है?
दोनों चेहरों की त्वचा का स्वरूप कैसा है?
नज़र का प्रभाव क्या है?
क्या दोनों चेहरों के मुँह के कोने झुके हुए हैं?
क्या दोनों चेहरों पर उभरी हुई भूरी आँखें हैं?
क्या ये व्यक्ति नैदानिक ​​रोगी हैं?

शोधकर्ताओं ने पाया कि ये अंध मूल्यांकन संसाधित डेटा की पंजीकृत स्थिति से संबंधित हैं:

'मीन फेस' सर्वेक्षण के लिए बॉक्स प्लॉट परिणाम।

'मीन फेस' सर्वेक्षण के लिए बॉक्स प्लॉट परिणाम।

नैदानिक ​​मूल्यांकन

प्रारंभिक मूल्यांकन में ओईजी की उपयोगिता का आकलन करने के लिए, शोधकर्ताओं ने पहले मूल्यांकन किया कि मानक नैदानिक ​​​​मूल्यांकन अपने आप में कितना प्रभावी है, प्रेरण और दूसरे चरण के बीच सुधार के स्तर को मापना (जिस समय तक रोगी आमतौर पर दवा-आधारित उपचार प्राप्त कर रहा होता है)।

शोधकर्ताओं ने निष्कर्ष निकाला कि इस पद्धति से स्थिति और लक्षण की गंभीरता का अच्छी तरह से आकलन किया जा सकता है, जिससे 0.82 का सहसंबंध प्राप्त होता है। हालाँकि, सिज़ोफ्रेनिया या अवसाद का सटीक निदान अधिक चुनौतीपूर्ण साबित हुआ, मानक विधि से इस प्रारंभिक चरण में केवल -0.03 का स्कोर प्राप्त हुआ।

लेखक टिप्पणी करते हैं:

'संक्षेप में, सामान्य प्रश्नावली का उपयोग करके रोगी की स्थिति अपेक्षाकृत अच्छी तरह से निर्धारित की जा सकती है। हालाँकि, इससे मूलतः यही निष्कर्ष निकाला जा सकता है। क्या कोई अवसादग्रस्त है या सिज़ोफ्रेनिक है, इसका संकेत नहीं दिया गया है। यही बात उपचार की प्रतिक्रिया पर भी लागू होती है।'

मशीन प्रक्रिया के परिणाम इस समस्या क्षेत्र में उच्च अंक प्राप्त करने में सक्षम थे, और प्रारंभिक रोगी मूल्यांकन पहलू के लिए तुलनीय स्कोर:

अधिक संख्याएँ बेहतर हैं. बाईं ओर, मानक साक्षात्कार-आधारित मूल्यांकन सटीकता परीक्षण वास्तुकला के चार चरणों में परिणाम देती है; दाईं ओर, मशीन-आधारित परिणाम।

अधिक संख्याएँ बेहतर हैं. बाईं ओर, मानक साक्षात्कार-आधारित मूल्यांकन सटीकता परीक्षण वास्तुकला के चार चरणों में परिणाम देती है; दाईं ओर, मशीन-आधारित परिणाम।

विकार निदान

स्थिर चेहरे की छवियों के माध्यम से अवसाद को सिज़ोफ्रेनिया से अलग करना कोई मामूली बात नहीं है। क्रॉस-वैलिडेटेड, मशीन प्रक्रिया परीक्षणों के विभिन्न चरणों में उच्च सटीकता स्कोर प्राप्त करने में सक्षम थी:

अन्य प्रयोगों में, शोधकर्ता सबूत प्रदर्शित करने में सक्षम थे कि ओईजी औषधीय उपचार और विकार के सामान्य उपचार के माध्यम से रोगी के सुधार को समझ सकता है:

'डेटा संग्रह के अनुभवजन्य पूर्व ज्ञान पर कारण अनुमान ने चेहरे की गतिशीलता के शारीरिक विनियमन में वापसी का निरीक्षण करने के लिए औषधीय उपचार को समायोजित किया। क्लिनिकल प्रिस्क्रिप्शन के दौरान ऐसा रिटर्न नहीं देखा जा सका।

'फिलहाल यह स्पष्ट नहीं है कि इस तरह की मशीन आधारित सिफारिश से वास्तव में चिकित्सा में उल्लेखनीय सफलता मिलेगी या नहीं। विशेष रूप से इसलिए क्योंकि यह ज्ञात है कि लंबे समय तक दवाओं के कौन से दुष्प्रभाव हो सकते हैं।

'हालांकि, [इन प्रकार के] रोगी-अनुरूप दृष्टिकोण सामान्य श्रेणीबद्ध वर्गीकरण योजना की बाधाओं को तोड़ देंगे जो अभी भी दैनिक जीवन में प्रमुखता से उपयोग की जाती हैं।'

 

* लेखकों के इनलाइन उद्धरणों का हाइपरलिंक में मेरा रूपांतरण।

पहली बार 3 अगस्त 2022 को प्रकाशित।