हेल्थकेयर

कार्यस्थल पर चेहरे के विश्लेषण के माध्यम से कर्मचारी तनाव को पहचानना

प्रकाशित

2 साल पहले

नवम्बर 24/2021

के संदर्भ में बदलती संस्कृति ज़ूम-मीटिंग शिष्टाचार के आसपास, और का उद्भव ज़ूम की थकानकैम्ब्रिज के शोधकर्ताओं ने एक अध्ययन जारी किया है जो काम पर हमारे चेहरे के भावों के एआई-सक्षम वेबकैम कवरेज के माध्यम से हमारे तनाव के स्तर को निर्धारित करने के लिए मशीन लर्निंग का उपयोग करता है।

बाईं ओर, डेटा-एकत्रित करने वाला वातावरण, कई निगरानी उपकरणों के साथ या तो एक स्वयंसेवक को प्रशिक्षित किया गया है या उससे जुड़ा हुआ है; दाईं ओर, कार्य की कठिनाई के विभिन्न स्तरों पर परीक्षण विषयों द्वारा उत्पन्न चेहरे के भावों का उदाहरण दिया गया है। स्रोत: https://arxiv.org/pdf/2111.11862.pdf

शोध का उद्देश्य प्रभाव विश्लेषण करना है (अर्थात्, भावना मान्यता) 'परिवेश सहायक जीवन' प्रणालियों में, और संभवतः ऐसी प्रणालियों में वीडियो-आधारित एआई चेहरे की अभिव्यक्ति निगरानी ढांचे को सक्षम करने के लिए डिज़ाइन किया गया है; हालाँकि पेपर इस पहलू पर विस्तार नहीं करता है, लेकिन शोध प्रयास का किसी अन्य संदर्भ में कोई मतलब नहीं है।

परियोजना का विशिष्ट दायरा चेहरे के भाव पैटर्न को सीखना है कामकाजी माहौल में - दूरस्थ कार्य व्यवस्था सहित - यात्रा जैसी 'अवकाश' या 'निष्क्रिय' स्थितियों के बजाय।

कार्यस्थल में चेहरे पर आधारित भावनाओं की पहचान

हालाँकि 'एम्बिएंट असिस्टिव लिविंग' बुजुर्गों की देखभाल के लिए एक योजना की तरह लग सकता है, लेकिन यह मामले से बहुत दूर है। इच्छित 'अंतिम उपयोगकर्ताओं' के बारे में बोलते हुए, लेखक कहते हैं*:

'परिवेश सहायक रहने वाले वातावरण के लिए बनाई गई प्रणालियाँ [†] इसका लक्ष्य स्वचालित प्रभाव विश्लेषण और प्रतिक्रिया दोनों करने में सक्षम होना है। परिवेशीय सहायक जीवन व्यक्ति के दैनिक जीवन और कामकाजी माहौल में सहायता करने के लिए सूचना और संचार प्रौद्योगिकी (आईसीटी) के उपयोग पर निर्भर करता है ताकि उन्हें लंबे समय तक स्वस्थ और सक्रिय रखा जा सके, और उन्हें उम्र बढ़ने के साथ स्वतंत्र रूप से जीने में सक्षम बनाया जा सके। इस प्रकार, परिवेश सहायक जीवन का उद्देश्य स्वास्थ्य कर्मियों, नर्सों, डॉक्टरों, कारखाने के श्रमिकों, ड्राइवरों, पायलटों, शिक्षकों के साथ-साथ विभिन्न उद्योगों को संवेदन, मूल्यांकन और हस्तक्षेप के माध्यम से सुविधा प्रदान करना है।.

'इस प्रणाली का उद्देश्य शारीरिक, भावनात्मक और मानसिक तनाव को निर्धारित करना और जरूरत पड़ने पर प्रतिक्रिया देना और अनुकूलन करना है, उदाहरण के लिए, उनींदापन का पता लगाने वाली प्रणाली से लैस कार ड्राइवर को सावधान रहने के लिए सूचित कर सकती है और उन्हें थोड़ा ब्रेक लेने का सुझाव दे सकती है। दुर्घटनाओं से बचने के लिए [††].'

RSI काग़ज़ शीर्षक है कार्य-जैसी सेटिंग्स में उपयोगकर्ता के चेहरे के प्रभाव का अनुमान लगाना, और कैंब्रिज में अफेक्टिव इंटेलिजेंस एंड रोबोटिक्स लैब के तीन शोधकर्ताओं से आता है।

परीक्षण की स्थितियाँ

जबसे काम से पहले यह क्षेत्र काफी हद तक इंटरनेट से निकाली गई छवियों के तदर्थ संग्रह पर निर्भर है, कैम्ब्रिज शोधकर्ताओं ने 12 कैंपस स्वयंसेवकों, 5 पुरुष और 7 महिलाओं के साथ स्थानीय डेटा-एकत्रीकरण प्रयोग किए। स्वयंसेवक नौ देशों से आए थे और उनकी उम्र 22-41 वर्ष थी।

इस परियोजना का लक्ष्य तीन संभावित तनावपूर्ण कामकाजी माहौल को फिर से बनाना है: एक कार्यालय; एक फ़ैक्टरी उत्पादन लाइन; और एक टेलीकांफ्रेंस कॉल - जैसे कि ज़ूम समूह चैट जो बन गई है बारंबार विशेषता महामारी के आगमन के बाद से गृहकार्य की।

विषयों की निगरानी विभिन्न माध्यमों से की गई, जिनमें तीन कैमरे, एक जबरा गर्दन पर पहना जाने वाला माइक्रोफोन, और शामिल हैं एम्पैटिका रिस्टबैंड (एक वायरलेस मल्टी-सेंसर पहनने योग्य जो वास्तविक समय बायोफीडबैक प्रदान करता है), और एक म्यूज़ 2 हेडबैंड सेंसर (जो बायोफीडबैक भी प्रदान करता है)। इसके अतिरिक्त, स्वयंसेवकों को सर्वेक्षण पूरा करने और समय-समय पर अपने मूड का स्व-मूल्यांकन करने के लिए कहा गया।

हालाँकि, इसका मतलब यह नहीं है कि भविष्य में एम्बिएंट असिस्टिव लिविंग रिग्स आपको उस हद तक 'प्लग इन' करने जा रहे हैं (यदि केवल लागत कारणों से); लिखित स्व-मूल्यांकन सहित डेटा-एकत्रीकरण में उपयोग किए जाने वाले सभी गैर-कैमरा निगरानी उपकरण और तरीकों का उद्देश्य कैमरा फुटेज द्वारा सक्षम चेहरे-आधारित प्रभाव पहचान प्रणालियों को सत्यापित करना है।

दबाव बढ़ाना: कार्यालय परिदृश्य

तीन में से पहले दो परिदृश्यों ('ऑफिस' और 'फ़ैक्टरी') में, स्वयंसेवकों को आसान गति से शुरुआत की गई, चार चरणों में दबाव धीरे-धीरे बढ़ता गया, प्रत्येक के लिए अलग-अलग प्रकार के कार्य थे।

प्रेरित तनाव के उच्चतम स्तर पर, स्वयंसेवकों को किसी के कंधे की ओर देखने के 'सफेद कोट प्रभाव' के साथ-साथ 85db अतिरिक्त शोर का भी सामना करना पड़ा, जो कि काफी है पाँच डेसीबल नीचे अमेरिका में कार्यालय के माहौल के लिए कानूनी सीमा, और राष्ट्रीय व्यावसायिक सुरक्षा और स्वास्थ्य संस्थान (एनआईओएसएच) द्वारा निर्दिष्ट सटीक अधिकतम सीमा।

कार्यालय जैसे डेटा-एकत्रीकरण चरण में, विषयों को पिछले अक्षरों को याद रखने का काम सौंपा गया था जो उनकी स्क्रीन पर चमकते थे, कठिनाई के बढ़ते स्तर के साथ (जैसे कि दो स्क्रीन पहले हुए दो-अक्षर अनुक्रम को याद रखना)।

फ़ैक्टरी परिदृश्य

शारीरिक श्रम के माहौल का अनुकरण करने के लिए, विषयों को खेल खेलने के लिए कहा गया आपरेशन, जो खिलाड़ी को किनारों को छुए बिना संकीर्ण, धातु-रिम वाले एपर्चर के माध्यम से बोर्ड से छोटी वस्तुओं को निकालने की आवश्यकता करके उपयोगकर्ता की निपुणता को चुनौती देता है, जो घटना एक 'विफलता' बजर को ट्रिगर करती है।

सर्जन ऑपरेशन खेलते हैं

Watch this video on YouTube

जब तक सबसे कठिन चरण आया, स्वयंसेवक को एक मिनट के भीतर बिना किसी त्रुटि के सभी 12 वस्तुओं को निकालने की चुनौती दी गई। संदर्भ के लिए, इस कार्य के लिए 2019 में यूके में बनाया गया विश्व रिकॉर्ड, 12.68 सेकंड पर है.

टेलीकांफ्रेंसिंग परिदृश्य

अंत में, होमवर्किंग/टेलीकांफ्रेंस परीक्षण में, स्वयंसेवकों को एक प्रयोगकर्ता द्वारा एमएस टीम्स कॉल पर अपनी सकारात्मक और नकारात्मक यादों को याद करने के लिए कहा गया। इस परिदृश्य के सबसे तनावपूर्ण चरण के लिए, स्वयंसेवक को अपने हाल के अतीत की एक बहुत ही नकारात्मक या दुखद स्मृति को याद करने की आवश्यकता थी।

विभिन्न कार्यों और परिदृश्यों को यादृच्छिक क्रम में निष्पादित किया गया, और वर्किंग-एनवायरनमेंट-कॉन्टेक्स्ट-अवेयर डेटासेट (WECARE-DB) नामक एक कस्टम डेटासेट में संकलित किया गया।

विधि एवं प्रशिक्षण

उपयोगकर्ताओं की मनोदशा के आत्म-मूल्यांकन के परिणामों को जमीनी सच्चाई के रूप में उपयोग किया गया, और वैधता और उत्तेजना आयामों के लिए मैप किया गया। प्रयोगों के कैप्चर किए गए वीडियो को फेशियल लैंडमार्क डिटेक्शन के माध्यम से चलाया गया नेटवर्क, और संरेखित छवियाँ a को खिलाई गईं रेसनेट-18 नेटवर्क पर प्रशिक्षित किया गया इफ़ेक्टनेट डाटासेट।

पेपर के अनुसार, भावना-संबंधी प्रश्नों का उपयोग करके इंटरनेट से खींची/लेबल की गई एफ़ेक्टनेट की 450,000 छवियों को मैन्युअल रूप से एनोटेट किया गया था, वैलेंस और उत्तेजना आयामों के साथ।

इसके बाद, शोधकर्ताओं ने पूरी तरह से अपने स्वयं के WECARE डेटासेट के आधार पर नेटवर्क को परिष्कृत किया वर्णक्रमीय प्रतिनिधित्व एन्कोडिंग फ़्रेम-आधारित भविष्यवाणियों को सारांशित करने के लिए उपयोग किया गया था।

परिणाम

मॉडल के प्रदर्शन का मूल्यांकन आमतौर पर स्वचालित प्रभाव भविष्यवाणी से जुड़े तीन मैट्रिक्स पर किया गया था: कॉनकॉर्डेंस गुणांक सहसंबंध; पियर्सन गुणांक सहसंबंध; और मूल माध्य वर्ग त्रुटि (आरएमएसई)।

लेखकों ने ध्यान दिया कि मॉडल ने अपने स्वयं के WECARE डेटासेट पर बेहतर प्रदर्शन किया, ResNet-18 से बेहतर प्रदर्शन किया, और इससे यह निष्कर्ष निकाला कि जिस तरह से हम अपने चेहरे के भावों को नियंत्रित करते हैं, वह काम के माहौल में उन अधिक अमूर्त संदर्भों की तुलना में बहुत अलग है, जिनसे पूर्व अध्ययन प्राप्त हुए हैं। इंटरनेट से स्रोत सामग्री.

वे कहते हैं:

'तालिका को देखने पर हम पाते हैं कि WECARE-DB पर ठीक-ठीक मॉडल ने [AffectNet] पर पूर्व-प्रशिक्षित ResNet-18 मॉडल से बेहतर प्रदर्शन किया है, जो दर्शाता है कि कार्य-सदृश वातावरण में प्रदर्शित चेहरे का व्यवहार अंदर की तुलना में भिन्न होता है। -वाइल्ड इंटरनेट सेटिंग्स का उपयोग एफेक्टनेट डीबी में किया जाता है। इस प्रकार, काम जैसी सेटिंग में चेहरे के प्रभाव को पहचानने के लिए डेटासेट प्राप्त करना और मॉडल को प्रशिक्षित करना आवश्यक है।'

जहां तक काम के दौरान पहचान को प्रभावित करने के भविष्य का सवाल है, जो कर्मचारियों के लिए प्रशिक्षित कैमरों के नेटवर्क द्वारा सक्षम है, और लगातार उनकी भावनात्मक स्थिति की भविष्यवाणी करता है, लेखक निष्कर्ष निकालते हैं*:

'अंतिम लक्ष्य कार्यशील उम्र के दौरान लोगों के स्वास्थ्य और कल्याण को बढ़ावा देने के लिए निर्णय समर्थन प्रणालियों में इनपुट प्रदान करने के लिए वास्तविक समय और वास्तविक कार्य सेटिंग्स में प्रशिक्षित मॉडलों को लागू करना और उपयोग करना है। ईयू वर्किंग एज प्रोजेक्ट.'

* मेरा जोर.

† यहां लेखक तीन उद्धरण देते हैं:

स्वचालित, आयामी और सतत भावना पहचान – https://ibug.doc.ic.ac.uk/media/uploads/documents/GunesPantic_IJSE_2010_camera.pdf
परिवेश सहायता प्राप्त जीवन डोमेन की खोज: एक व्यवस्थित समीक्षा – https://link.springer.com/article/10.1007/s12652-016-0374-3
परिवेशीय सहायता प्राप्त जीवन परिवेश के लिए इंटरनेट ऑफ थिंग्स प्रौद्योगिकियों की समीक्षा – https://mdpi-res.com/d_attachment/futureinternet/futureinternet-11-00259/article_deploy/futureinternet-11-00259-v2.pdf

†† यहां लेखक दो उद्धरण देते हैं:

डीप न्यूरल नेटवर्क के मॉडल संपीड़न का उपयोग करके एंबेडेड सिस्टम के लिए वास्तविक समय में ड्राइवर की तंद्रा का पता लगाना – https://openaccess.thecvf.com/content_cvpr_2017_workshops/w4/papers/Reddy_Real-Time_Driver_Drowsiness_CVPR_2017_paper.pdf
चेहरे की विशेषताओं का उपयोग करके वास्तविक समय ड्राइवर-उनींदापन का पता लगाने वाली प्रणाली – https://www.semanticscholar.org/paper/Real-Time-Driver-Drowsiness-Detection-System-Using-Deng-Wu/1f4b0094c9e70bf7aa287234e0fdb4c764a5c532