ठूंठ कार्यस्थल पर चेहरे के विश्लेषण के माध्यम से कर्मचारी तनाव को पहचानना - Unite.AI
हमसे जुडे

हेल्थकेयर

कार्यस्थल पर चेहरे के विश्लेषण के माध्यम से कर्मचारी तनाव को पहचानना

mm

प्रकाशित

 on

के संदर्भ में बदलती संस्कृति ज़ूम-मीटिंग शिष्टाचार के आसपास, और का उद्भव ज़ूम की थकानकैम्ब्रिज के शोधकर्ताओं ने एक अध्ययन जारी किया है जो काम पर हमारे चेहरे के भावों के एआई-सक्षम वेबकैम कवरेज के माध्यम से हमारे तनाव के स्तर को निर्धारित करने के लिए मशीन लर्निंग का उपयोग करता है।

बाईं ओर, डेटा-एकत्रित करने वाला वातावरण, कई निगरानी उपकरणों के साथ या तो एक स्वयंसेवक को प्रशिक्षित किया गया है या उससे जुड़ा हुआ है; दाईं ओर, कार्य की कठिनाई के विभिन्न स्तरों पर परीक्षण विषयों द्वारा उत्पन्न चेहरे के भावों का उदाहरण दिया गया है। स्रोत: https://arxiv.org/pdf/2111.11862.pdf

बाईं ओर, डेटा-एकत्रित करने वाला वातावरण, कई निगरानी उपकरणों के साथ या तो एक स्वयंसेवक को प्रशिक्षित किया गया है या उससे जुड़ा हुआ है; दाईं ओर, कार्य की कठिनाई के विभिन्न स्तरों पर परीक्षण विषयों द्वारा उत्पन्न चेहरे के भावों का उदाहरण दिया गया है। स्रोत: https://arxiv.org/pdf/2111.11862.pdf

शोध का उद्देश्य प्रभाव विश्लेषण करना है (अर्थात्, भावना मान्यता) 'परिवेश सहायक जीवन' प्रणालियों में, और संभवतः ऐसी प्रणालियों में वीडियो-आधारित एआई चेहरे की अभिव्यक्ति निगरानी ढांचे को सक्षम करने के लिए डिज़ाइन किया गया है; हालाँकि पेपर इस पहलू पर विस्तार नहीं करता है, लेकिन शोध प्रयास का किसी अन्य संदर्भ में कोई मतलब नहीं है।

परियोजना का विशिष्ट दायरा चेहरे के भाव पैटर्न को सीखना है कामकाजी माहौल में - दूरस्थ कार्य व्यवस्था सहित - यात्रा जैसी 'अवकाश' या 'निष्क्रिय' स्थितियों के बजाय।

कार्यस्थल में चेहरे पर आधारित भावनाओं की पहचान

हालाँकि 'एम्बिएंट असिस्टिव लिविंग' बुजुर्गों की देखभाल के लिए एक योजना की तरह लग सकता है, लेकिन यह मामले से बहुत दूर है। इच्छित 'अंतिम उपयोगकर्ताओं' के बारे में बोलते हुए, लेखक कहते हैं*:

'परिवेश सहायक रहने वाले वातावरण के लिए बनाई गई प्रणालियाँ [†] इसका लक्ष्य स्वचालित प्रभाव विश्लेषण और प्रतिक्रिया दोनों करने में सक्षम होना है। परिवेशीय सहायक जीवन व्यक्ति के दैनिक जीवन और कामकाजी माहौल में सहायता करने के लिए सूचना और संचार प्रौद्योगिकी (आईसीटी) के उपयोग पर निर्भर करता है ताकि उन्हें लंबे समय तक स्वस्थ और सक्रिय रखा जा सके, और उन्हें उम्र बढ़ने के साथ स्वतंत्र रूप से जीने में सक्षम बनाया जा सके। इस प्रकार, परिवेश सहायक जीवन का उद्देश्य स्वास्थ्य कर्मियों, नर्सों, डॉक्टरों, कारखाने के श्रमिकों, ड्राइवरों, पायलटों, शिक्षकों के साथ-साथ विभिन्न उद्योगों को संवेदन, मूल्यांकन और हस्तक्षेप के माध्यम से सुविधा प्रदान करना है।.

'इस प्रणाली का उद्देश्य शारीरिक, भावनात्मक और मानसिक तनाव को निर्धारित करना और जरूरत पड़ने पर प्रतिक्रिया देना और अनुकूलन करना है, उदाहरण के लिए, उनींदापन का पता लगाने वाली प्रणाली से लैस कार ड्राइवर को सावधान रहने के लिए सूचित कर सकती है और उन्हें थोड़ा ब्रेक लेने का सुझाव दे सकती है। दुर्घटनाओं से बचने के लिए [††].'

RSI काग़ज़ शीर्षक है कार्य-जैसी सेटिंग्स में उपयोगकर्ता के चेहरे के प्रभाव का अनुमान लगाना, और कैंब्रिज में अफेक्टिव इंटेलिजेंस एंड रोबोटिक्स लैब के तीन शोधकर्ताओं से आता है।

परीक्षण की स्थितियाँ

जबसे काम से पहले यह क्षेत्र काफी हद तक इंटरनेट से निकाली गई छवियों के तदर्थ संग्रह पर निर्भर है, कैम्ब्रिज शोधकर्ताओं ने 12 कैंपस स्वयंसेवकों, 5 पुरुष और 7 महिलाओं के साथ स्थानीय डेटा-एकत्रीकरण प्रयोग किए। स्वयंसेवक नौ देशों से आए थे और उनकी उम्र 22-41 वर्ष थी।

इस परियोजना का लक्ष्य तीन संभावित तनावपूर्ण कामकाजी माहौल को फिर से बनाना है: एक कार्यालय; एक फ़ैक्टरी उत्पादन लाइन; और एक टेलीकांफ्रेंस कॉल - जैसे कि ज़ूम समूह चैट जो बन गई है बारंबार विशेषता महामारी के आगमन के बाद से गृहकार्य की।

विषयों की निगरानी विभिन्न माध्यमों से की गई, जिनमें तीन कैमरे, एक जबरा गर्दन पर पहना जाने वाला माइक्रोफोन, और शामिल हैं एम्पैटिका रिस्टबैंड (एक वायरलेस मल्टी-सेंसर पहनने योग्य जो वास्तविक समय बायोफीडबैक प्रदान करता है), और एक म्यूज़ 2 हेडबैंड सेंसर (जो बायोफीडबैक भी प्रदान करता है)। इसके अतिरिक्त, स्वयंसेवकों को सर्वेक्षण पूरा करने और समय-समय पर अपने मूड का स्व-मूल्यांकन करने के लिए कहा गया।

हालाँकि, इसका मतलब यह नहीं है कि भविष्य में एम्बिएंट असिस्टिव लिविंग रिग्स आपको उस हद तक 'प्लग इन' करने जा रहे हैं (यदि केवल लागत कारणों से); लिखित स्व-मूल्यांकन सहित डेटा-एकत्रीकरण में उपयोग किए जाने वाले सभी गैर-कैमरा निगरानी उपकरण और तरीकों का उद्देश्य कैमरा फुटेज द्वारा सक्षम चेहरे-आधारित प्रभाव पहचान प्रणालियों को सत्यापित करना है।

दबाव बढ़ाना: कार्यालय परिदृश्य

तीन में से पहले दो परिदृश्यों ('ऑफिस' और 'फ़ैक्टरी') में, स्वयंसेवकों को आसान गति से शुरुआत की गई, चार चरणों में दबाव धीरे-धीरे बढ़ता गया, प्रत्येक के लिए अलग-अलग प्रकार के कार्य थे।

प्रेरित तनाव के उच्चतम स्तर पर, स्वयंसेवकों को किसी के कंधे की ओर देखने के 'सफेद कोट प्रभाव' के साथ-साथ 85db अतिरिक्त शोर का भी सामना करना पड़ा, जो कि काफी है पाँच डेसीबल नीचे अमेरिका में कार्यालय के माहौल के लिए कानूनी सीमा, और राष्ट्रीय व्यावसायिक सुरक्षा और स्वास्थ्य संस्थान (एनआईओएसएच) द्वारा निर्दिष्ट सटीक अधिकतम सीमा।

कार्यालय जैसे डेटा-एकत्रीकरण चरण में, विषयों को पिछले अक्षरों को याद रखने का काम सौंपा गया था जो उनकी स्क्रीन पर चमकते थे, कठिनाई के बढ़ते स्तर के साथ (जैसे कि दो स्क्रीन पहले हुए दो-अक्षर अनुक्रम को याद रखना)।

फ़ैक्टरी परिदृश्य

शारीरिक श्रम के माहौल का अनुकरण करने के लिए, विषयों को खेल खेलने के लिए कहा गया आपरेशन, जो खिलाड़ी को किनारों को छुए बिना संकीर्ण, धातु-रिम वाले एपर्चर के माध्यम से बोर्ड से छोटी वस्तुओं को निकालने की आवश्यकता करके उपयोगकर्ता की निपुणता को चुनौती देता है, जो घटना एक 'विफलता' बजर को ट्रिगर करती है।

सर्जन ऑपरेशन खेलते हैं

जब तक सबसे कठिन चरण आया, स्वयंसेवक को एक मिनट के भीतर बिना किसी त्रुटि के सभी 12 वस्तुओं को निकालने की चुनौती दी गई। संदर्भ के लिए, इस कार्य के लिए 2019 में यूके में बनाया गया विश्व रिकॉर्ड, 12.68 सेकंड पर है.

टेलीकांफ्रेंसिंग परिदृश्य

अंत में, होमवर्किंग/टेलीकांफ्रेंस परीक्षण में, स्वयंसेवकों को एक प्रयोगकर्ता द्वारा एमएस टीम्स कॉल पर अपनी सकारात्मक और नकारात्मक यादों को याद करने के लिए कहा गया। इस परिदृश्य के सबसे तनावपूर्ण चरण के लिए, स्वयंसेवक को अपने हाल के अतीत की एक बहुत ही नकारात्मक या दुखद स्मृति को याद करने की आवश्यकता थी।

विभिन्न कार्यों और परिदृश्यों को यादृच्छिक क्रम में निष्पादित किया गया, और वर्किंग-एनवायरनमेंट-कॉन्टेक्स्ट-अवेयर डेटासेट (WECARE-DB) नामक एक कस्टम डेटासेट में संकलित किया गया।

विधि एवं प्रशिक्षण

उपयोगकर्ताओं की मनोदशा के आत्म-मूल्यांकन के परिणामों को जमीनी सच्चाई के रूप में उपयोग किया गया, और वैधता और उत्तेजना आयामों के लिए मैप किया गया। प्रयोगों के कैप्चर किए गए वीडियो को फेशियल लैंडमार्क डिटेक्शन के माध्यम से चलाया गया नेटवर्क, और संरेखित छवियाँ a को खिलाई गईं रेसनेट-18 नेटवर्क पर प्रशिक्षित किया गया इफ़ेक्टनेट डाटासेट।

पेपर के अनुसार, भावना-संबंधी प्रश्नों का उपयोग करके इंटरनेट से खींची/लेबल की गई एफ़ेक्टनेट की 450,000 छवियों को मैन्युअल रूप से एनोटेट किया गया था, वैलेंस और उत्तेजना आयामों के साथ।

इसके बाद, शोधकर्ताओं ने पूरी तरह से अपने स्वयं के WECARE डेटासेट के आधार पर नेटवर्क को परिष्कृत किया वर्णक्रमीय प्रतिनिधित्व एन्कोडिंग फ़्रेम-आधारित भविष्यवाणियों को सारांशित करने के लिए उपयोग किया गया था।

परिणाम

मॉडल के प्रदर्शन का मूल्यांकन आमतौर पर स्वचालित प्रभाव भविष्यवाणी से जुड़े तीन मैट्रिक्स पर किया गया था: कॉनकॉर्डेंस गुणांक सहसंबंध; पियर्सन गुणांक सहसंबंध; और मूल माध्य वर्ग त्रुटि (आरएमएसई)।

लेखकों ने ध्यान दिया कि मॉडल ने अपने स्वयं के WECARE डेटासेट पर बेहतर प्रदर्शन किया, ResNet-18 से बेहतर प्रदर्शन किया, और इससे यह निष्कर्ष निकाला कि जिस तरह से हम अपने चेहरे के भावों को नियंत्रित करते हैं, वह काम के माहौल में उन अधिक अमूर्त संदर्भों की तुलना में बहुत अलग है, जिनसे पूर्व अध्ययन प्राप्त हुए हैं। इंटरनेट से स्रोत सामग्री.

वे कहते हैं:

'तालिका को देखने पर हम पाते हैं कि WECARE-DB पर ठीक-ठीक मॉडल ने [AffectNet] पर पूर्व-प्रशिक्षित ResNet-18 मॉडल से बेहतर प्रदर्शन किया है, जो दर्शाता है कि कार्य-सदृश वातावरण में प्रदर्शित चेहरे का व्यवहार अंदर की तुलना में भिन्न होता है। -वाइल्ड इंटरनेट सेटिंग्स का उपयोग एफेक्टनेट डीबी में किया जाता है। इस प्रकार, काम जैसी सेटिंग में चेहरे के प्रभाव को पहचानने के लिए डेटासेट प्राप्त करना और मॉडल को प्रशिक्षित करना आवश्यक है।'

जहां तक ​​काम के दौरान पहचान को प्रभावित करने के भविष्य का सवाल है, जो कर्मचारियों के लिए प्रशिक्षित कैमरों के नेटवर्क द्वारा सक्षम है, और लगातार उनकी भावनात्मक स्थिति की भविष्यवाणी करता है, लेखक निष्कर्ष निकालते हैं*:

'अंतिम लक्ष्य कार्यशील उम्र के दौरान लोगों के स्वास्थ्य और कल्याण को बढ़ावा देने के लिए निर्णय समर्थन प्रणालियों में इनपुट प्रदान करने के लिए वास्तविक समय और वास्तविक कार्य सेटिंग्स में प्रशिक्षित मॉडलों को लागू करना और उपयोग करना है। ईयू वर्किंग एज प्रोजेक्ट.'

 

 

* मेरा जोर.

† यहां लेखक तीन उद्धरण देते हैं:

स्वचालित, आयामी और सतत भावना पहचान – https://ibug.doc.ic.ac.uk/media/uploads/documents/GunesPantic_IJSE_2010_camera.pdf
परिवेश सहायता प्राप्त जीवन डोमेन की खोज: एक व्यवस्थित समीक्षा – https://link.springer.com/article/10.1007/s12652-016-0374-3
परिवेशीय सहायता प्राप्त जीवन परिवेश के लिए इंटरनेट ऑफ थिंग्स प्रौद्योगिकियों की समीक्षा – https://mdpi-res.com/d_attachment/futureinternet/futureinternet-11-00259/article_deploy/futureinternet-11-00259-v2.pdf

†† यहां लेखक दो उद्धरण देते हैं:

डीप न्यूरल नेटवर्क के मॉडल संपीड़न का उपयोग करके एंबेडेड सिस्टम के लिए वास्तविक समय में ड्राइवर की तंद्रा का पता लगाना – https://openaccess.thecvf.com/content_cvpr_2017_workshops/w4/papers/Reddy_Real-Time_Driver_Drowsiness_CVPR_2017_paper.pdf
चेहरे की विशेषताओं का उपयोग करके वास्तविक समय ड्राइवर-उनींदापन का पता लगाने वाली प्रणाली – https://www.semanticscholar.org/paper/Real-Time-Driver-Drowsiness-Detection-System-Using-Deng-Wu/1f4b0094c9e70bf7aa287234e0fdb4c764a5c532