рд╕реНрд╡рд╛рд╕реНрдереНрдп
рдХрд░реНрдордЪрд╛рд░реА рддрдирд╛рд╡ рдХреЛ рдЪреЗрд╣рд░реЗ рдХреЗ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХрд╛рдо рдкрд░ рдкрд╣рдЪрд╛рдирдирд╛

जूम-मीटिंग शिष्टाचार के आसपास बदलते संस्कृति और जूम थकान के उद्भव के संदर्भ में, कैम्ब्रिज के शोधकर्ताओं ने एक अध्ययन जारी किया है जो हमारे तनाव के स्तर को काम पर हमारे चेहरे के भाव के माध्यम से निर्धारित करने के लिए मशीन लर्निंग का उपयोग करता है।

बाएं, डेटा-संग्रह वातावरण, एक स्वयंसेवक पर या उससे जुड़े विभिन्न निगरानी उपकरण के साथ; दाएं, परीक्षण विषयों द्वारा उत्पन्न चेहरे के भाव के उदाहरण कार्य की कठिनाई के विभिन्न स्तरों पर। स्रोत: https://arxiv.org/pdf/2111.11862.pdf
शोध ‘एंबिएंट असिस्टिव लिविंग’ प्रणालियों में भावना विश्लेषण (अर्थात, भावना पहचान) के लिए अभिप्रेत है, और संभवतः ऐसी प्रणालियों में वीडियो-आधारित एआई चेहरे के भाव निगरानी फ्रेमवर्क को सक्षम करने के लिए डिज़ाइन किया गया है; हालांकि पत्र इस पहलू पर विस्तार नहीं करता है, शोध प्रयास किसी अन्य संदर्भ में कोई अर्थ नहीं रखता है।
परियोजना का विशिष्ट क्षेत्र कार्य वातावरण में चेहरे के भाव पैटर्न सीखना है – जिसमें दूरस्थ कार्य व्यवस्था शामिल है – ‘आनंद’ या ‘निष्क्रिय’ स्थितियों के बजाय, जैसे कि यात्रा करना।
कार्यस्थल में चेहरे आधारित भावना पहचान
जबकि ‘एंबिएंट असिस्टिव लिविंग’ बुजुर्ग देखभाल की योजना की तरह लगता है, यह दूर की बात है। ‘एंड यूज़र्स’ के बारे में बात करते हुए, लेखक कहते हैं*:
‘एंबिएंट असिस्टिव लिविंग वातावरण के लिए बनाए गए सिस्टम [†] स्वचालित भावना विश्लेषण और प्रतिक्रिया दोनों करने में सक्षम होने का लक्ष्य रखते हैं। एंबिएंट असिस्टिव लिविंग सूचना और संचार प्रौद्योगिकी (आईसीटी) का उपयोग व्यक्ति के दैनिक जीवन और कार्य वातावरण में सहायता प्रदान करने के लिए करता है ताकि वे स्वस्थ और सक्रिय रहें और लंबे समय तक स्वतंत्र रूप से जीवन व्यतीत कर सकें। इस प्रकार, एंबिएंट असिस्टिव लिविंग स्वास्थ्य कार्यकर्ताओं, नर्सों, डॉक्टरों, कारखाने के श्रमिकों, ड्राइवरों, पायलटों, शिक्षकों के साथ-साथ विभिन्न उद्योगों को सेंसिंग, मूल्यांकन और हस्तक्षेप के माध्यम से सुविधा प्रदान करने का लक्ष्य रखता है।
‘प्रणाली शारीरिक, भावनात्मक और मानसिक दबाव का निर्धारण करने और प्रतिक्रिया देने और आवश्यकतानुसार अनुकूलन करने का लक्ष्य रखती है, उदाहरण के लिए, एक ड्राइवर को सतर्क रहने और दुर्घटना से बचने के लिए थोड़ा ब्रेक लेने का सुझाव देने वाली एक दrowsiness डिटेक्शन सिस्टम से सुसज्जित कार’ [††]। ‘
पत्र पेपर शीर्षक वर्क-लाइक सेटिंग्स में यूज़र फेशियल अफेक्ट का अनुमान है, और कैम्ब्रिज के एफेक्टिव इंटेलिजेंस एंड रोबोटिक्स लैब के तीन शोधकर्ताओं से आता है।
परीक्षण स्थितियां
चूंकि पिछले कार्य इस क्षेत्र में मुख्य रूप से इंटरनेट से स्क्रैप की गई छवियों के ad hoc संग्रह पर निर्भर करता है, कैम्ब्रिज के शोधकर्ताओं ने 12 कैम्पस स्वयंसेवकों के साथ स्थानीय डेटा-संग्रह प्रयोग किए, 5 पुरुष और 7 महिलाएं। स्वयंसेवक नौ देशों से आए थे और 22-41 वर्ष की आयु के थे।
परियोजना का उद्देश्य तीन संभावित तनावपूर्ण कार्य वातावरण को पुनर्निर्माण करना था: एक कार्यालय; एक कारखाने की उत्पादन लाइन; और एक टेलीकॉन्फ्रेंस कॉल – जैसे कि जूम ग्रुप चैट जो महामारी के बाद से घर से काम करने की एक सामान्य विशेषता बन गई है।
विषयों की निगरानी विभिन्न साधनों से की गई, जिनमें तीन कैमरे, एक जाब्रा गर्दन-वorn माइक्रोफोन, एक एम्पैटिका कलाईबंद (एक वायरलेस मल्टी-सेंसर पहनने योग्य जो वास्तविक समय में बायोफीडबैक प्रदान करता है), और एक म्यूज 2 हेडबैंड सेंसर (जो भी बायोफीडबैक प्रदान करता है) शामिल थे। इसके अलावा, स्वयंसेवकों को समय-समय पर अपने मूड का मूल्यांकन करने और सर्वेक्षण पूरे करने के लिए कहा गया था।

हालांकि, इसका मतलब यह नहीं है कि भविष्य के एंबिएंट असिस्टिव लिविंग रिग्स आपको इतनी हद तक ‘प्लग इन’ करेंगे (यदि केवल लागत के कारण नहीं); डेटा-संग्रह में उपयोग किए जाने वाले सभी गैर-कैमरा निगरानी उपकरण और तरीके, जिनमें लिखित स्व-मूल्यांकन भी शामिल हैं, कैमरा फुटेज द्वारा सक्षम चेहरे आधारित भावना मान्यता प्रणालियों को सत्यापित करने के लिए अभिप्रेत हैं।
दबाव बढ़ाना: कार्यालय परिदृश्य
पहले दो परिदृश्यों (‘कार्यालय’ और ‘कारखाने’) में, स्वयंसेवकों को एक आसान गति से शुरू किया गया, जिसमें चार चरणों में दबाव धीरे-धीरे बढ़ाया गया, प्रत्येक के लिए विभिन्न प्रकार के कार्य थे।
उद्भूत तनाव के उच्चतम स्तर पर, स्वयंसेवकों को भी ‘व्हाइट कोट प्रभाव’ का सामना करना पड़ा, जिसमें किसी के कंधे पर खड़े होने के साथ-साथ 85db का अतिरिक्त शोर भी शामिल था, जो कि अमेरिका में एक कार्यालय वातावरण के लिए कानूनी सीमा से केवल पांच डेसीबल नीचे है, और राष्ट्रीय व्यावसायिक सुरक्षा और स्वास्थ्य संस्थान (एनआईओएसएच) द्वारा निर्दिष्ट अधिकतम सीमा है।
कार्यालय जैसे डेटा-संग्रह चरण में, विषयों को अपनी स्क्रीन पर फ्लैश होने वाले पिछले अक्षरों को याद रखने का काम दिया गया था, जिसमें कठिनाई के बढ़ते स्तर थे (जैसे कि दो अक्षरों की क्रमिक याद रखना जो दो स्क्रीन पहले हुआ था)।
कारखाना परिदृश्य
एक मैनुअल श्रम वातावरण को सिम्युलेट करने के लिए, विषयों को ऑपरेशन खेलने के लिए कहा गया था, जो उपयोगकर्ता की चपलता को चुनौती देता है क्योंकि इसमें एक बोर्ड से छोटे वस्तुओं को धातु के रिम वाले संकरे छेद से बिना स्पर्श किए निकालना शामिल है, जो ‘विफलता’ बजर को ट्रिगर करता है।
जब सबसे कठिन चरण आया, तो स्वयंसेवक को एक मिनट के भीतर बिना किसी त्रुटि के सभी 12 आइटम निकालने की चुनौती दी गई थी। संदर्भ के लिए, इस कार्य के लिए यूके में 2019 में निर्धारित विश्व रिकॉर्ड 12.68 सेकंड है।
टेलीकॉन्फ्रेंसिंग परिदृश्य
अंत में, घर से काम/टेलीकॉन्फ्रेंस परीक्षण में, स्वयंसेवकों को एक एमएस टीम्स कॉल पर एक प्रयोगकर्ता द्वारा अपनी खुद की सकारात्मक और नकारात्मक यादों को याद करने के लिए कहा गया था। इस परिदृश्य के सबसे तनावपूर्ण चरण के लिए, स्वयंसेवक को हाल के अपने अत्यधिक नकारात्मक या दुखद यादों में से एक को याद करने की आवश्यकता थी।
विभिन्न कार्य और परिदृश्यों को यादृच्छिक क्रम में निष्पादित किया गया और एक कस्टम डेटासेट में संकलित किया गया, जिसे वर्किंग-एनवायरनमेंट-कॉन्टेक्स्ट-अवेयर डेटासेट (डब्ल्यूईसीएआरई-डीबी) कहा जाता है।
विधि और प्रशिक्षण
स्वयंसेवकों के मूड के स्व-मूल्यांकन के परिणामों का उपयोग मूल सत्य के रूप में किया गया था, और वैलेंस और उत्तेजना आयामों के साथ मैप किया गया था। प्रयोगों के वीडियो एक चेहरे के लैंडमार्क का पता लगाने वाले नेटवर्क के माध्यम से चलाए गए, और संरेखित छवियों को रेसनेट-18 नेटवर्क को खिलाया गया, जिसे एफेक्टनेट डेटासेट पर प्रशिक्षित किया गया था।

एफेक्टनेट से 450,000 छवियां, सभी इंटरनेट से भावना संबंधी प्रश्नों का उपयोग करके खींची गई और वैलेंस और उत्तेजना आयामों के साथ मैन्युअल रूप से एनोटेट की गईं, पत्र कहता है।
इसके बाद, शोधकर्ताओं ने अपने स्वयं के डब्ल्यूईसीएआर डेटासेट पर आधारित नेटवर्क को परिष्कृत किया, जबकि स्पेक्ट्रल प्रतिनिधित्व एन्कोडिंग का उपयोग फ्रेम-आधारित भविष्यवाणियों को सारांशित करने के लिए किया गया था।
परिणाम
मॉडल के प्रदर्शन का मूल्यांकन स्वचालित भावना भविष्यवाणी से जुड़े तीन मेट्रिक्स पर किया गया था: समानता सहसंबंध गुणांक; पियरसन सहसंबंध गुणांक; और रूट मीन स्क्वायर एरर (आरएमएसई)।

लेखकों का उल्लेख है कि उनके स्वयं के डब्ल्यूईसीएआर डेटासेट पर ठीक किए गए मॉडल ने रेसनेट-18 को बेहतर प्रदर्शन किया, और इस निष्कर्ष पर पहुंचे कि हम अपने चेहरे के भावों को कैसे नियंत्रित करते हैं यह कार्य वातावरण में बहुत अलग है जो पिछले अध्ययनों से स्रोत सामग्री के स्रोत के अधिक अमूर्त संदर्भों की तुलना में है।
वे कहते हैं:
‘तालिका को देखते हुए हम देखते हैं कि डब्ल्यूईसीएआरई-डीबी पर ठीक किए गए मॉडल ने रेसनेट-18 मॉडल को बेहतर प्रदर्शन किया, जो [एफेक्टनेट] पर प्री-ट्रेन्ड था, यह दर्शाता है कि कार्य जैसे वातावरण में प्रदर्शित चेहरे के व्यवहार इंटरनेट सेटिंग्स की तुलना में बहुत अलग हैं। इसलिए, कार्य जैसे वातावरण में चेहरे की भावना को पहचानने के लिए डेटासेट प्राप्त करना और मॉडल प्रशिक्षित करना आवश्यक है। ‘
कार्य में भावना पहचान के भविष्य के संबंध में, जो कर्मचारियों पर प्रशिक्षित कैमरों के नेटवर्क द्वारा संचालित होता है और उनकी भावनात्मक स्थिति का निरंतर अनुमान लगाता है, लेखक निष्कर्ष निकालते हैं*:
‘अंतिम लक्ष्य वास्तविक समय में और वास्तविक कार्य सेटिंग्स में प्रशिक्षित मॉडल को लागू करना और उपयोग करना है ताकि निर्णय समर्थन प्रणालियों को स्वास्थ्य और कल्याण को बढ़ावा देने के लिए इनपुट प्रदान किया जा सके। लोगों के कार्य आयु के संदर्भ में यूरोपीय संघ कार्य आयु परियोजना के संदर्भ में। ‘
* मेरा जोर।
† यहाँ लेखक तीन उद्धरण देते हैं:
स्वचालित, आयामी और निरंतर भावना पहचान – https://ibug.doc.ic.ac.uk/media/uploads/documents/GunesPantic_IJSE_2010_camera.pdf
एंबिएंट असिस्टिव लिविंग डोमेन का अन्वेषण: एक व्यवस्थित समीक्षा – https://link.springer.com/article/10.1007/s12652-016-0374-3
एंबिएंट असिस्टिव लिविंग वातावरण के लिए इंटरनेट ऑफ थिंग्स प्रौद्योगिकियों की समीक्षा – https://mdpi-res.com/d_attachment/futureinternet/futureinternet-11-00259/article_deploy/futureinternet-11-00259-v2.pdf
†† यहाँ लेखक दो उद्धरण देते हैं:
एम्बेडेड सिस्टम के लिए गहरे तंत्रिका नेटवर्क के मॉडल संपीड़न का उपयोग करके वास्तविक समय ड्राइवर दrowsiness का पता लगाना – https://openaccess.thecvf.com/content_cvpr_2017_workshops/w4/papers/Reddy_Real-Time_Driver_Drowsiness_CVPR_2017_paper.pdf
चेहरे की विशेषताओं का उपयोग करके वास्तविक समय ड्राइवर-दrowsiness का पता लगाने वाली प्रणाली – https://www.semanticscholar.org/paper/Real-Time-Driver-Drowsiness-Detection-System-Using-Deng-Wu/1f4b0094c9e70bf7aa287234e0fdb4c764a5c532












