Connect with us

التعرف على ضغوط الموظفين من خلال تحليل الوجه في العمل

الرعاية الصحية

التعرف على ضغوط الموظفين من خلال تحليل الوجه في العمل

mm

في سياق الثقافة المتغيرة حول أصول اللياقة في اجتماعات زوم، و ظهور إجهاد زوم، أصدر باحثون من كامبريدج دراسة تستخدم التعلم الآلي لتحديد مستويات التوتر لدينا من خلال تغطية الويب كام المدعومة بالذكاء الاصطناعي لتعبيراتنا Facial في العمل.

On the left, the data-gathering environment, with multiple monitoring equipment either trained on or attached to a volunteer; on the right, example facial expressions generated by test subjects at varying levels of task difficulty. Source: https://arxiv.org/pdf/2111.11862.pdf

On the left, the data-gathering environment, with multiple monitoring equipment either trained on or attached to a volunteer; on the right, example facial expressions generated by test subjects at varying levels of task difficulty. Source: https://arxiv.org/pdf/2111.11862.pdf

البحث موجه لتحليل المشاعر (أي، تعرف على المشاعر) في أنظمة “العيش المساعد المحيطي”، ومن المفترض أن تكون مصممة لتمكين إطارات مراقبة تعبيرات الوجه القائمة على الفيديو في هذه الأنظمة؛ على الرغم من أن الورقة لا تتوسع في هذا الجانب، فإن جهود البحث لا تحصل على أي معنى في أي سياق آخر.

نطاق المشروع المحدد هو تعلم أنماط تعبيرات الوجه في بيئات العمل – بما في ذلك الترتيبات العمل عن بُعد – بدلاً من “الترفيه” أو “المراقبة”، مثل السفر.

تعرف على المشاعر القائمة على الوجه في مكان العمل

في حين قد يبدو “العيش المساعد المحيطي” مثل مخطط للرعاية الكبراء، فإن هذا بعيد كل البعد عن الحال. يتحدث المؤلفون عن “مستخدمي النهاية”، ويقولون*:

‘النظم المُنشأة للعيش المساعد المحيطي [†] تهدف إلى أداء تحليل المشاعر التلقائي والاستجابة. يعتمد العيش المساعد المحيطي على استخدام تكنولوجيا المعلومات والاتصالات (ICT) لمساعدة الشخص في بيئته اليومية للعيش والعمل للحفاظ على صحته وفعاليته لفترة أطول، وتمكينه من العيش بشكل مستقل مع تقدمه في العمر. وبالتالي، يهدف العيش المساعد المحيطي إلى تسهيل عمل العاملين في مجال الصحة والممرضين والأطباء وعمال المصانع وسائقي السيارات وطيارين والمعلمين بالإضافة إلى مختلف الصناعات من خلال الحواس والتقدير والتدخل.

‘النظام旨 في تحديد الإجهاد الجسدي والعاطفي والعقلي والاستجابة والتكيف حسب الحاجة، على سبيل المثال، يمكن لسيارة مجهزة بنظام كشف النعاس إخبار السائق بأن يكون внимياً ويمكنه أن يقترح عليه أخذ استراحة قصيرة لتجنب الحوادث [††].’

الورقة بعنوان استنتاج تعبيرات الوجه للمستخدم في إعدادات شبيهة بالعمل، وهي تأتي من ثلاثة باحثين في مختبر الذكاء العاطفي والروبوتات في كامبريدج.

ظروف الاختبار

منذ أن اعتمد العمل السابق في هذا المجال إلى حد كبير على مجموعات صور جمعها بشكل عفوي من الإنترنت، أجرت باحثو كامبريدج تجارب جمع بيانات محلية مع 12 متطوعًا من الحرم الجامعي، 5 من الذكور و 7 من الإناث. جاء المتطوعون من تسع دول، وكان возрастهم بين 22 و 41 عامًا.

استهدفت المشروع إلى إعادة إنشاء ثلاثة بيئات عمل محتملة للتوتر: مكتب؛ خط إنتاج مصنع؛ ومكالمة تليفونية – مثل نوع دردشة زوم الجماعية التي أصبحت ميزة متكررة للعمل عن بُعد منذ ظهور الجائحة.

كانت الأشخاص خاضعين للمراقبة بطرق مختلفة، بما في ذلك ثلاثة كاميرات، وميكروفون جابرا حول الرقبة، وشرائط إمباتيكا على الورك (جهاز لاسلكي متعددة الحواس ي 提供 ردود فعل حيوية في الوقت الفعلي)، وشرائط موس 2 على الرأس (التي تقدم أيضًا ردود فعل حيوية). بالإضافة إلى ذلك، طُلب من المتطوعين إكمال الاستبيانات وتقييم مزاجهم بشكل دوري.

ومع ذلك، هذا لا يعني أن أجهزة العيش المساعد المحيطي في المستقبل ستكون “موصولة” بهذا الشكل (ولو فقط لأسباب تتعلق بالتكلفة)؛ جميع أجهزة المراقبة غير الكاميرا والأساليب المستخدمة في جمع البيانات، بما في ذلك التقييمات المكتوبة الذاتية، تهدف إلى التحقق من أنظمة تعرف المشاعر القائمة على الوجه التي تمكنها لقطات الكاميرا.

زيادة الضغط: سيناريو المكتب

في السيناريوهين الأولين (“المكتب” و “المصنع”)، بدأ المتطوعون في темп سهل، مع زيادة الضغط تدريجياً على أربعة مراحل، مع أنواع مختلفة من المهام لكل منها.

في أعلى مستوى من الإجهاد المستحث، كان على المتطوعين أيضًا تحمل “تأثير الكواتو الأبيض” لشخص يحدق في كتفهم، بالإضافة إلى 85 ديسيبل من الضوضاء الإضافية، وهي فقط خمس ديسيبل أقل من الحد القانوني للبيئة المكتبية في الولايات المتحدة، والحد الأقصى المحدد من قبل المعهد الوطني للسلامة والصحة المهنية (NIOSH).

في مرحلة جمع البيانات الشبيهة بالمكتب، طُلب من الأشخاص تذكر الحروف السابقة التي ظهرت على شاشتهم، مع مستويات متزايدة من الصعوبة (مثل تذكر تسلسل حرفين حدث قبل شاشتين).

سيناريو المصنع

لتمثيل بيئة العمل اليدوي، طُلب من الأشخاص لعب لعبة العملية، والتي تتحدي خبير المستخدم من خلال توجيهه لاستخراج أشياء صغيرة من اللوحة من خلال فتحات معدنية ضيقة، دون لمس الجوانب، وهو حدث يؤدي إلى سنجة “فشل”.

عندما جاءت المرحلة الأصعب، طُلب من المتطوع استخراج جميع العناصر الـ 12 دون خطأ في دقيقة واحدة. من أجل السياق، سجل الرقم القياسي العالمي لهذه المهمة، الذي تم تحديده في المملكة المتحدة في عام 2019، يبلغ 12.68 ثانية.

سيناريو التليفونات

أخيرًا، في اختبار العمل عن بُعد / التليفون، طُلب من المتطوعين من قبل باحث عبر مكالمة تليفونية على تيمز تذكر ذكرياتهم الإيجابية والسلبية. لأكثر مرحلة توتر في هذا السيناريو، طُلب من المتطوع تذكر ذكرى سلبية أو حزينة جدًا من ماضيه الحديث.

تم تنفيذ المهام والسيناريوهات في ترتيب عشوائي، وتم تجميعها في مجموعة بيانات مخصصة بعنوان قاعدة بيانات السياق الحساسة للبيئة العمل (WECARE-DB).

الطريقة والتدريب

استُخدمت نتائج تقييمات المزاج الذاتية للمستخدمين كحقيقة أساسية، وتم映وتها إلى أبعاد القيمة والعصبية. تم تشغيل مقاطع الفيديو للمحاكمة عبر شبكة كشف معالم الوجه، وتم تغذية الصور المحددة لشبكة ResNet-18 تم تدريبها على مجموعة بيانات AffectNet.

450000 صورة من AffectNet، جميعها مصورة ومُ etiquetted من الإنترنت باستخدام استعلامات متعلقة بالمشاعر، تم تحديدها يدويًا، حسبما تقول الورقة.

بعد ذلك، حُسن الشبكة فقط على مجموعة بيانات WECARE الخاصة بهم، في حين تم استخدام ترميز التمثيل الطيفي لتلخيص التنبؤات القائمة على الإطار.

النتائج

تم تقييم أداء النموذج على ثلاثة مقاييس شائعة المرتبطة بالتنبؤ التلقائي بالمشاعر: معامل الارتباط للتوافق؛ معامل الارتباط بيرسون؛ وخطأ الجذر التربيعي (RMSE).

يشير المؤلفون إلى أن النموذج المُحسّن على مجموعة بيانات WECARE الخاصة بهم يتفوق على ResNet-18، وينتهون من ذلك إلى أن الطريقة التي نتحكم بها تعبيراتنا Facial في بيئة العمل تختلف كثيرًا عن السياقات المجردة التي تم استخراج المواد المصدر منها من الإنترنت.

هم يقولون:

‘نظرًا إلى الجدول، نلاحظ أن النموذج المُحسّن على WECARE-DB يتفوق على نموذج ResNet-18 المُتدرب مسبقًا على [AffectNet]، مما يشير إلى أن السلوكيات الوجهية المعروضة في بيئات شبيهة بالعمل تختلف مقارنة بالسياقات البرية على الإنترنت المستخدمة في قاعدة بيانات AffectNet. وبالتالي، من الضروري الحصول على مجموعات بيانات وتنفيذ نماذج لتعرف تعبيرات الوجه في بيئات شبيهة بالعمل.’

فيما يتعلق بمستقبل تعرف المشاعر في العمل، تمكّن من قبل شبكات الكاميرات الموجهة إلى الموظفين، وتقديم تنبؤات دائمة لاحوالهم العاطفية، يخلص المؤلفون إلى*:

‘الهدف النهائي هو تنفيذ النماذج المُدرَّبة في الوقت الفعلي وفي بيئات العمل الحقيقية لتوفير مدخلات لأنظمة دعم القرار لتعزيز الصحة والرفاهية للأشخاص خلال سن العمل في سياق مشروع سن العمل الأوروبي.’

 

 

* التأكيد علي.

† هنا يذكر المؤلفون ثلاثة إشارات:

التعرف التلقائي على المشاعر البعدية والمتواصلة – https://ibug.doc.ic.ac.uk/media/uploads/documents/GunesPantic_IJSE_2010_camera.pdf
استكشاف مجال العيش المساعد المحيطي: مراجعة منهجية – https://link.springer.com/article/10.1007/s12652-016-0374-3
مراجعة تكنولوجيا الإنترنت للأشياء في بيئات العيش المساعد المحيطي – https://mdpi-res.com/d_attachment/futureinternet/futureinternet-11-00259/article_deploy/futureinternet-11-00259-v2.pdf

†† هنا يذكر المؤلفون إشارتين:

كشف النعاس للسائق في الوقت الفعلي لنظام مدمج باستخدام ضغط نموذج الشبكات العصبية العميقة – https://openaccess.thecvf.com/content_cvpr_2017_workshops/w4/papers/Reddy_Real-Time_Driver_Drowsiness_CVPR_2017_paper.pdf
نظام كشف النعاس للسائق في الوقت الفعلي باستخدام ميزات الوجه – https://www.semanticscholar.org/paper/Real-Time-Driver-Drowsiness-Detection-System-Using-Deng-Wu/1f4b0094c9e70bf7aa287234e0fdb4c764a5c532

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai