زاوية أندرسون
البحث عن "البوم والسحالي" في جمهور المعلن

نظرًا لأن قطاع الإعلان عبر الإنترنت هو مقدر مع إنفاق 740.3 مليار دولار أمريكي في عام 2023، من السهل فهم سبب استثمار شركات الإعلان لموارد كبيرة في هذا الفرع المعين من أبحاث الرؤية الحاسوبية.
على الرغم من كونها منعزلة وحامية، فإن الصناعة أحيانا ينشر دراسات تشير إلى أعمال ملكية أكثر تقدمًا في التعرف على الوجه ونظرات العين - بما في ذلك التعرف على العمر، محور إحصاءات التحليلات الديموغرافية:

يُعد تقدير العمر في سياق إعلاني غير رسمي أمرًا مهمًا للمعلنين الذين قد يستهدفون فئة عمرية معينة. في هذا المثال التجريبي لتقدير عمر الوجه تلقائيًا، يتم تتبع عمر الفنان بوب ديلان على مر السنين. المصدر: https://arxiv.org/pdf/1906.03625
وتستخدم هذه الدراسات، التي نادراً ما تظهر في مستودعات عامة مثل Arxiv، المشاركين الذين تم تجنيدهم بشكل شرعي كأساس لتحليل مدفوع بالذكاء الاصطناعي يهدف إلى تحديد إلى أي مدى وبأي طريقة يتفاعل المشاهد مع الإعلان.

غالبًا ما يتم استخدام الرسم البياني التكراري للتدرجات الموجهة (HoG) الخاص بـ Dlib في أنظمة تقدير الوجه. المصدر: https://www.computer.org/csdl/journal/ta/2017/02/07475863/13rRUNvyarN
غريزة الحيوان
وفي هذا الصدد، من الطبيعي أن تهتم صناعة الإعلان بتحديد الإيجابيات الكاذبة (المناسبات التي يسيء فيها النظام التحليلي تفسير تصرفات شخص ما)، ووضع معايير واضحة لتحديد متى لا يتفاعل الشخص الذي يشاهد إعلاناتهم التجارية بشكل كامل مع المحتوى.
فيما يتعلق بالإعلانات عبر الشاشات، تميل الدراسات إلى التركيز على مشكلتين في بيئتين. البيئتان هما "سطح المكتب" أو "الهاتف المحمول"، ولكل منهما خصائص خاصة تتطلب حلول تتبع مخصصة؛ وتتمثل هذه المشاكل - من وجهة نظر المعلن - في: سلوك البومة وسلوك السحلية - ميل المشاهدين إلى عدم الاهتمام الكامل بالإعلان المعروض أمامهم.

أمثلة على سلوك "البومة" و"السحلية" في موضوع مشروع بحث إعلاني. المصدر: https://arxiv.org/pdf/1508.04028
إذا كنت تبحث بعيدا من الإعلان المقصود برأسك بالكامل، هذا هو سلوك "البومة"؛ إذا كان وضع رأسك ثابتًا ولكن عيناك يتجول بعيدًا من الشاشة، هذا سلوك "السحلية". من حيث التحليلات واختبار الإعلانات الجديدة في ظل ظروف مُراقبة، تُعد هذه إجراءات أساسية ليتمكن النظام من التقاطها.
تتناول ورقة بحثية جديدة من استحواذ شركة SmartEye على Affectiva هذه القضايا، حيث تقدم بنية تستفيد من العديد من الأطر الموجودة لتوفير مجموعة ميزات مجمعة ومترابطة عبر جميع الظروف المطلوبة وردود الفعل المحتملة - وتكون قادرة على معرفة ما إذا كان المشاهد يشعر بالملل أو المشاركة أو بعيدًا بطريقة ما عن المحتوى الذي يرغب المعلن في مشاهدته.

أمثلة على الإيجابيات الحقيقية والكاذبة التي تم اكتشافها بواسطة نظام الانتباه الجديد لإشارات التشتيت المختلفة، والتي يتم عرضها بشكل منفصل لأجهزة سطح المكتب والأجهزة المحمولة. المصدر: https://arxiv.org/pdf/2504.06237
يذكر المؤلفون *:
'محدود بحث تعمقت في رصد الانتباه أثناء الإعلانات الإلكترونية. وبينما ركزت هذه الدراسات على تقدير وضعية الرأس أو اتجاه النظرة لتحديد حالات تشتيت الانتباه، فإنها تتجاهل معايير أساسية مثل نوع الجهاز (كمبيوتر مكتبي أو محمول)، وموضع الكاميرا بالنسبة للشاشة، وحجم الشاشة. وتؤثر هذه العوامل بشكل كبير على رصد الانتباه.
في هذه الورقة، نقترح بنية لاكتشاف الانتباه تتضمن اكتشاف عوامل تشتيت مختلفة، بما في ذلك سلوك البومة والسحلية في التحديق خارج الشاشة، والتحدث، والنعاس (من خلال التثاؤب وإغلاق العين لفترة طويلة)، وترك الشاشة دون مراقبة.
'على عكس الطرق السابقة، تدمج طريقتنا ميزات خاصة بالجهاز مثل نوع الجهاز، وموضع الكاميرا، وحجم الشاشة (لأجهزة الكمبيوتر المكتبية)، واتجاه الكاميرا (للأجهزة المحمولة) مع تقدير النظرة الخام لتعزيز دقة اكتشاف الانتباه.'
أكثر من عمل جديد بعنوان مراقبة انتباه المشاهد أثناء الإعلانات عبر الإنترنت، ويأتي من أربعة باحثين في Affectiva.
الطريقة والبيانات
نظراً لسرية هذه الأنظمة وطبيعة مصادرها المغلقة، لا تُقارن الورقة البحثية الجديدة نهجَ المؤلفين مباشرةً بمنافسيهم، بل تُقدّم نتائجها حصرياً كدراسات استئصال؛ كما أنها لا تلتزم عموماً بالشكل المُعتاد لأدبيات الرؤية الحاسوبية. لذلك، سنُلقي نظرة على البحث كما عُرض.
يؤكد المؤلفون أن عددًا محدودًا فقط من الدراسات تناولت اكتشاف الانتباه تحديدًا في سياق الإعلانات عبر الإنترنت. مجموعة أدوات تطوير برامج AFFDEXفي برنامج "التعرف على الوجوه المتعددة" الذي يوفر التعرف على الوجوه المتعددة في الوقت الحقيقي، يتم استنتاج الانتباه فقط من وضع الرأس، مع تصنيف المشاركين على أنهم غير منتبهين إذا تجاوزت زاوية رؤوسهم حدًا محددًا.

مثال من AFFDEX SDK، وهو نظام Affectiva يعتمد على وضعية الرأس كمؤشر على الاهتمام. المصدر: https://www.youtube.com/watch?v=c2CWb5jHmbY
في خانة رمز الخصم، أدخل TABBYDAY. 2019 التعاون القياس التلقائي للانتباه البصري لمحتوى الفيديو باستخدام التعلم العميق، تم شرح مجموعة بيانات تضم حوالي 28,000 مشارك لسلوكيات عدم الانتباه المختلفة، بما في ذلك يحدق بعيدا, تغمض عينيك، أو الانخراط في أنشطة غير ذات صلة، ونموذج CNN-LSTM تم تدريبه على اكتشاف الاهتمام من خلال مظهر الوجه بمرور الوقت.

من ورقة بحثية صدرت عام 2019، مثال يوضح حالات الاهتمام المتوقعة للمشاهد الذي يشاهد محتوى الفيديو. المصدر: https://www.jeffcohn.net/wp-content/uploads/2019/07/Attention-13.pdf.pdf
ومع ذلك، لاحظ المؤلفون أن هذه الجهود السابقة لم تأخذ في الاعتبار العوامل الخاصة بالجهاز، مثل استخدام المشارك لجهاز كمبيوتر مكتبي أو محمول؛ كما لم يأخذوا في الاعتبار حجم الشاشة أو وضع الكاميرا. بالإضافة إلى ذلك، يركز نظام AFFDEX فقط على تحديد تشتيت الانتباه، ويتجاهل مصادر التشتيت الأخرى، بينما يحاول بحث عام 2019 اكتشاف مجموعة أوسع من السلوكيات - ولكن استخدامه لعينة سطحية واحدة سي ان ان وتشير الورقة إلى أن العديد من الدول ربما لم تكن كافية للقيام بهذه المهمة.
ويلاحظ المؤلفون أن بعض الأبحاث الأكثر شعبية في هذا الخط ليست مُحسّنة لاختبار الإعلانات، والتي لها احتياجات مختلفة مقارنة بمجالات مثل القيادة أو التعليم - حيث يتم عادةً تحديد موضع الكاميرا ومعايرتها مسبقًا، والاعتماد بدلاً من ذلك على إعدادات غير معايرة، والعمل ضمن نطاق النظر المحدود لأجهزة سطح المكتب والأجهزة المحمولة.
ولهذا السبب، ابتكروا بنية لاكتشاف انتباه المشاهد أثناء الإعلانات عبر الإنترنت، مستفيدين من مجموعتين من الأدوات التجارية: أفديكس 2.0 و مجموعة أدوات تطوير البرامج SmartEye.

أمثلة على تحليل الوجه من AFFDEX 2.0. المصدر: https://arxiv.org/pdf/2202.12059
تستخرج هذه الأعمال السابقة مستوى منخفضًا ملامح مثل تعابير الوجه، ووضعية الرأس، واتجاه النظر. تُعالَج هذه السمات لإنتاج مؤشرات أعلى مستوى، بما في ذلك موضع النظر على الشاشة، والتثاؤب، والكلام.
يقوم النظام بتحديد أربعة أنواع من التشتيت: نظرة خارج الشاشة; نعاس,; تحدث، و شاشات غير مراقبةكما أنه يضبط تحليل النظرة وفقًا لوجود المشاهد على جهاز كمبيوتر سطح المكتب أو جهاز محمول.
مجموعات البيانات: نظرة
استخدم المؤلفون أربع مجموعات بيانات لتشغيل وتقييم نظام اكتشاف الانتباه: ثلاث مجموعات تركز بشكل فردي على سلوك النظر، والتحدث، والتثاؤب؛ والرابعة مأخوذة من جلسات اختبار الإعلانات في العالم الحقيقي التي تحتوي على مزيج من أنواع التشتيت.
نظراً للمتطلبات الخاصة بالعمل، أُنشئت مجموعات بيانات مخصصة لكل فئة من هذه الفئات. استُمدت جميع مجموعات البيانات المُختارة من مستودع خاص يضم ملايين الجلسات المُسجلة للمشاركين الذين يشاهدون الإعلانات في منازلهم أو أماكن عملهم، باستخدام إعدادات قائمة على الويب، وبموافقة مُسبقة. ونظراً لقيود اتفاقيات الموافقة هذه، يُصرّح المؤلفون بأنه لا يُمكن إتاحة مجموعات البيانات الخاصة بالعمل الجديد للعامة.
لبناء تحديق في مجموعة بيانات، طُلب من المشاركين متابعة نقطة متحركة عبر نقاط مختلفة على الشاشة، بما في ذلك حوافها، ثم النظر بعيدًا عن الشاشة في أربعة اتجاهات (أعلى، أسفل، يسار، ويمين) مع تكرار التسلسل ثلاث مرات. بهذه الطريقة، تم تحديد العلاقة بين الالتقاط والتغطية.

لقطات شاشة تُظهر مُحفِّز فيديو النظرة على (أ) أجهزة الكمبيوتر المكتبية و(ب) الأجهزة المحمولة. يعرض الإطاران الأول والثالث تعليماتٍ لمتابعة نقطةٍ متحركة، بينما يُطالب الإطاران الثاني والرابع المشاركين بالنظر بعيدًا عن الشاشة.
تمت تسمية أجزاء النقاط المتحركة باسم دقيق، والأجزاء خارج الشاشة مثل غافل، مما يؤدي إلى إنتاج مجموعة بيانات مُسمّاة من الأمثلة الإيجابية والسلبية.
استغرق كل مقطع فيديو حوالي 160 ثانية، مع إصدارات منفصلة تم إنشاؤها لأجهزة سطح المكتب والمنصات المحمولة، كل منها بدقة 1920 × 1080 و608 × 1080، على التوالي.
جُمِعَ ما مجموعه 609 مقاطع فيديو، منها 322 تسجيلًا على أجهزة الكمبيوتر و287 تسجيلًا على الأجهزة المحمولة. طُبِّقَت التصنيفات تلقائيًا بناءً على محتوى الفيديو، ومجموعة البيانات. انقسم إلى 158 عينة تدريبية و 451 للاختبار.
مجموعات البيانات: التحدث
في هذا السياق، أحد المعايير التي تحدد "عدم الانتباه" هو عندما يتحدث الشخص نيابة عن الآخرين. أطول من ثانية واحدة (ويمكن أن تكون هذه الحالة تعليقًا عابرًا، أو حتى سعالًا).
بما أن البيئة المُتحكم بها لا تُسجل الصوت أو تُحلله، يُستنتج الكلام من خلال ملاحظة الحركة الداخلية لمعالم الوجه المُقدرة. لذلك، للكشف عن تحدث بدون صوت، أنشأ المؤلفون مجموعة بيانات تعتمد بالكامل على المدخلات البصرية، المأخوذة من مستودعهم الداخلي، ومقسمة إلى قسمين: الأول يحتوي على ما يقرب من 5,500 مقطع فيديو، تم تصنيف كل منها يدويًا بواسطة ثلاثة معلقين على أنها تتحدث أو لا تتحدث (من بين هذه، تم استخدام 4,400 مقطع للتدريب والتحقق، و 1,100 للاختبار).
وتضمنت المجموعة الثانية 16,000 ألف جلسة تم تصنيفها تلقائيًا استنادًا إلى نوع الجلسة: 10,500 مشارك مميز يشاهدون الإعلانات بصمت، و5,500 مشارك في العرض يعبرون عن آرائهم حول العلامات التجارية.
مجموعات البيانات: التثاؤب
في حين أن بعض مجموعات البيانات "المثيرة للدهشة" موجودة، بما في ذلك ياود و تعب السائقيؤكد المؤلفون أنه لا يوجد أي منها مناسب لسيناريوهات اختبار الإعلانات، لأنها تتميز إما محاكاة التثاؤب أو غيرها من التشوهات في الوجه التي يمكن الخلط بينها وبين الخوف، أو غيرها من الأفعال غير التثاؤبية.
لذلك استخدم المؤلفون 735 مقطع فيديو من مجموعتهم الداخلية، واختاروا الجلسات التي من المرجح أن تحتوي على انخفاض الفك يستمر لأكثر من ثانية واحدة. تم تصنيف كل مقطع فيديو يدويًا بواسطة ثلاثة معلقين إما لعرض نشط or التثاؤب غير النشطاحتوت 2.6 بالمائة فقط من الإطارات على تثاؤبات نشطة، مما يسلط الضوء على اختلال التوازن بين الفئات، وتم تقسيم مجموعة البيانات إلى 670 مقطع فيديو تدريبيًا و65 مقطع فيديو للاختبار.
مجموعات البيانات: التشتيت
أكثر من إلهاء تم استخلاص مجموعة البيانات أيضًا من مستودع اختبار الإعلانات الخاص بالمؤلفين، حيث شاهد المشاركون إعلانات فعلية دون أي مهام مُكلَّفة. تم اختيار ما مجموعه 520 جلسة (193 على الأجهزة المحمولة و327 على أجهزة سطح المكتب) عشوائيًا، ووُسِّمَت يدويًا بواسطة ثلاثة مُعلِّقين على أنها دقيق or غافل.
السلوك غير المنتبه متضمن نظرة خارج الشاشة, تحدث, نعاسو شاشات غير مراقبةوتغطي الجلسات مناطق مختلفة حول العالم، حيث تكون التسجيلات المكتبية أكثر شيوعًا، وذلك بسبب وضع كاميرا الويب المرن.
نماذج الاهتمام
تعمل نموذج الانتباه المقترح على معالجة السمات المرئية منخفضة المستوى، وهي تعبيرات الوجه؛ ووضعية الرأس؛ واتجاه النظرة - المستخرجة من خلال AFFDEX 2.0 المذكور أعلاه وSmartEye SDK.
يتم بعد ذلك تحويلها إلى مؤشرات عالية المستوى، حيث يتم التعامل مع كل عامل تشتيت بواسطة مصنف ثنائي منفصل تم تدريبه على مجموعة البيانات الخاصة به لتحسينها وتقييمها بشكل مستقل.

مخطط لنظام الرصد المقترح.
أكثر من تحديق يحدد النموذج ما إذا كان المشاهد ينظر إلى الشاشة أم بعيدًا عنها باستخدام إحداثيات النظرة الطبيعية، مع معايرة منفصلة لأجهزة الكمبيوتر والهواتف المحمولة. ويساعد في هذه العملية نظام خطي. دعم شاحنات النقل (SVM)، المدرب على الميزات المكانية والزمانية، والذي يتضمن نافذة الذاكرة لتسهيل التحولات السريعة للنظرة.
للكشف عن التحدث بدون صوتاستخدم النظام مناطق فم مقصوصة وشبكة CNN ثلاثية الأبعاد مُدرَّبة على مقاطع فيديو محادثة وغير محادثة. وُضِّعت العلامات بناءً على نوع الجلسة، مع تقليل التنعيم الزمني للنتائج الإيجابية الخاطئة التي قد تنتج عن حركات الفم القصيرة.
تثاؤب تم اكتشاف ذلك باستخدام اقتصاص صور الوجه بالكامل، لالتقاط حركة الوجه الأوسع، باستخدام شبكة CNN ثلاثية الأبعاد مدربة على إطارات مُسمّاة يدويًا (على الرغم من أن المهمة كانت معقدة بسبب انخفاض تردد التثاؤب في الرؤية الطبيعية، وبسبب تشابهه مع تعبيرات أخرى).
التخلي عن الشاشة تم التعرف عليه من خلال غياب الوجه أو وضعية الرأس المتطرفة، مع التنبؤات التي قدمها شجرة القرار.
حالة الاهتمام النهائي تم تحديد ذلك باستخدام قاعدة ثابتة: إذا اكتشفت أي وحدة عدم انتباه، يتم وضع علامة على المشاهد غافل - نهج يعطي الأولوية للحساسية، ويتم ضبطه بشكل منفصل لسياقات سطح المكتب والهواتف المحمولة.
اختبارات
كما ذكرنا سابقًا، تتبع الاختبارات طريقة الاستئصال، حيث تتم إزالة المكونات وملاحظة التأثير على النتيجة.

تم تحديد فئات مختلفة من عدم الانتباه الملحوظ في الدراسة.
تمكن نموذج النظرة من تحديد السلوك خارج الشاشة من خلال ثلاث خطوات رئيسية: تطبيع تقديرات النظرة الخام، وضبط الإخراج، وتقدير حجم الشاشة لأجهزة سطح المكتب.
لفهم أهمية كل مكون، قام المؤلفون بحذفه بشكل فردي وتقييم الأداء على 226 مقطع فيديو على أجهزة الكمبيوتر المكتبية و225 مقطع فيديو على الأجهزة المحمولة، مأخوذة من مجموعتي بيانات. النتائج، التي تم قياسها بواسطة متوسط G و F1 النتائج، كما هو موضح أدناه:

النتائج التي تشير إلى أداء نموذج النظرة الكاملة، إلى جانب الإصدارات التي تمت إزالة خطوات المعالجة الفردية منها.
في جميع الحالات، انخفض الأداء عند حذف خطوة. أثبتت التطبيعية فعاليتها بشكل خاص على أجهزة الكمبيوتر المكتبية، حيث يختلف وضع الكاميرا بشكل أكبر من الأجهزة المحمولة.
كما قامت الدراسة بتقييم كيفية توقع السمات المرئية لاتجاه كاميرا الهاتف المحمول: موقع الوجه، ووضعية الرأس، ونظرة العين، حيث سجلت درجات 0.75 و0.74 و0.60، في حين وصل مجموعها إلى 0.91، وهو ما يسلط الضوء - كما يقول المؤلفون - على ميزة دمج الإشارات المتعددة.
أكثر من تحدث النموذج الذي تم تدريبه على مسافة الشفة العمودية حقق جمهورية الصين-الجامعة الأمريكية بالقاهرة من 0.97 على مجموعة الاختبار التي تم وضع العلامات عليها يدويًا، و0.96 على مجموعة البيانات الأكبر التي تم وضع العلامات عليها تلقائيًا، مما يشير إلى أداء متسق في كليهما.
أكثر من تثاؤب وصل النموذج إلى ROC-AUC بنسبة 96.6 بالمائة باستخدام نسبة عرض الفم وحدها، والتي تحسنت إلى 97.5 بالمائة عند دمجها مع وحدة العمل التوقعات من AFFDEX 2.0.
تم تصنيف اللحظات على أنها نموذج الشاشة غير المراقبة غافل عندما فشل كلٌّ من AFFDEX 2.0 وSmartEye في اكتشاف وجه لأكثر من ثانية واحدة. لتقييم صحة ذلك، قام المؤلفون بشرح جميع حالات عدم وجود وجه يدويًا في تشتيت حقيقي مجموعة بيانات، مع تحديد السبب الكامن وراء كل عملية تنشيط. استُبعدت الحالات الغامضة (مثل عرقلة الكاميرا أو تشويه الفيديو) من التحليل.
وكما هو موضح في جدول النتائج أدناه، فإن 27 بالمائة فقط من عمليات التنشيط "بدون وجه" كانت بسبب مغادرة المستخدمين للشاشة فعليًا.

هناك أسباب مختلفة لعدم العثور على وجه في بعض الحالات.
تقول الورقة:
"على الرغم من أن الشاشات غير المراقبة شكلت 27% فقط من الحالات التي أثارت إشارة عدم وجود وجه، فقد تم تنشيطها لأسباب أخرى تشير إلى عدم الانتباه، مثل قيام المشاركين بالتحديق خارج الشاشة بزاوية متطرفة، أو القيام بحركة مفرطة، أو حجب وجوههم بشكل كبير بجسم/يد."
في آخر الاختبارات الكمية، قام المؤلفون بتقييم مدى تأثير إضافة إشارات تشتيت مختلفة بشكل تدريجي - النظر خارج الشاشة (عبر النظر ووضعية الرأس)، والنعاس، والكلام، والشاشات غير المراقبة - على الأداء العام لنموذج الانتباه الخاص بهم.
تم إجراء الاختبار على مجموعتين من البيانات: تشتيت حقيقي مجموعة البيانات ومجموعة فرعية اختبارية من تحديق تم استخدام متوسط G ودرجات F1 لقياس الأداء (على الرغم من استبعاد النعاس والتحدث من تحليل مجموعة بيانات النظرة، بسبب أهميتهما المحدودة في هذا السياق).
كما هو موضح أدناه، تحسن اكتشاف الانتباه بشكل ثابت مع إضافة المزيد من أنواع التشتيت، مع نظرة خارج الشاشة، وهو المشتت الأكثر شيوعًا، والذي يوفر أقوى خط أساس.

تأثير إضافة إشارات تشتيت متنوعة إلى الهندسة المعمارية.
ومن هذه النتائج، جاء في الورقة:
"ومن خلال النتائج، يمكننا أولاً أن نستنتج أن دمج جميع إشارات التشتيت يساهم في تعزيز اكتشاف الانتباه.
ثانيًا، يتسم التحسن في كشف الانتباه بالثبات عبر كلٍّ من أجهزة الكمبيوتر المكتبية والمحمولة. ثالثًا، تُظهر جلسات الهاتف المحمول في مجموعة البيانات الحقيقية حركات رأس ملحوظة عند النظر بعيدًا، والتي يسهل اكتشافها، مما يؤدي إلى أداء أفضل للأجهزة المحمولة مقارنةً بأجهزة الكمبيوتر المكتبية. رابعًا، يُلاحظ تحسن طفيف نسبيًا عند إضافة إشارة النعاس مقارنةً بالإشارات الأخرى، نظرًا لندرة حدوثها.
'وأخيرًا، شهدت إشارة الشاشة غير المراقبة تحسنًا أكبر نسبيًا على الأجهزة المحمولة مقارنة بأجهزة الكمبيوتر المكتبية، حيث يمكن ترك الأجهزة المحمولة دون مراقبة بسهولة.'
كما قارن المؤلفون نموذجهم بنظام AFFDEX 1.0، وهو نظام سابق استُخدم في اختبار الإعلانات - وحتى نظام الكشف عن النظرة القائم على الرأس في النموذج الحالي تفوق على AFFDEX 1.0 عبر كلا نوعي الأجهزة:
هذا التحسين ناتج عن دمج حركات الرأس في اتجاهي الانحراف والميل، بالإضافة إلى تطبيع وضعية الرأس لمراعاة التغييرات الطفيفة. وقد أدت حركات الرأس الواضحة في مجموعة بيانات الهاتف المحمول الحقيقية إلى جعل أداء نموذج الرأس لدينا مشابهًا لأداء AFFDEX 1.0.
ويختتم المؤلفون ورقتهم البحثية بجولة اختبار نوعية (ربما كانت سطحية إلى حد ما)، كما هو موضح أدناه.

عينات من المخرجات من نموذج الانتباه عبر أجهزة سطح المكتب والأجهزة المحمولة، حيث يقدم كل صف أمثلة على الإيجابيات الحقيقية والكاذبة لأنواع مختلفة من التشتيت.
يذكر المؤلفون:
تشير النتائج إلى أن نموذجنا يكتشف بفعالية عوامل تشتيت الانتباه المختلفة في بيئات غير خاضعة للرقابة. ومع ذلك، قد يُنتج أحيانًا نتائج إيجابية خاطئة في بعض الحالات الشاذة، مثل إمالة الرأس بشدة مع الحفاظ على النظر إلى الشاشة، أو إغلاق الفم، أو ضبابية العينين المفرطة، أو صور الوجه المُعتمة بشدة.
الخاتمة
في حين تُمثل النتائج تقدمًا مُدروسًا ولكنه ذو مغزى مقارنةً بالأعمال السابقة، فإن القيمة الأعمق للدراسة تكمن في لمحةٍ تُقدمها عن الدافع المُستمر للوصول إلى الحالة الداخلية للمشاهد. ورغم أن البيانات جُمعت بموافقة، فإن المنهجية تُشير إلى أطر عمل مستقبلية يُمكن أن تتجاوز إعدادات أبحاث السوق المُهيكلة.
إن هذا الاستنتاج الذي يبدو وكأنه جنون العظمة لا يتعزز إلا من خلال الطبيعة المنعزلة والمقيدة والمحمية بغيرة لهذا الفرع من البحث.
* تحويلي لاقتباسات المؤلفين المضمنة إلى روابط تشعبية.
نُشر لأول مرة يوم الأربعاء 9 أبريل 2025












