اتصل بنا للحصول على مزيد من المعلومات

تحديد الجنس من خلال أساليب المشي مع التعلم الآلي

الذكاء الاصطناعي

تحديد الجنس من خلال أساليب المشي مع التعلم الآلي

mm

قام باحثون من رومانيا بتطوير نظام تعلُّم آلي قادر على تحديد جنس الشخص من طريقة مشيته، دون الحاجة إلى تحليل مكونات الوجه (والتي قد تكون مخفية أو محجوبة)، ودون الاعتماد على تحليل الصور الظلية أو غيرها من الأدلة التي تظهر على الجسم لتحديد الجنس (والتي يمكن "تزويرها" من قبل أعضاء من جنس آخر).

وبدلاً من ذلك، يستخدم النظام الجديد أنظمة التصنيف الموجودة القائمة على هذه الإشارات المؤقتة (والمتغيرة) لتحديد الخصائص الأساسية التي تميز مشية الرجال والنساء، مما يؤدي إلى نظام يحدد الجنس بشكل فعال فقط من خلال الحركات "الهيكلية" للشخص أثناء المشي.

بشكل فعال ، يحدد هذا النهج الجديد الطرق المختلفة التي يمشي بها الرجال والنساء دون اللجوء إلى إشارات أخرى ؛ ولكن نظرًا لأنه يستخدم خصائص أخرى (مثل معلومات الوجه) لتسمية أنماط المشي في البداية ، فإن البحث يترك السؤال مفتوحًا حول السمات الخاصة التي تميز الجنسين أثناء المشي.

تستمد الطريقة الجديدة الهوية الجنسية من نماذج تحليل الوجه التي تعمل في ظل قيود (مثل الزاوية المحدودة القابلة للاستخدام ، والحاجة إلى معالجة مجموعة البيانات). يقوم النظام بعد ذلك بتعيين خصائص الحركة الهيكلية كذكر أو أنثى ، ويقوم بتقطير إشارات المشي المميزة لكل منها ، متجاهلاً الوجه والملابس ومصادر البيانات الأخرى غير الموثوقة. المصدر: https://arxiv.org/pdf/2111.00538.pdf

تستمد الطريقة الجديدة الهوية الجنسية من نماذج تحليل الوجه التي تعمل في ظل قيود (مثل الزاوية المحدودة القابلة للاستخدام ، والحاجة إلى معالجة مجموعة البيانات). يقوم النظام بعد ذلك بتعيين خصائص الحركة الهيكلية كذكر أو أنثى ، ويقوم بتقطير إشارات المشي المميزة لكل منها ، متجاهلاً الوجه والملابس ومصادر البيانات الأخرى غير الموثوقة. المصدر: https://arxiv.org/pdf/2111.00538.pdf

الجديد ورقة بعنوان من وجهاً إلى مشية: التعلم الخاضع للإشراف الضعيف للمعلومات الجنسانية من أنماط المشي، ويأتي من باحثين في University Politehnica في بوخارست.

يعمل النظام على قدم المساواة مع نماذج تحليل الوجه ، وغالبًا ما يتجاوز تلك المعايير ، بامتداد نتيجة F1 تصل إلى 91٪ ، وتوفر مستوى عاليًا من التعميم لسيناريوهات جديدة ، بما في ذلك مجموعة متنوعة من وجهات النظر والظروف التي ستعيق عادةً فعالية أنظمة التعرف على النوع الاجتماعي القائمة على الوجه أو ما شابه. وتشمل هذه وجهات النظر المحجوبة الوجه ، والزوايا غير الأمامية والسيناريو النموذجي للغاية للصور منخفضة الدقة ، أو مراقبة الأشخاص البعيدين داخل الصورة ، حيث يبقى نمط الحركة فقط كمؤشر محتمل موثوق به للجنس.

الفجوة بين الجنسين

كما استنتج الباحثون ، فإن مثل هذا النظام لديه إمكانات كبيرة لأطر التجميع الديموغرافي التي يتم إعاقتها حاليًا ليس فقط من خلال تبني القناع في ظل COVID ، ولكن أيضًا بسبب الانحرافات في الموضة والمصادفة التي تصنع الملابس و تحليل صورة ظلية طريقة غير موثوقة لتحديد الجنس من لقطات المراقبة.

فيما يتعلق بالمراقبة ، فإن القدرة على خصم جميع الأهداف المحتملة التي لا تتناسب مع جنس الشخص المستهدف يمكن أن تقلل من المعالجة المسبقة والحاجة إلى اهتمام الإنسان والآلة بنسبة تصل إلى النصف - لأن أنظمة تحديد الهوية الحالية غالبًا ما تكافح من أجل التعيين بشكل صحيح الجنس لفرد خاضع للمراقبة.

من الورقة الجديدة: أمثلة مختلفة حيث تفشل أنظمة التعرف على النوع الاجتماعي. في الصف أعلاه ، نرى نظام تحليل المشي الجديد للباحثين يطابق بشكل صحيح التسمية الحقيقية للصورة (M أو F) ، بينما فشل تحليل الوجه في نفس الحالة. في الصف أدناه ، نرى حالات أنتجت فيها أدوات وضع العلامات التي يستخدمها الباحثون تسميات جنس "مزعجة" (أي غير صحيحة). لمواجهة ذلك ، استخدم الباحثون PENCIL (تصحيح الضجيج الاحتمالي الشامل للتعلم باستخدام الملصقات المزعجة) ، من بين طرق أخرى.

من الورقة البحثية الجديدة: أمثلة متنوعة لفشل أنظمة التعرف على الجنس. في الصف أعلاه، نرى أن نظام تحليل المشية الجديد الذي استخدمه الباحثون يُطابق بشكل صحيح التسمية الصحيحة للصورة (ذكر أو أنثى)، بينما فشل تحليل الوجه في الحالة نفسها. في الصف أدناه، نرى حالات أنتجت فيها أدوات التصنيف التي استخدمها الباحثون تسميات جنس "مشوشة" ​​(أي غير صحيحة). ولمعالجة ذلك، استخدم الباحثون قلم ('التصحيح الاحتمالي للضوضاء من البداية إلى النهاية للتعلم باستخدام العلامات الصاخبة')، من بين أساليب أخرى.

بطبيعة الحال ، من المرجح أن تزداد إمكانية الاعتراف الموثوق به بين الجنسين من خلال تحليل المشي الاهتمام الحالي بأساليب المشي الخادع.

تحديد الجنس بالوكالة

من الممكن نظريًا الوصول إلى نفس الوظيفة التي حققها المشروع الجديد من خلال التحليل الدقيق لبيانات حركة الهيكل العظمي المنسقة يدويًا. لو تم ذلك ، فمن المحتمل أن يكون للمشروع الجديد رؤى أعمق حول خصائص الحركة التي تحدد الجنس بشكل أفضل. ومع ذلك ، فإن مثل هذا النهج يدل على التزام كبير بالموارد ، وقد استخدم الباحثون بدلاً من ذلك الأنظمة الحالية (الأقل مرونة) لإنشاء الملصقات اللازمة.

لا تقدم هذه "التسميات الزائفة" أي رؤية صريحة حول سمات المشي القائمة على الجنس، ولكنها تجعل من الممكن تصفية أنماط المشي حسب الجنس بطريقة قابلة للتعميم بشكل كبير ويمكن تحقيقها في حدود القيود المفروضة على الموارد.

في البداية استخدم الباحثون 2019 منظر أمامي مشية مجموعة بيانات (FVG) ، والتي تتناول تحدي التعرف على المشية من زاوية أمامية ، والتي تقدم أدلة أقل من العروض الجانبية. تحتوي مجموعة البيانات على عينات المشي مع العديد من العوائق ، مثل سرعة المشي المتنوعة والخلفية المزدحمة ودقة متفاوتة والاختلافات في الملابس.

من ورقة FVG لعام 2019 ، تتعلم GaitNet تلقائيًا ميزات المشي الأساسية من `` فيديو المشي '' ، استنادًا إلى مشهد العرض الأمامي ، وهو سيناريو مشاهدة متكرر في الكاميرات التي تواجه الجمهور. المصدر: https://arxiv.org/pdf/1904.04925.pdf

من ورقة FVG لعام 2019، يتعلم GaitNet تلقائيًا ميزات المشي الأساسية من "فيديو المشي"، استنادًا إلى لقطات العرض الأمامي، وهو سيناريو مشاهدة متكرر في الكاميرات العامة. المصدر: https://arxiv.org/pdf/1904.04925.pdf

نظرًا لأن FVG ليس موجهًا نحو تحديد الجنس ، قام المؤلفون يدويًا بتعليق 226 موضوعًا في مجموعة البيانات مع معلومات عن الجنس من أجل تطوير الحقيقة الأساسية للإطار.

تم تسهيل اكتشاف الوجه من خلال MTCNN والسمات الديموغرافية التي يحددها IMDB-WIKI بيانات. نظرًا لأن تحليل المشي قد يكون أكثر فاعلية على مسافة طويلة من الاستدلال المستند إلى الوجه ، فقد تم الحصول على الملصقات النهائية من خلال متوسط ​​مرجح للثقة بين الجنسين مشتق من منطقة مربع إحاطة الوجه بالنسبة لأبعاد الإطار. تم استخراج الهياكل العظمية مع ألفبوز، مما يزيل أي "مؤشرات" محتملة، مثل ارتفاع الهدف (الذي لا يمكن تقييمه بشكل مؤكد في سيناريوهات الكاميرات العامة المخصصة).

الاختبار

تم اختبار النظام مقابل كاسيا-ب قاعدة بيانات المشية ، وأخذ عينات قليلة من الذكور ذوي التمثيل الزائد في مجموعة البيانات لضمان التكافؤ في الاختبار ، مع تقسيم البيانات للتدريب بنسبة 80٪ والتحقق من الصحة بنسبة 20٪.

استخدم الباحثون أعمالهم السابقة ، أ شبكة WildGait (انظر الصورة أدناه) ، لحساب التشابه بين متواليات المشي. يتم الآن إدخال معرفات النوع الاجتماعي ، التي تم إنشاؤها بالفعل ، بشكل فعال إلى هذه المرحلة من عملية إطار العمل.

WildGait عبارة عن شبكة تلافيفية للرسم البياني الزماني المكاني مدربة على حجم كبير ، وتسلسلات هيكلية مشروحة تلقائيًا مشتقة من تدفقات مراقبة في العالم الحقيقي. المصدر: https://arxiv.org/pdf/2105.05528.pdf

WildGait عبارة عن شبكة تلافيفية للرسم البياني الزماني المكاني مدربة على حجم كبير ، وتسلسلات هيكلية مشروحة تلقائيًا مشتقة من تدفقات مراقبة في العالم الحقيقي. المصدر: https://arxiv.org/pdf/2105.05528.pdf

في الختام ، ذكر المؤلفون أن النظام يطابق أحدث الأنظمة القائمة على الوجه من حيث الدقة في تحديد الجنس. نظرًا لوجود العديد من الزوايا المحتملة التي يمكن أن تحدث في فيديو المشي المصدر ، يتم توزيع النتائج عبر مجموعة من وجهات النظر الممكنة:

 

 

كاتب في مجال التعلم الآلي، متخصص في مجال تركيب الصور البشرية. رئيس سابق لمحتوى الأبحاث في Metaphysic.ai.
الموقع الشخصي: martinanderson.ai
اتصال: [البريد الإلكتروني محمي]
تويتر:manders_ai