Connect with us

يمكن للذكاء الاصطناعي تخمين سنة صورة من أعمار الأشخاص

زاوية Anderson

يمكن للذكاء الاصطناعي تخمين سنة صورة من أعمار الأشخاص

mm
An image from the source paper 'Photo Dating by Facial Age Aggregation', overlaid against an image of a desk surface with a 1974 calendar on it. Source: eBay and Source paper + Firefly V3.

تظهر الأبحاث الجديدة أن الذكاء الاصطناعي يمكن أن يستخدم وجوه الأشخاص لتخمين سنة chụp الصورة، من خلال الجمع بين تخمين العمر مع السنوات المعروفة للميلاد لتحقيق نتائج أفضل من الطرق القائمة على المشهد.

 

كان من السهل تخمين تاريخ الصورة في الماضي أكثر من الآن، لأن أسلوب الشعر والملابس كان يتطور بسرعة كبيرة. لreasons متداولة، توقف هذا التغيير في الأسلوب المرئي منذ حوالي ثلاثين عامًا، مما يعني أنه لم يعد من السهل النظر إلى تصفيفة شعر أو عناصر ملابس وتخمين السنة من هذا النوع من الدلالات المرئية.

لمدة من الوقت، كان من الممكن أيضًا تحديد تاريخ الصور والأفلام بناءً على دقة الألوان و خصائص الحبوب لفيلم الفوتوغرافي. لم يكن عليك أن تكون خبيرًا في الطب الشرعي؛ إذا كنت تشاهد أفلامًا قديمة كافية، فإن الدلالات الثقافية (مثل الموسيقى والسيارات والأزياء والمواضيع وغيرها) سوف ترتبط في النهاية، من قبل المشاهد، مع أنماط فيلم الفوتوغرافي:

تظهر الصورة كيفية تحسين فيلم الفوتوغرافي تدريجياً مدى مجموعة من درجات البشرة وأساليب الإضاءة مع مرور الوقت، من الإعدادات المسطحة إلى الإعدادات الأكثر واقعية والتنوع.

تظهر الصورة كيفية تحسين فيلم الفوتوغرافي تدريجياً مدى مجموعة من درجات البشرة وأساليب الإضاءة مع مرور الوقت، من الإعدادات المسطحة إلى الإعدادات الأكثر واقعية والتنوع. المصدر (مقالتي الخاصة)

دلالة إضافية لتحديد تاريخ الصورة كانت ما إذا كانت بالأسود والأبيض – اقتصاد أصبح زائد بعد شعبية التصوير الفوتوغرافي الرقمي في بداية هذا القرن

هناك العديد من الأنظمة التجارية والتجريبية، مثل PhotoDater المرفق مع اشتراك MyHeritage PhotoDater تحاول تحديد تاريخ الصور باستخدام هذه المعايير والمعايير المختلفة.

مثال على تقدير عمر الصورة من خدمة MyHeritage PhotoDater المرفقة مع الاشتراك. المصدر [ https://www.youtube.com/watch?v=2oVyLI6tBcY ]

مثال على تقدير عمر الصورة من خدمة MyHeritage PhotoDater المرفقة مع الاشتراك. المصدر

في غياب الدلالات الأخرى، مثل الهواتف الذكية أو التكنولوجيا الخاصة بالعصر، أفضل طريقة لتحديد عمر الصورة التي تم chụpها في letzten 15-25 عامًا هي إذا كنت على دراية بالشخص (أي المشاهير أو ربما معارف)، ويمكنك تقدير عمره، مما يؤدي إلى تقدير تقريبي للسنة.

العمر الوجهي كمرجع

في مجال الرؤية الحاسوبية، وفي مجالات أخرى متنوعة (أي الطب الشرعي، ومعالجة الأرشيف، والصحافة، وهندسة قواعد البيانات، إلخ)، القدرة على تحديد عمر الصورة هي هدف مرغوب فيه، منذ أن تفتقر العديد من المجموعات الرقمية والفوتوغرافية الأكثر إثارة للاهتمام إلى تعليقات مناسبة وبيانات وصفية، أو حتى تحتوي على بيانات وصفية خاطئة من التخمينات السابقة (الخاطئة).

لذلك سيكون من المفيد إذا كان نظام الذكاء الاصطناعي يمكنه مراجعة الصور بنفس الطريقة التي ننظر بها إلى مجموعتنا التاريخية، وقول ‘نعم، كانت هذه عندما…’. السؤال هو، ما يمكن أن يكون الحافز، في غياب الدلالات المعتادة؟

تطرح ورقة بحثية جديدة من جمهورية التشيك قدمًا أوليًا في هذا النهج، من خلال استغلال أنظمة الذكاء الاصطناعي القائمة على تحديد العمر، جنبًا إلى جنب مع أنظمة التعرف على الوجه المرتبطة بقاعدة بيانات مشتركة من الهويات (في هذه الحالة، مجموعة تشبه قاعدة بيانات آي إم دي بي وتضم الممثلين والمنتجين التشيكيين):

صورة من فيلم Joachim، Put It in the Machine (1974)، تستخدم لتوضيح عملية التأريخ. يتم الكشف عن الأفراد المعروفين في الصورة، ويتم تقدير عمرهم باستخدام مقدر عمر الوجه (العمود الأيمن)، ويتم إنتاج توزيع احتمالي لتواريخ الصور المحتملة عن طريق طرح قيمة العمر من سنة ميلاد كل شخص. تظهر المنحنيات احتمالية كل تقدير للعمر، مع خطوط متقطعة تحدد عمر الشخص الحقيقي في وقت chụp الصورة.

صورة من فيلم ‘Joachim، Put It in the Machine’ (1974)، تستخدم لتوضيح عملية التأريخ. يتم الكشف عن الأفراد المعروفين في الصورة، ويتم تقدير عمرهم باستخدام مقدر عمر الوجه (العمود الأيمن)، ويتم إنتاج توزيع احتمالي لتواريخ الصور المحتملة عن طريق طرح قيمة العمر من سنة ميلاد كل شخص. المصدر

يعمل النظام عن طريق الكشف عن أفراد معروفين في الصورة، وتقدير عمرهم الوجهي باستخدام نموذج مدرب مسبقًا، وطرح هذا التقدير من سنة ميلادهم المثبتة لتحديد تواريخ الصور المحتملة. عندما يكون هناك أكثر من وجه واحد، يتم تجميع تقديرات التاريخ لتحديد تنبؤ نهائي.

تم اختبار الطريقة على صور من قاعدة بيانات الأفلام التشيكية السلوفاكية (CSFD)، وادعى المؤلفون أن النهج الناتج يُظهر دقة متسقة أفضل من النماذج القائمة على المشهد (النماذج الثابتة التي تعتمد على عناصر الخلفية أو السياق البصري بدلاً من الوجوه) التي تم تدريبها على نفس البيانات.

يتطلب مخطط هذه الطريقة قاعدة بيانات مركزية تحتوي على معرفة لمجموعة واسعة من الأفراد؛ في هذه الحالة، قاعدة بيانات الأفلام التشيكية على غرار قاعدة بيانات آي إم دي بي؛ ولكن أي مجموعة أخرى تضم تواريخ ميلاد مؤكدة وأحداث مؤرخة يمكن أن تؤدي إلى نتائج مماثلة.

تنص الورقة على:

‘فريد من نوعه، يوفر مجموعنا بيانات لعدة أفراد في صورة واحدة، مما يسمح بدراسة تجميع معلومات الوجوه المتعددة. نقترح إطارًا احتماليًا يجمع بين الأدلة البصرية من نماذج التعرف على الوجه الحديثة ومقدرات العمر، وأسس زمنية مهنية لاستنتاج سنة chụp الصورة. ‘

‘تظهر تجاربنا أن تجميع الأدلة من عدة وجوه يحسن الأداء بشكل متسق، ويؤدي النهج إلى تفوق كبير على أسس قوية قائمة على المشهد، خاصةً في الصور التي تحتوي على عدة أفراد يمكن التعرف عليهم.’

الورقة الجديدة الورقة الجديدة بعنوان التأريخ الصوري بواسطة تجميع العمر الوجهي، وتنشر من قبل两个 باحثين في الجامعة التقنية التشيكية في براغ، مع وعد بالإفراج عن الشفرة والبيانات في وقت لاحق.

الطريقة

لتحديد عندما تم chụp الصورة، ينظر نظام المؤلفين إلى كل وجه تم الكشف عنه ويتحاول تخمين من قد يكون، باستخدام القاعدة بيانات المذكورة أعلاه من الأشخاص المعروفين. منذ أن لا يمكن لأي شخص أن يظهر مرة واحدة فقط في الصورة، يقوم النظام بفحص جميع مجموعات الهويات المحتملة ويتحاول تقدير عمر كل شخص.

بعد ذلك، يعمل النظام بشكل عكسي لتقدير السنة الأكثر احتمالاً التي ستجعل تلك الأعمار تتماشى:

الجانب الأيسر: يقوم النظام ببناء جدول زمني يظهر عندما كان الأفراد المعروفون أكثر نشاطًا، بناءً على مهنهم. اليمين: يتم الجمع بين ذلك مع تقديرات عمر الوجه لإنتاج تخمين نهائي لوقت chụp الصورة.

الجانب الأيسر: يقوم النظام ببناء جدول زمني يظهر عندما كان الأفراد المعروفون أكثر نشاطًا، بناءً على مهنهم. اليمين: يتم الجمع بين ذلك مع تقديرات عمر الوجه لإنتاج تخمين نهائي لوقت chụp الصورة.

لإدارة الكثير من مجموعات الهويات المحتملة، يفترض النظام أن الوجوه مستقلة، ويعتمد مظهر كل منها فقط على هويته وتاريخ الصورة.

لتحديد عندما تم chụp الصورة، يقوم النظام أولاً بتخمين عمر كل وجه تم الكشف عنه باستخدام نموذج cvut-002، الذي يعتمد على هيكل ViT-B/16، ومدرب على مجموعة بيانات خاصة (التي، كما يذكر المؤلفون، تحتل مرتبة عالية في قاعدة بيانات تقييم تقنية تحليل الوجه في المعهد الوطني للمعايير والتكنولوجيا (NIST) FATE).

بمجرد معرفة سنة ميلاد الشخص، يقوم النموذج بتحويل تقدير العمر إلى سنة chụp الصورة المحتملة ببساطة عن طريق إضافة العمر إلى سنة الميلاد، مما يؤدي إلى توزيع احتمالي لتواريخ chụp الصورة المحتملة. لتقدير مدى تطابق وجه تم الكشف عنه مع هوية معينة، يقوم النظام بمقارنة الترميزات في فضاء ArcFace:

ArcFace، الهيكل المساهم الرئيسي في نموذج InsightFace الشهير، تم إطلاقه في عام 2015، وكان من المفترض أن يصبح مشروعًا مؤثرًا في تقييم وتحليل الوجه.

ArcFace، الهيكل المساهم الرئيسي في نموذج InsightFace الشهير، تم إطلاقه في عام 2015، وكان من المفترض أن يصبح مشروعًا مؤثرًا في تقييم وتحليل الوجه. المصدر


كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai