Connect with us

جهاز كمبيوتر قادر على تحديد 200 نوع من الطيور من صورة واحدة

الذكاء الاصطناعي

جهاز كمبيوتر قادر على تحديد 200 نوع من الطيور من صورة واحدة

mm

استخدم الباحثون من جامعة دوق جامعة التعلم الآلي لتدريب جهاز كمبيوتر على تحديد ما يصل إلى 200 نوع مختلف من الطيور. يحتاج الكمبيوتر إلى صورة واحدة فقط لإكمال عملية التعريف.对于 الإنسان ، غالبًا ما يتطلب سنوات من مراقبة الطيور للتمكن من تحديد الأنواع المختلفة عن بعضها البعض.

قاد البحث طالب الدكتوراه في علوم الكمبيوتر في جامعة دوق تشاوفان تشين ، إلى جانب الطالب الجامعي أوسكار لي. كما عمل عليه أعضاء آخرون في مختبر تحليل التنبؤ بقيادة أستاذ جامعة دوق سينثيا رودين.

عرض التفكير الاصطناعي

في حين أن عملية التعريف مثيرة للإعجاب ، هناك جانب أكثر أهمية من التطورات. يمكن للذكاء الاصطناعي أن يُظهر تفكيره ، مما يسمح حتى لمشاهد الطيور غير الخبرة بفهم العملية.

تم تدريب الشبكة العصبية العميقة ، أو الخوارزميات التي تعتمد على عمل الدماغ ، باستخدام 11788 صورة. وشملت الصور 200 نوعًا مختلفًا من الطيور ، بما في ذلك كل شيء من البط إلى الطنان.

لم يكن على فريق الباحثين تدريب الشبكة بشكل خاص على تحديد المناقير أو ريش الأجنحة. بدلاً من ذلك ، يمكن للشبكة أخذ صورة لطائر وتحديد أنماط معينة في الصورة. ثم يمكنها أخذ تلك الأنماط وتحديد الأنماط السابقة التي واجهتها بالفعل في سمات الأنواع النموذجية.

وفقًا للفريق ، فإن الشبكة ثم tạo سلسلة من خرائط الحرارة التي تحدد سمات معينة. على سبيل المثال ، يمكنها التمييز بين طائر الحسون العادي وطائر الحسون المخادع ، جنبًا إلى جنب مع الميزات المختلفة مثل الرأس المقنعة والبطن الأصفر. ثم تُظهر أن هذه السمات هي ما أدى إلى التعريف.

على عكس الأنظمة الأخرى

تمكنت الشبكة العصبية من تحديد النوع الصحيح بنسبة تصل إلى 84٪ من الوقت. هذا مشابه لبعض أفضل الأنظمة أداءً. الفرق هو أن تلك الأنظمة لا توضح عملية التفكير مثل هذه.

وفقًا لرودين ، فإن الجانب الأكثر ثورة في هذا المشروع هو أنه يوفر تصورًا لما تراه الشبكات العصبية العميقة عند النظر إلى صورة.

تستخدم هذه التقنية حاليًا على مواقع التواصل الاجتماعي ، لتحديد المشتبه فيهم المجرمين في كاميرات المراقبة ، ومساعدة المركبات المستقلة على تحديد إشارات المرور والمشاة.

غالبًا ما لا تتطلب برامج التعلم العميق برمجة صريحة من أجل التعلم من البيانات ، وهو ما لا ينطبق على البرامج التقليدية. ومع ذلك ، فإن العملية ليست دائمًا واضحة أو معروضة ، لذلك غالبًا ما يكون من الصعب شرح كيفية عمل الخوارزميات “تفكير” عند تصنيف صورة.

في المستقبل

تعمل رودين وأخرون حاليًا على نماذج تعلم عميق جديد للذكاء الاصطناعي ، مما يدفع المجال إلى الأمام. يمكن أن توضح النماذج الجديدة سببها وعمليتها. يساعد ذلك الباحثين على رؤية العملية من البداية إلى النهاية ، ويجعل من الأسهل تحديد سبب الخطأ أو المشكلة.

ستعمل رودين وفريقها على استخدام الخوارزمية في مجال الطب. يمكنها تحديد مناطق معينة في الصور الطبية مثل صور الثدي. هذا سيساعد المحترفين الطبيين على اكتشاف العقد والتعكزات وغيرها من علامات سرطان الثدي.

وفقًا لرودين ، فإن الشبكة تقلد الطريقة التي يقوم بها الأطباء بتشخيص الحالة.

“إنه استدلال قائم على الحالة” ، сказала رودين. “نأمل أن نتمكن من تفسير أفضل للأطباء أو المرضى لماذا تم تصنيف صورةهم بواسطة الشبكة على أنها خبيثة أو حميدة.”

سيقدم الفريق ورقة تتضمن بحثهم في المؤتمر الثالث والثلاثين لنظم معالجة المعلومات العصبية (NeurlIPS2019) في فانكوفر في 12 ديسمبر.

تتضمن الدراسة أيضًا مؤلفين دانيال تاو وألينا بارنر من جامعة دوق وجوناثان سو في مختبر ماساتشوستس للتقنية.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.