رطم تقنية جديدة تساعد الذكاء الاصطناعي في تحديد الكائنات ثلاثية الأبعاد - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

تقنية جديدة تساعد الذكاء الاصطناعي في تحديد الكائنات ثلاثية الأبعاد

تحديث on
الصورة: جامعة ولاية نورث كارولاينا

تعمل تقنية جديدة طورها باحثون في جامعة ولاية كارولينا الشمالية على تحسين قدرة برامج الذكاء الاصطناعي (AI) على تحديد الكائنات ثلاثية الأبعاد. تساعد هذه التقنية ، التي تسمى MonoCon ، الذكاء الاصطناعي أيضًا على تعلم كيفية ارتباط الكائنات ثلاثية الأبعاد ببعضها البعض في الفضاء باستخدام الصور ثنائية الأبعاد. 

يمكن أن يكون لدى MonoCon مجموعة واسعة من التطبيقات ، بما في ذلك مساعدة المركبات المستقلة على التنقل حول المركبات الأخرى باستخدام الصور ثنائية الأبعاد المستلمة من الكاميرا الموجودة على متن الطائرة. يمكن أن تلعب أيضًا دورًا في التصنيع والروبوتات.

تيانفو وو هو مؤلف المقابلة ورقة بحثية وأستاذ مساعد في الهندسة الكهربائية وهندسة الحاسبات في جامعة ولاية كارولينا الشمالية. 

يقول وو: "نحن نعيش في عالم ثلاثي الأبعاد ، ولكن عندما تلتقط صورة ، فإنها تسجل هذا العالم في صورة ثنائية الأبعاد".

تتلقى برامج الذكاء الاصطناعي مدخلات مرئية من الكاميرات. لذلك إذا أردنا أن يتفاعل الذكاء الاصطناعي مع العالم ، فنحن بحاجة إلى التأكد من قدرته على تفسير ما يمكن أن تخبره الصور ثنائية الأبعاد عن الفضاء ثلاثي الأبعاد. في هذا البحث ، نركز على جزء واحد من هذا التحدي: كيف يمكننا جعل الذكاء الاصطناعي يتعرف بدقة على الكائنات ثلاثية الأبعاد - مثل الأشخاص أو السيارات - في صور ثنائية الأبعاد ، ووضع هذه الأشياء في الفضاء "، يتابع وو. 

المركبات المستقلة

غالبًا ما تعتمد المركبات المستقلة على الليدار للتنقل في الفضاء ثلاثي الأبعاد. Lidar ، الذي يستخدم الليزر لقياس المسافة ، مكلف ، مما يعني أن الأنظمة المستقلة لا تحتوي على الكثير من التكرار. سيكون وضع العشرات من أجهزة استشعار ليدار على سيارة بدون سائق منتجة بكميات كبيرة مكلفًا للغاية. 

يقول وو: "ولكن إذا تمكنت مركبة ذاتية القيادة من استخدام المدخلات المرئية للتنقل عبر الفضاء ، فيمكنك البناء في التكرار". "نظرًا لأن الكاميرات أقل تكلفة بكثير من الليدار ، فسيكون من المجدي اقتصاديًا تضمين كاميرات إضافية - مما يجعل النظام أكثر أمانًا وقوة.

"هذا أحد التطبيقات العملية. ومع ذلك ، نحن متحمسون أيضًا للتقدم الأساسي لهذا العمل: أنه من الممكن الحصول على بيانات ثلاثية الأبعاد من كائنات ثنائية الأبعاد. "

تدريب الذكاء الاصطناعي

يمكن لـ MonoCon التعرف على كائنات ثلاثية الأبعاد في صور ثنائية الأبعاد قبل وضعها في "مربع محيط" ، والذي يخبر الذكاء الاصطناعي بالحواف الخارجية للكائن. 

يقول وو: "ما يميز عملنا هو كيفية تدريبنا للذكاء الاصطناعي ، الذي يعتمد على تقنيات التدريب السابقة". "مثل الجهود السابقة ، نضع الكائنات في مربعات إحاطة ثلاثية الأبعاد أثناء تدريب الذكاء الاصطناعي. ومع ذلك ، بالإضافة إلى مطالبة الذكاء الاصطناعي بالتنبؤ بمسافة الكاميرا إلى الكائن وأبعاد المربعات المحيطة ، نطلب أيضًا من الذكاء الاصطناعي التنبؤ بمواقع كل نقطة من نقاط الصندوق الثمانية ومسافتها من مركز المحيط. مربع في بعدين. نسمي هذا "السياق الإضافي" ، ووجدنا أنه يساعد الذكاء الاصطناعي في تحديد الكائنات ثلاثية الأبعاد والتنبؤ بها بشكل أكثر دقة بناءً على الصور ثنائية الأبعاد.

"إن الطريقة المقترحة مدفوعة بنظرية معروفة في نظرية القياس، وهي نظرية كرامر وولد. ومن المحتمل أيضًا أن ينطبق ذلك على مهام التنبؤ بالمخرجات المنظمة الأخرى في رؤية الكمبيوتر.

تم اختبار MonoCon باستخدام مجموعة بيانات معيارية مستخدمة على نطاق واسع تسمى KITTI.

يقول وو: "في الوقت الذي قدمنا ​​فيه هذه الورقة ، كان أداء MonoCon أفضل من أي من العشرات من برامج الذكاء الاصطناعي الأخرى التي تهدف إلى استخراج البيانات ثلاثية الأبعاد على السيارات من الصور ثنائية الأبعاد".

سيبحث الفريق الآن عن توسيع نطاق العملية بمجموعات بيانات أكبر.

يقول وو: "من الآن فصاعدًا ، نعمل على توسيع نطاق هذا الأمر ونعمل مع مجموعات بيانات أكبر لتقييم وضبط MonoCon لاستخدامه في القيادة الذاتية". "نريد أيضًا استكشاف التطبيقات في التصنيع ، لمعرفة ما إذا كان بإمكاننا تحسين أداء المهام مثل استخدام الأسلحة الآلية."

أليكس ماكفارلاند صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في مجال الذكاء الاصطناعي. لقد تعاون مع العديد من الشركات الناشئة والمنشورات في مجال الذكاء الاصطناعي في جميع أنحاء العالم.