الروبوتات

تقدم في “الذكاء المكاني” يُمكّن الروبوتات من استشعار البيئات المادية مثل البشر

Published July 17, 2020

Updated April 28, 2026

Alex McFarland

يعمل المهندسون في معهد ماساتشوستس للتكنولوجيا على إعطاء الروبوتات القدرة على اتباع أوامر عالية المستوى، مثل الذهاب إلى غرفة أخرى لاسترجاع عنصر معين لفرد ما. من أجل إمكانية القيام بذلك، ستحتاج الروبوتات إلى القدرة على استشعار البيئات المادية بشكل مشابه للطريقة التي يفعلها البشر.

لوكا كارلوني هو أستاذ مساعد في علوم الطيران والفضاء في معهد ماساتشوستس للتكنولوجيا.

“من أجل اتخاذ أي قرار في العالم، تحتاج إلى وجود نموذج عقلي للبيئة المحيطة بك”، يقول كارلوني. “هذا شيء سهل للغاية بالنسبة للبشر. ولكن بالنسبة للروبوتات، فهو مشكلة مؤلمة للغاية، حيث يتعلق الأمر بتحويل قيم البكسل التي يراها من خلال الكاميرا إلى فهم للعالم.”

للمواجهة هذه التحدي، قام الباحثون بتمثيل تمثيل للاستشعار المكاني للروبوتات بناءً على كيفية استشعار البشر وتحريك بيئاتهم المادية.

رسوم متحركة ثلاثية الأبعاد ديناميكية

النموذج الجديد يسمى رسوم متحركة ثلاثية الأبعاد ديناميكية، ويتضمن تمكين روبوت من توليد خريطة ثلاثية الأبعاد لمحيطه المادي، بما في ذلك الأشياء والملصقات الدلالية لها. يمكن للروبوت أيضًا رسم خريطة للأشخاص والغرف والجدران والهياكل الأخرى في البيئة.

ثم يسمح النموذج للروبوت استخراج المعلومات من الخريطة ثلاثية الأبعاد، والمعلومات التي يمكن استخدامها لتحديد موقع الأشياء والغرف وحركة الأشخاص.

“إن هذا التمثيل المضغوط للبيئة مفيد لأنها تسمح لروبوتنا بالتفكير بسرعة وتخطيط مساره”، يقول كارلوني. “هذا ليس بعيدًا عما نفعله كبشر. إذا كنت تحتاج إلى التخطيط لمسار من منزلك إلى معهد ماساتشوستس للتكنولوجيا، فلا تخطط لكل vị trí فردي تحتاج إلى أخذها. تفكر فقط على مستوى الشوارع والمراكز التي تساعدك على التخطيط لمسارك بشكل أسرع.”

وفقًا لكارلوني، الروبوتات التي تعتمد على هذا النموذج ستكون قادرة على القيام بأكثر من المهام المنزلية فقط. يمكن استخدامها أيضًا لمهارات عالية المستوى والعمل جنبًا إلى جنب مع الأشخاص في المصانع، أو مساعدة العثور على ناجين من موقع كارثي.

https://www.youtube.com/watch?time_continue=39&v=SWbofjhyPzI&feature=emb_logo

الأساليب الحالية مقابل النموذج الجديد

تركز الأساليب الحالية للرؤية الروبوتية والتنقل بشكل رئيسي على رسم الخرائط ثلاثية الأبعاد التي تسمح للروبوتات بإعادة بناء بيئتهم في ثلاثة أبعاد في الوقت الفعلي، أو التجزئة الدلالية، التي تحدث عندما يصنف الروبوت الميزات في البيئة كأشياء دلالية، مثل سيارة مقابل دراجة. غالبًا ما يتم إجراء التجزئة الدلالية على صور ثنائية الأبعاد.

النموذج الجديد المطور للاستشعار المكاني هو الأول من نوعه ل توليد خريطة ثلاثية الأبعاد للبيئة في الوقت الفعلي وتسمية الأشياء والأشخاص والهياكل داخل الخريطة ثلاثية الأبعاد في نفس الوقت.

من أجل تحقيق هذا النموذج الجديد، اعتمد الباحثون على Kimera، مكتبة مفتوحة المصدر. تم تطوير Kimera مسبقًا من قبل نفس الفريق لبناء نموذج هندسي ثلاثي الأبعاد للبيئة، مع同时 تشفير ما يُحتمل أن يكون الكائن، مثل كرسي مقابل مكتب.

“مثل الكائن الأسطوري الذي يمزج بين حيوانات مختلفة، كنا نريد Kimera أن تكون مزيجًا من رسم الخرائط والفهم الدلالي في ثلاثة أبعاد”، يقول كارلوني.

استخدم Kimera الصور من كاميرا الروبوت والقياسات القصورية من المستشعرات المثبتة على متنها لإعادة بناء المشهد كشبكة ثلاثية الأبعاد في الوقت الفعلي. من أجل القيام بذلك، استخدم Kimera شبكة عصبية تم تدريبها على ملايين الصور في العالم الحقيقي. يمكنها بعد ذلك التنبؤ بملصق كل بكسل واستخدام إسقاط الأشعة لطرحها في ثلاثة أبعاد.

من خلال استخدام هذه التقنية، يمكن تمثيل بيئة الروبوت كشبكة ثلاثية الأبعاد حيث يتم تعريف كل وجه بلون، مما يحدد أنه جزء من الأشياء أو الهياكل أو الأشخاص في البيئة.

شبكة ثلاثية الأبعاد إلى رسوم متحركة ثلاثية الأبعاد “رسوم متحركة” ديناميكية

نظرًا لأن نموذج الشبكة الدلالية ثلاثية الأبعاد يتطلب الكثير من القوة الحاسوبية ويتطلب وقتًا طويلاً، استخدم الباحثون Kimera لتطوير خوارزميات أدت إلى رسوم متحركة ثلاثية الأبعاد ديناميكية.

يتحلل النموذج الشبكي الدلالي ثلاثي الأبعاد إلى طبقات دلالية منفصلة، ويمكن للروبوت بعد ذلك مشاهدة المشهد من خلال طبقة. تتراوح الطبقات من الأشياء والأشخاص إلى الفراغات المفتوحة والهياكل، إلى الغرف والمراقب والقاعات والمباني الكاملة.

يسمح هذا الأسلوب الطبقي للروبوت بتضييق焦اته بدلاً من أن يضطر إلى تحليل مليارات النقاط والأوجه. يسمح أيضًا هذا الأسلوب الطبقي للخوارزميات بتتبع البشر وحركتهم داخل البيئة في الوقت الفعلي.

تم اختبار النموذج الجديد في محاكي фотو-حقيقي ي模ّل روبوتًا يتحرك في بيئة مكتبية مع أشخاص متحركين.

“نحن ببساطة نُمكّن الروبوتات من拥有 نماذج عقلية مشابهة لتلك التي يستخدمها البشر”، يقول كارلوني. “يمكن أن يؤثر ذلك على العديد من التطبيقات، بما في ذلك السيارات ذاتية القيادة والبحث والإنقاذ والتصنيع التعاوني والروبوتات المنزلية.

انضم كارلوني إلى المؤلف الرئيسي وطالب الدراسات العليا في معهد ماساتشوستس للتكنولوجيا أنطوني روسينول.

“لقد أصبح نهجنا ممكنًا بفضل التقدم الأخير في التعلم العميق وعقود من البحث على التموضع المتزامن والخريطة”، يقول روسينول. “مع هذا العمل، نحن نقفز نحو عصر جديد من الإدراك الروبوتي يسمى الذكاء المكاني، وهو ما زال في مرحلة الطفولة ولكنه له إمكانات كبيرة في الروبوتات والواقع الافتراضي والمعزز على نطاق واسع.”

تم تقديم البحث في مؤتمر الروبوتات: العلوم والنظم الافتراضي.

Alex McFarland

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.