الروبوتات

كيف يتعلم الروبوتات طلب المساعدة

mm

في عالم الروبوتات المتطور، تبرز сотрудرة رائدة بين جامعة برينستون وجوجل. قام مهندسو هذه المؤسسات المرموقة بتطوير طريقة مبتكرة تعلم الروبوتات مهارة حاسمة: التعرف على الحاجة إلى المساعدة وطريقة طلبها. هذا التطور ي代表 قفزة كبيرة إلى الأمام في مجال الروبوتات، حيث يغلق الفجوة بين العمل المستقل وتفاعل الإنسان مع الروبوت.

كان المسار نحو روبوتات أكثر ذكاء واستقلالية دائمًا محظورًا بتحدي كبير: تعقيد اللغة البشرية وغموضها. على عكس وضوح اللغة الثنائية للبرامج، فإن اللغة البشرية مليئة بالدقة والنواحي، مما يجعلها متاهة للروبوتات. على سبيل المثال، يمكن أن يصبح أمر بسيط مثل “ارفع الكوب” مهمة معقدة عندما يكون هناك العديد من الكوبات.

quantifying اللبس

لمواجهة هذا التحدي، قدم فريق برينستون وجوجل نهجًا جديدًا ي量ف “الغموض” في اللغة البشرية. تقاس هذه التقنية أساسًا مستوى عدم اليقين في أوامر اللغة وتستخدم هذا المقاييس لتوجيه أفعال الروبوت. في الحالات التي قد تؤدي فيها أمر إلى تفسيرات متعددة، يمكن للروبوت الآن تقييم مستوى عدم اليقين ويتخذ قرارًا حول متى يطلب مزيدًا من التوضيح. على سبيل المثال، في بيئة تحتوي على العديد من الكوبات، سيتسبب مستوى أعلى من عدم اليقين في أن يطلب الروبوت تحديد الكوب الذي يجب رفعه، وبالتالي تجنب الأخطاء أو عدم الكفاءة المحتملة.

يمنح هذا النهج الروبوتات فهمًا أفضل للغة، ولكنه يعزز أيضًا من سلامتهم وفعاليتهم في تنفيذ المهام. من خلال دمج نماذج اللغة الكبيرة (LLM) مثل تلك التي تقف وراء ChatGPT، قام الباحثون بخطوة كبيرة في جعل أفعال الروبوت أكثر توافقًا مع التوقعات والاحتياجات البشرية.

دور نماذج اللغة الكبيرة

يلعب دمج LLMs دورًا حاسمًا في هذا النهج الجديد. تعمل LLMs على معالجة وتفسير اللغة البشرية. في هذا السياق، يتم استخدامها لتقييم وقياس عدم اليقين الموجود في أوامر اللغة التي تُمنح للروبوتات.

然而، فإن الاعتماد على LLMs ليس بدون تحديات. كما أشارت الفريق البحثي، يمكن أن تكون مخرجات LLMs أحيانًا غير موثوقة.

يشدد أنيرودها ماجومدار، أستاذ مساعد في جامعة برينستون، على أهمية هذا التوازن:

“الاستمرار في اتباع الخطط التي تم إنشاؤها بواسطة LLM قد يسبب في أن يتصرف الروبوتات بطريقة غير آمنة أو غير موثوقة، لذلك نحتاج إلى روبوتاتنا التي تستخدم LLM لتكون على دراية بمتى لا تعرف.”

هذا يبرز الحاجة إلى نهج متوازن، حيث يتم استخدام LLMs كأدوات توجيه بدلاً من كونها مصدرًا غير قابل للخطأ للقرارات.

التطبيق العملي والاختبار

تم اختبار مدى praktik هذا النهج في سيناريوهات مختلفة، مما يظهر مرونته وفعاليةه. واحدة من هذه الاختبارات تضمنت ذراعًا روبوتيًا، مهمته فرز عناصر طعام لعب إلى فئات مختلفة. أظهر هذا الإعداد البسيط قدرة الروبوت على التنقل في المهام بخيارات واضحة بشكل فعال.

ازدادت التعقيدات بشكل كبير في تجربة أخرى تضم ذراعًا روبوتيًا مثبتًا على منصة ذات عجلات في مطبخ مكتب. هنا، واجه الروبوت تحديات العالم الحقيقي مثل تحديد العنصر الصحيح لوضعه في الميكروويف عند تقديم خيارات متعددة.

من خلال هذه الاختبارات، أظهرت الروبوتات بنجاح قدرتها على استخدام عدم اليقين المquantified لاتخاذ القرارات أو طلب التوضيح، مما يؤكد الفائدة العملية لهذا النهج.

الآثار المستقبلية والبحث

متطلعين إلى الأمام، تمتد الآثار هذا البحث إلى ما هو أبعد من التطبيقات الحالية. الفريق، بقيادة ماجومدار وطالب الدراسات العليا آلين رين، يبحث عن كيفية تطبيق هذا النهج لمشاكل أكثر تعقيدًا في إدراك الروبوتات والذكاء الاصطناعي. هذا يشمل السيناريوهات التي تحتاج فيها الروبوتات إلى دمج المعلومات البصرية واللغوية لاتخاذ القرارات، مما يغلق الفجوة بين فهم الروبوتات وتفاعل الإنسان.

يهدف البحث المستمر إلى تحسين قدرة الروبوتات على أداء المهام بدقة أعلى وأيضًا إلى التنقل في العالم بفهم شبيه بالإدراك البشري. هذا البحث قد يفتح الطريق لروبوتات أكثر كفاءة وأمان وأيضًا أكثر توافقًا مع المتطلبات الدقيقة للبيئات البشرية.

يمكنك العثور على البحث المنشور هنا.

Alex McFarland هو صحفي وكاتب في مجال الذكاء الاصطناعي يستكشف أحدث التطورات في الذكاء الاصطناعي. وقد تعاون مع العديد من الشركات الناشئة في مجال الذكاء الاصطناعي والمنشورات في جميع أنحاء العالم.