Connect with us

تعلمنا الروبوتات الحركة، والآن نعلمها الحياة

قادة الفكر

تعلمنا الروبوتات الحركة، والآن نعلمها الحياة

mm

لقد وصلت الروبوتات الحديثة إلى مرحلة حيث لم يعد الحرك هو التحدي الرئيسي – يمكن للأجهزة الميكانيكية بالفعل التنقل والقبض والعمل في الفضاء بدقة مثيرة للإعجاب. ومع ذلك ، فإن تمكينها من “العيش” والعمل في العالم الحقيقي لا يزال مشكلة غير محلولة.

في هذه العملية ، يلعب الدور الرئيسي ما يمكن تسميته بـ “الحبل الشوكي” : النظام المسؤول عن ردود الفعل الأساسية والسلوك والتفاعل مع البيئة.

عندما ننظر إلى تطور الروبوتات من خلال هذا المنظور ، يصبح من الواضح أن هذه التسلسل من المراحل – حيث يتعلم النظام شيئًا جديدًا في كل خطوة ، من الحركة البسيطة إلى الإجراءات المعقدة التي تدرك السياق – يشبه بشكل وثيق التطور البشري.

وهو بالضبط في هذا التطور – من “الأجهزة الفارغة” إلى السلوك المهم – حيث يحدث التحول الرئيسي في الذكاء الاصطناعي المادي اليوم. من المثير أن نتعلم المزيد عنه بعمق.

أساس الروبوتات: مرحلة نادرة المناقشة

ما هو الروبوت في المصطلحات العملية؟ إنه جهاز مادي تم إنشاؤه في الأصل كمنصة عالمية. في جوهره ، إنه “فارغ” يجب تعديله لاحقًا لمهام محددة ، وتم تدريبه على العمل في بيئة معينة ، وتعليمه على أداء الإجراءات المطلوبة.

إذا انتقلنا إلى ما وراء السيناريوهات اليومية ونتصور تطبيقات أكثر واقعية في المستقبل القريب ، يصبح من الواضح أن اعتماد الروبوتات سوف يحدث في الغالب في البيئات الصناعية والمتعرضة للخطر. وهذا بدوره يعني متطلبات أعلى بكثير لسلوكهم ومتانتهم وجودة تدريبهم.

ال عملية تبدأ من الخطوة الأساسية – بناء الجهاز نفسه. يتم تجميع الروبوت من مكونات متعددة ، بما في ذلك المحركات والمرسلات والكاميرات ومستشعرات LiDAR. يمكن أن يكون بشريًا أو على عجلات أو ثنائي القوائم أو رباعي القوائم – عامل الشكل ثانوي. ما يهم هو أننا في هذه المرحلة ، ننتهي بنهاية مع جهاز يعمل ولكن لا يزال “فارغًا”.

المرحلة التالية هي تثبيت نموذج أساسي يخدم كأساس لسلوكه. في معنى واسع ، “النموذج” هو طبقة التحكم الوظيفية بأكملها. إنه مسؤول عن القدرات الأساسية: الحفاظ على التوازن ، والوقوف والحركة ، والتنقل من نقطة إلى أخرى ، وتجنب العوائق ، وعدم إتلاف البيئة ، والتفاعل بأمان مع البشر.

هنا يأتي دور التعلم التعزيزي. في مثل هذه الأنظمة ، يتم تشغيل مليارات المحاكاة. غالبًا ما نرى مقاطع فيديو لروبوتات “تعلم” في بيئات معقدة: معظمهم يسقط أو يفقد التوازن أو يفشل في إكمال المهمة. لكن أولئك الذين ينجحون في البقاء منتصبين ويستمرون في الحركة هم الذين يتقدمون.

هذا هو جوهر التعلم التعزيزي: اختيار السلوك الناجح. خوارزميات أولئك الذين “يبقون على قيد الحياة” تصبح أساسًا للiterations التالية. ونتيجة لذلك ، بعد عدد هائل من التشغيل ، يظهر نموذج يمكنه التعامل بثقة مع العوائق. ثم يتم نقل هذا الخوارزمية إلى الجهاز المادي.

هذه مرحلة معقولة ومع ذلك حرجة – غالبًا ما تتضمن القليل من رؤية الكمبيوتر ، والتي لا تكون ضرورية في هذه النقطة. ما نتعامل معه هنا هو الفيزياء الأساسية والآليات التي يجب دمجها في النظام من البداية.

كيف تبدأ الروبوتات “تشعر” بالعالم

لذلك ، لدينا بالفعل “الأجهزة” – روبوت مع نموذج أساسي مثبت: يمكنه الوقوف والمشي والحفاظ على التوازن. لكن هل هذا كافٍ لمهام العالم الحقيقي ، على سبيل المثال ، في البيئات الصناعية؟ واضح أن لا.

تبدأ المرحلة التالية هنا. ندمج المستشعرات وندرب النموذج على التصرف بناءً على المدخلات الحسية. تظهر طبقة جديدة من المهارات الأساسية – بالفعل أكثر تعقيدًا من الحركة البسيطة.

التناظر مع التطور البشري مفيد هنا. في المرحلة الأولى ، أعدنا النظام إلى مستوى الطفل الذي يبلغ من العمر عامًا واحدًا: يمكنه الوقوف ، اتخاذ خطواته الأولى ، والحفاظ على التوازن دون السقوط. الخطوة التالية أكثر في خطوة مع مستوى طفل يبلغ من العمر ثماني سنوات.

في هذا العمر ، يستخدم الطفل نشطًا “مستشعراته”: يمكنه استشعار الخطر وتقييم عواقب أفعاله. يفهم عدم لمس شيء ساخن أو وضع شيء بارد جدًا في فمه. يمكنه الصعود إلى طاولة ، ركوب دراجة ، والتفاعل مع الأشياء. إنه قادر على الإمساك والتحمل والتعامل مع الأشياء وأداء الإجراءات الأساسية للعناية الذاتية.

نسمي هذه المرحلة التدريب المسبق. وفي هذه النقطة ، لم يعد المحاكاة كافية وحدها.

نعم ، يمكن نمذجة بعض السيناريوهات بشكل فعال: كيفية التقاط كأس ، أو استبدال بطارية ، على سبيل المثال ، إزالة مكون واحد ، ووضعه على الشحن ، أخذ آخر ، وتثبيته مرة أخرى.

لكن بشكل عام ، يتحول التوازن: حوالي 80٪ من التدريب يمكن أن يحدث لا يزال في المحاكاة ، بينما يجب أن يأتي حوالي 20٪ من البيانات من العالم الحقيقي. وهنا نبدأ في مناقشة البيانات المركزية.

بيانات المركز كأساس لفهم البيئة

اليوم ، يتم جمع بيانات المركز بكمية هائلة في جميع أنحاء العالم – لأنه بدون ذلك ، من المستحيل الانتقال من الميكانيكا الأساسية إلى التفاعل المهم مع العالم الحقيقي. زميل لي ، الذي يدير شبكة من محلات إصلاح السيارات ، لديه موظفون يستخدمون كاميرات مثبتة على الرأس لتسجيل عملية إصلاح السيارة بأكملها. مالك مبنى في مدينة نيويورك نفذ نهجًا مشابهًا: يرتدي موظفو التنظيف كاميرات مثبتة على الجبين التي تقوم بتسجيل كيفية تنظيف الفراغات والحفاظ على المناطق الصحية.

بمرور الوقت ، تصبح هذه التسجيلات منتجًا مستقلًا – يتم تجميعها وبيعها. قيمتها الرئيسية تكمن في ملاءمتها لمرحلة التدريب المسبق ، مما يساعد في بناء فهم أساسي للبيئات وتسلسلات الإجراءات.

على سبيل المثال ، كان هناك خدمة موجودة في Keymakr ، حيث أنشأت الفريق بشكل مستقل مجموعات كاملة من بيانات المركز من سيناريوهات بسيطة مثل غسل الأطباق إلى سيناريوهات أكثر تعقيدًا.

لماذا هذا مهم؟ لأن هذه البيانات توفر شيئًا لا يمكن للمحاكاة النقية تقديمه – تنوع البيئات الحقيقية. المكاتب وورش إصلاح السيارات ومواقع البناء والمطاعم والفنادق – كل منها يضيف سياقه الخاص وسيناريوهاته ودوافعه. معًا ، يشكلون مجموعة بيانات تسمح للنظام ليس فقط “رؤية” ، ولكن أيضًا بدء فهم ديناميات العالم الحقيقي.

في هذه المرحلة ، الهدف لم يعد تعليم روبوت لتنفيذ إجراء معين بشكل مثالي. ما يهم أكثر هو تمكينها من التوجه في محيطها في المقام الأول.

اليوم ، تقريبًا جميع الشركات التي تعمل في مجال الروبوتات – من Tesla إلى Unitree Robotics و Figure AI – تركز على هذه المرحلة بالذات. هدفهم بناء نموذج أساسي ي似قابليته تلك الخاصة ب “طفل يبلغ من العمر ثماني سنوات” ، ثم التقدم نحو “طفل يبلغ من العمر اثني عشر عامًا”. هذا ما نركز عليه في Introspector – إعداد البيانات المطلوبة للتدريب المسبق ، المرحلة الأكثر أهمية في “وصول الروبوتات الحديثة إلى سن الرشد”.

المرحلة الأخيرة من التدريب: حيث تنتهي الشمولية وتبدأ التخصص

لنفترض أن الروبوت قد أكمل بالفعل التدريب المسبق وتم تصنيعه من البداية مع فهم أساسي للعالم ومجموعة من المهارات قابلة للمقارنة مع تلك الخاصة بمراهق.

لكن حتى هذا لا يزال غير كافٍ لاستخدامات الأعمال الحقيقية. الشركات لا تحتاج إلى روبوت “محدد الغرض” فقط – تحتاج إلى متخصص.

خذ صناعة السيارات على سبيل المثال. لا يزال بعض الإجراءات يتم تنفيذها من قبل البشر لأنها تتطلب حساسية ودقة ومراقبة بصرية مستمرة. يصعب على الأتمتة التقليدية التعامل مع هذا. يتفوق المناور الصناعي في المهام المتكررة والصلبة – “اختيار ، تحريك ، وضع”. لكن الإجراءات التي تتطلب مرونة وحساسية الضغط والتكيفات في الوقت الفعلي لا تزال في نطاق البشر.

هنا يظهر الطلب الجديد: تدريب روبوت على أداء عملية محددة بالضبط مثل عامل ماهر على خط الإنتاج. بعبارة أخرى ، بعد التدريب الأساسي يأتي المستوى التالي: التدريب على مهنة وموضوع محددين.

في هذه النقطة ، يظهر سؤال عملي: ما الذي يُطلب لمرحلة التدريب هذه؟ إذا كنا نريد روبوتًا ليتكرر أداء الإنسان ، فنحن بحاجة إلى التقاط سلوك الإنسان بدقة. على سبيل المثال ، يجب على الخبير على أرضية المصنع ارتداء كاميرا وتسجيل كيفية أداء المهمة على مدار فترة زمنية طويلة ، أشهر أو حتى عام.

ما يُتطلب لروبوتات “تعيش” في العالم البشري

الكاميرا وحدها لا تكفي. من الضروري التقاط ليس فقط المنظور البصري ولكن أيضًا فيزياء الحركة. يتم القيام بذلك باستخدام قفازات متخصصة مع مستشعرات تكتيلية تقيس الضغط والقوة المطبقة وطبيعة التفاعل مع الأشياء. هذا مهم بشكل خاص لأن الأشياء نفسها يمكن أن تختلف بشكل كبير. على سبيل المثال ، قد تختلف شريط الحشو في صلابة حسب طراز السيارة ، مما يؤثر مباشرة على كيفية أداء المهمة.

يأتي بعد ذلك تتبع الحركة. يتم وضع علامات – بصرية أو قائم على المستشعر – على المعصم والكوع وأحيانًا الكتف. يمكن أن تشمل هذه ، على سبيل المثال ، سوارات مع علامات قابلة للتعرف (مثل رموز QR) التي تسمح للنظام تتبع موقع اليد في الفضاء من الفيديو. يتم استخدام مستشعرات إضافية ، مثل الجيروسكوب ، لتقاط حركات المفاصل.

الهدف النهائي هو إعادة بناء ميكانيكا الحركة بالكامل: كيف يتحرك الكتف ، وكيف ينحني الكوع ، وكيف يدور المعصم. كل هذا يصبح ضروريًا لمرحلة ما بعد التدريب.

إذا كان يمكننا خلال التدريب المسبق依赖 جزئيًا على المحاكاة ، في هذه المرحلة ، لم يعد ذلك يعمل. هذه “المرحلة الأخيرة”几乎 من المستحيل نمذجتها بدقة. لا يمكنك محاكاة ، على سبيل المثال ، كيفية طي الشيف العجين – القوة المطبقة ، وكيف يتم توزيع الضغط ، وكيف يتم الشعور بالمادة.

لذلك ، خلال التدريب بعد التدريب ، يجب أن تأتي几乎 جميع البيانات من العالم الحقيقي. وهنا يصبح من الواضح: يتحول التحدي الرئيسي إلى النطاق العملي – كيفية الحصول على مثل هذه البيانات في الواقع. جمع بيانات المركز على هذا المستوى هو عملية معقدة متعددة الخطوات تتضمن الوصول إلى البيئات والمعدات المتخصصة ومشاركة العمال المهرة والتحضير اللاحق للبيانات.

عندما ننظر إلى ما وراء النظرية ، يصبح من الواضح هنا: هذا هو المكان الذي “تأتي فيه الروبوتات إلى الحياة” – بعد أن ننجح في تنظيم هذه العملية ، وتحقيق التحديات التي تواجهها الفرق عبر الصناعات ، وتعليم مجموعات البيانات على نطاق واسع. سوف يتم تغطية هذا في الجزء التالي ، حيث سوف نلقي نظرة أقرب على جميع التحديات التي تظهر أثناء تعليم وتنظيم هذه المجموعات.

مايكل أبراموف هو المؤسس والرئيس التنفيذي لشركة Introspector، حيث يُحضر أكثر من 15 عامًا من خبرة هندسة البرمجيات وأنظمة الذكاء الاصطناعي للرؤية الحاسوبية لبناء أدوات تعليمية من الدرجة الأولى للمشاريع.

مايكل بدأ مسيرته المهنية كمهندس برمجيات ومدير أبحاث وتطوير، حيث بنى أنظمة بيانات قابلة للتطوير وإدارة فرق هندسية متعددة الوظائف. حتى عام 2025، شغل منصب الرئيس التنفيذي لشركة Keymakr، وهي شركة تقدم خدمات تعليم البيانات، حيث رائد في تدفقات العمل التي تضم الإنسان في الحلقة، ونظم جودة متقدمة، وأدوات مخصصة لدعم احتياجات البيانات الكبيرة للرؤية الحاسوبية والاستقلال.

يحمل شهادة البكالوريوس في علوم الحاسوب و背景 في الهندسة والفنون الإبداعية، مما يمنحه منظورًا متعددي التخصصات لحل المشكلات الصعبة. مايكل يعيش على تقاطع الابتكار التكنولوجي والقيادة المنتج الاستراتيجية والأثر العالمي الحقيقي، حيث يدفع إلى الأمام الحدود الجديدة لأنظمة الحوسبة الذكية والآلية الذكية.