قاده التفكير
نظرة على سباق الروبوتات الجديد: البيانات والنماذج والتصنيع

نادراً ما يظهر الابتكار بمعزل عن الآخرين. في أغلب الأحيان، يولد من خلال حوارات بين المهندسين والمؤسسين والباحثين والمستثمرين الذين يحاولون فهم إلى أين تتجه التكنولوجيا.
على مدار عام، حضرتُ عشرات المؤتمرات حول العالم. تستغرق رحلات العمل أحيانًا شهورًا، وتُعقد الاجتماعات مع الشركاء والعملاء في أماكن تمتد من آسيا إلى أمريكا الشمالية. إلا أن إحدى رحلاتي الأخيرة إلى سويسرا كانت مثيرة للاهتمام بشكل خاص، ويعود الفضل في ذلك إلى حد كبير إلى الناس والمحادثات التي دارت هناك.
أثبتت زيورخ أنها واحدة من الأماكن التي سيشهد فيها مستقبل الروبوتات و الذكاء الاصطناعي المادي يُناقش هذا الموضوع بنشاط اليوم. وكلما تعمقت هذه النقاشات، كلما اتضح أن السباق الحقيقي في مجال الروبوتات يدور حول البيانات.
وادي السيليكون في أوروبا
لطالما ارتبطت زيورخ بالقطاع المالي، لكنها باتت تُعرف في السنوات الأخيرة بوادي السيليكون الأوروبي. ويعود الفضل في هذه السمعة إلى حد كبير إلى جامعة ETH زيورخ، إحدى أعرق الجامعات الهندسية في أوروبا، والتي تستقطب الباحثين وطلاب الدكتوراه ورواد الأعمال والمهندسين من مختلف أنحاء العالم. ونتيجةً لذلك، نشأت بيئة تكنولوجية متطورة حول الجامعة، حيث تتطور الأبحاث والشركات الناشئة والمشاريع الصناعية بشكل متزامن تقريبًا.
كان أحد أسباب رحلتي هو الحصول على فهم أعمق لما متأمل يمكن أن يُسهم هذا في ازدهار سوق الروبوتات، الذي يشهد نموًا متسارعًا منذ بداية عام 2025. إنه قطاع تسعى فيه مجموعة واسعة من الشركات الناشئة إلى دخوله، بينما تُعيد الاختراقات التكنولوجية من كبرى شركات التكنولوجيا تشكيله بشكل فعّال. ومع ذلك، ورغم كل هذا الزخم، لا يزال هذا المجال يثير تساؤلات أكثر مما يُجيب.
كما أن زيورخ هي موطن لشركائنا برفق، الذي ساعدني في التعرف على زملاء يعملون في مجال يجمع بين الروبوتات ورؤية الحاسوب والذكاء الاصطناعي. هناك جانب مهم في بيئة التكنولوجيا المحلية أود تسليط الضوء عليه: يتميز الناس هنا بانفتاحهم وترحيبهم الكبيرين. فهم لا يترددون في مشاركة أفكارهم وفرضياتهم، والتحدث عن التحديات التي يسعون لحلها، والتجارب التي يجرونها. ونتيجة لذلك، تبدأ في فهم السياق الحقيقي للسوق والاتجاه الذي تسلكه الصناعة بسرعة أكبر.
بالمناسبة، عندما يسألني الناس عن الفرق بين "وادي السيليكون" الأوروبي والأمريكي، غالبًا ما تُفاجئهم الإجابة. في زيورخ، يبدو التوازن بين العمل والحياة أقوى بكثير: ممارسة الرياضة صباحًا، والعمل بتركيز خلال النهار بوتيرة هادئة ومثمرة، وقضاء الأمسيات في الجبال مع العائلة أو الاسترخاء ببساطة. أما في سان فرانسيسكو، فيسود شعور دائم بضرورة إثبات أنك تعمل بجد أكثر من أي شخص آخر. في زيورخ، الوتيرة مختلفة - أكثر استدامة. ومع ذلك، فإن مستوى الطموح التكنولوجي هنا لا يقل.
بيانات أفضل قبل روبوتات أفضل
كان من أبرز ما استخلصناه من هذه الرحلة ملاحظة بسيطة: يرغب الكثيرون اليوم في العمل في مجال الروبوتات. ولكن على الرغم من الاهتمام الكبير بهذا القطاع، لا تزال العديد من الفرق في مرحلة استكشافية، تحاول فهم الدور الذي يمكن أن تلعبه في الموجة الجديدة من الروبوتات والذكاء الاصطناعي الفيزيائي، وما هي المساهمة التي يمكنها تقديمها.
تتلاقى العديد من المحادثات في نهاية المطاف حول موضوع واحد: البيانات. اليوم، هذه الصناعة تفتقر إلى البيانات المتعلقة بمهام البراعة اليدويةأي المهارات الحركية الدقيقة. في هذا المجال، لا تزال قدرات الروبوتات محدودة للغاية. ما يفعله البشر بأيديهم بشكل شبه تلقائي - التقاط شيء ما، وتدويره، ووضعه بعناية في مكان ما، أو القيام بحركة بسيطة - لا يزال أحد أكثر المهام تحديًا للروبوتات.
يكمن مفتاح التقدم هنا في المقام الأول في مجموعات البيانات واسعة النطاق والمُجمّعة بشكل صحيح. اليوم، يُتحدث غالبًا عن مجموعات البيانات المُتمركزة حول الذات، المُسجلة من منظور الشخص الأول، حيث يلتقط النظام حركات الإنسان كما لو كان يقوم بها بنفسه. مع ذلك، عمليًا، يتضح أن مفهوم "مجموعة البيانات المُتمركزة حول الذات" نفسه قد يحمل معاني مختلفة تمامًا، ويطرح عددًا من التساؤلات التقنية. أين ينبغي وضع الكاميرا؟ على الجبهة، أم على الصدر، أم ربما على مستوى العين؟ ما هي أجهزة الاستشعار التي ينبغي استخدامها مع تسجيل الفيديو؟ إذا كنا نلتقط حركات اليد، فهل ينبغي على المشغلين استخدام قفازات خاصة؟ وإذا كان الأمر كذلك، فهل ينبغي أن تتضمن هذه القفازات مستشعرات لمسية، أو جيروسكوبات، أو أنظمة أخرى لتتبع الحركة؟
يبرز سؤال أكثر تعقيداً: كيف يمكن التقاط عمق الحركة بدقة؟ ففي نهاية المطاف، من المهم فهم ليس فقط موضع اليد في مستوى ثنائي الأبعاد، بل أيضاً كيفية تحركها عبر الفضاء ثلاثي الأبعاد - للأمام، للخلف، للأعلى، أو للأسفل.
حتى الآن، لم يتوصل القطاع إلى إجابة موحدة. ولهذا السبب، تقوم العديد من الفرق اليوم بتجربة تكوينات مختلفة لأجهزة الاستشعار، وطرق التسجيل، وتنسيقات مجموعات البيانات.
الأنظمة متعددة الوسائط
بمجرد أن يتحول الحديث إلى جمع البيانات في مجال الروبوتات، يبرز موضوع آخر سريعًا، ألا وهو أجهزة الاستشعار الإضافية والوسائط المتعددة، التي تُمكّن من رصد حركات الجسم، وحركات اليد، وتفاعلات الأشياء بدقة أكبر. كما أنها تُساعد في تقليل الأخطاء أثناء جمع البيانات.
عندما يُسجّل شخص ما أفعاله بالكاميرا، هناك دائمًا خطر أن يكون جزء من التسجيل غير قابل للاستخدام. قد تتحرك الكاميرا قليلًا، أو قد تكون زاوية التصوير غير صحيحة، أو قد يستدير المصوّر في الاتجاه الخاطئ عن طريق الخطأ، أو قد يؤدي حركةً بسرعة كبيرة. ونتيجةً لذلك، يُهمل جزء كبير من التسجيل. مثال بسيط: للحصول على ساعة واحدة من الفيديو القابل للاستخدام، غالبًا ما يحتاج المصوّر إلى تسجيل ساعتين تقريبًا من اللقطات الخام.
تساعد المستشعرات الإضافية في معالجة بعض هذه المشكلات. فحتى مع تحرك الكاميرا قليلاً، تُمكّن بيانات المستشعرات من إعادة بناء حركة اليد أو وضع الجسم في الفضاء. ونتيجةً لذلك، بدلاً من ساعتين من التسجيل، قد يستغرق الأمر ساعة وعشرين دقيقة تقريبًا للحصول على نفس كمية البيانات القابلة للاستخدام. وهذا يزيد بشكل ملحوظ من كفاءة جمع البيانات ويقلل من تكلفة إنشائها.
لذا، ليس من قبيل المصادفة أن تلاحظ العديد من الفرق اهتمامًا متزايدًا بتصنيف البيانات متعددة الوسائط. وقد أصبح هذا أحد أبرز الاتجاهات المرتبطة ارتباطًا مباشرًا بتطوير الروبوتات والذكاء الاصطناعي المجسد.
النقطة التالية هي تصنيف مجموعات البيانات هذه. لقد واجهنا أسئلة مماثلة في كيماكر عند العمل مع مجموعات بيانات العملاء في مجال الروبوتات: كيف ينبغي أن تبدو هذه التعليقات التوضيحية عمليًا؟ هل يجب أن تكون هيكلية؟ ثنائية الأبعاد أم ثلاثية الأبعاد؟ هل ينبغي دمج عناصر التعلم المعزز في مسار المعالجة؟ هناك عشرات من هذه الأسئلة. حتى المهندسون أنفسهم يقرّون بأنه لا يمكن لأحد حتى الآن الجزم بأي تكوين بيانات محدد سيؤدي في نهاية المطاف إلى طفرة تكنولوجية حقيقية.
هذه المخاوف مفهومة. فبناء مجموعات بيانات معقدة عملية مكلفة. كل خطأ في بنية البيانات قد يكلف آلافًا أو حتى ملايين الدولارات. من الممكن جمع مجموعة بيانات "خاطئة" أو تسجيلها في ظروف يصعب محاكاتها في الواقع، مما يقوض المشروع برمته. لهذا السبب تحديدًا، يُولى اليوم اهتمام متزايد لكل من النماذج نفسها وجودة البيانات وبنيتها التي تُدرَّب عليها هذه النماذج.
ما نوع الروبوتات التي يحتاجها السوق؟
لا تتطلب الروبوتات الصناعية التقليدية، التي تعمل في خطوط تجميع السيارات منذ عقود، سوى القليل من تقنيات الرؤية الحاسوبية أو نماذج الذكاء الاصطناعي المعقدة. مهمتها محددة للغاية: أداء حركات متكررة بدقة متناهية - يسارًا، يمينًا، أعلى، أسفل - بدقة وثبات عالٍ. في هذا المجال، تفوقت الروبوتات على البشر منذ زمن طويل.
أما الروبوتات الشبيهة بالبشر فهي فئة مختلفة تماماً. تتطلب هذه الأنظمة "عقولاً": القدرة على التنقل في الفضاء، وإدراك البيئة المحيطة، وفهم سياق الموقف، والتحكم في الأذرع ليس من خلال مسارات مبرمجة مسبقاً ولكن من خلال التكيف مع العالم الحقيقي.
على الرغم من المستوى العالي للأتمتة في المصانع الحديثة، لا يزال البشر يؤدون العديد من المهام. فنقل الأشياء، والتقاط الصناديق، وفرز القطع، وتثبيت المكونات، وتنظيم المواد، كلها أعمال بسيطة تتطلب مرونة وتنسيقًا. ولا يزال هذا المجال من أصعب المجالات التي يمكن أتمتتها، وهنا تحديدًا قد تجد الأنظمة الشبيهة بالبشر دورها.
تستخدم العديد من الفرق التي تحدثت معها نموذج عمل مماثلاً. إذ تتواصل هذه الفرق مع المصانع وتقترح حلولاً لمشكلة إنتاجية محددة. على سبيل المثال، قد يقضي عامل يومه بأكمله في نقل الصناديق بين مناطق المستودع. يقترح المهندسون تجربة بسيطة نسبياً: تزويد العامل بكاميرا ومجموعة من أجهزة الاستشعار، وتسجيل آلاف الساعات من عمله، واستخدام هذه البيانات لتدريب نموذج يتحكم بروبوت بشري. وبهذه الطريقة، يتعلم الروبوت أداء المهام التي يقوم بها العامل البشري بدقة متناهية.
باختصار، تشتري الشركة منصة روبوت بشري، بينما يقوم فريق التطوير ببناء نموذج مخصص يحاكي سلوك مشغل معين. هذا ليس ذكاءً شاملاً قادراً على حل أي مهمة، بل هو مجموعة من المهارات المدربة على سيناريو محدد أو مجموعة من مهام الإنتاج. بالنسبة للعديد من المهندسين اليوم، يبدو هذا النهج أكثر واقعية. فبدلاً من محاولة إنشاء روبوت شامل على الفور، تركز الفرق على سيناريوهات أتمتة محددة ولكنها مجدية اقتصادياً.
البعد التجاري
إذا كان المستقبل يكمن في النماذج المصممة حسب الطلب، فمن المهم أن نفهم أنه من منظور اقتصادي، فإن هذا مسار تطوير طويل إلى حد ما.
كل صناعة تُعتبر عالماً قائماً بذاته. ولكل بيئة إنتاج عملياتها وسير عملها واستثناءاتها الخاصة. لا يمكن ببساطة نقل روبوت مُدرَّب على العمل في مصنع سيارات إلى مصنع أغذية أو مستودع لوجستي. في كلتا الحالتين، يجب إعادة تدريب النظام من الصفر.
وهذا يقودنا إلى السؤال المنطقي التالي: من سيكون أول عملاء هذه التقنية؟
في هذه المرحلة، من المرجح أن تكون الشركات الكبيرة هي المستفيد الرئيسي من هذه التقنية، أي تلك التي تملك الميزانيات اللازمة والتي يمكن أن تُحدث الأتمتة فيها أثراً اقتصادياً ملموساً. اليوم، تتراوح تكلفة الروبوت الشبيه بالإنسان بين 60,000 و90,000 دولار أمريكي للأجهزة فقط. وهذا يمثل التكوين الأساسي فقط. إضافة إلى ذلك، هناك تكاليف الصيانة والبطاريات ومحطات الشحن والبنية التحتية والبرمجيات.
ونتيجة لذلك، فإن الشركات الأكثر قدرة على تجربة مثل هذه الأنظمة هي المنظمات الكبيرة، ومصنعي السيارات، وشركات الأغذية، والمؤسسات الصناعية الكبرى.
بالطبع، قد تشهد القطاعات الأصغر أيضاً بعض الرواد الأوائل. قد تشتري بعض الشركات روبوتاً أو اثنين لمهام محددة. مع ذلك، في معظم الحالات، لا تكون هذه الشركات مستعدة لاستثمار مئات الآلاف من اليورو في جمع وتصنيف مجموعات البيانات المخصصة اللازمة لتدريب الأنظمة على سيناريوهات تشغيلية بالغة التخصص. بالنسبة لها، يبقى العمل البشري الخيار الأرخص.
لعبة الابتكار الروبوتي على المدى الطويل
نصل في النهاية إلى سؤال اقتصادي أساسي: ما هو الأكثر كفاءة - الإنسان أم الروبوت؟ إذا نظرنا إلى اقتصاد اليوم، فإن الإجابة واضحة: العمل البشري أرخص، ويتكيف بسرعة أكبر مع الظروف الجديدة، ولا يتطلب بنية تحتية معقدة.
فلماذا تستمر الصناعة في الاستثمار في الروبوتات اليوم؟ الجواب استراتيجي إلى حد كبير.
تُدرك العديد من الشركات أن سباقاً محموماً نحو الريادة التكنولوجية جارٍ على قدم وساق. وهي تعمل بالفعل على تطوير حلول، رغم التكاليف الباهظة، لتكون في الصدارة عندما تتغير اقتصاديات الروبوتات.
مع تطور الإلكترونيات، وانخفاض تكاليف المكونات، وتحسن كفاءة الحوسبة، ستصبح الروبوتات بلا شك في متناول الجميع. وعندها، ستكون الأفضلية للشركات التي سبق لها بناء نماذج، وجمع البيانات، وإنشاء البنية التحتية التكنولوجية اللازمة.
تخيل، على سبيل المثال، ظهور قوانين جديدة تسمح باستخدام الروبوتات الشبيهة بالبشر على نطاق واسع في التصنيع. أو أن تبدأ الحكومات بدعم أتمتة الصناعات. في مثل هذا السيناريو، قد ينمو السوق بشكل هائل في غضون سنوات قليلة. وسيكون المستفيدون الأكبر هم أولئك الذين استعدوا مسبقًا، والذين يمتلكون نماذج وأبحاثًا ومجموعات بيانات وبنية تكنولوجية جاهزة.
لهذا السبب يستمر التطوير حتى الآن، على الرغم من أن الجدوى الاقتصادية قد لا تبدو مثالية بعد. بالنسبة للعديد من الشركات، يُعدّ هذا استثمارًا في المستقبل، في اللحظة التي تصبح فيها التقنيات أكثر سهولة في الوصول إليها، ويزداد الطلب عليها بشكل حاد.
وفي هذا السباق، كما هو الحال في العديد من الثورات التكنولوجية، غالباً ما يكون هناك عامل حاسم: من بدأ أولاً. وبهذا المعنى، يشبه علم الروبوتات اليوم إلى حد كبير المراحل الأولى للذكاء الاصطناعي. في ذلك الوقت، كانت الأسئلة أكثر من الأجوبة. ومع ذلك، فإن الفرق التي بدأت العمل مع البيانات والبنية التحتية قبل غيرها هي التي شكلت في نهاية المطاف مسار الصناعة بأكملها.












