قاده التفكير
عصر الإنسان الآلي لم يأتِ بعد، بل هو هنا بالفعل

في وقت سابق من هذا الشهر، في الصين، تم إطلاق روبوت على شكل إنسان يُدعى تولى شوانغ شوانغ المسرح في حفل تخرج مدرسة ثانوية في فوجيان لاستلام الشهادات، صافح الطلاب والمعلمين وأسعدهم على حد سواء. تُمثل لحظات كهذه تحولاً جوهرياً، إذ بدأت الروبوتات الشبيهة بالبشر تدخل الحياة العامة بطرق جلية.
هذه اللحظات تُثير أكثر من مجرد فضول عام، بل تُشير إلى تحول نحو التكامل في العالم الحقيقي. يستكشف هذا المقال كيف تنتقل الروبوتات من كونها مجرد عرضٍ مسرحي إلى كونها عملية، ولماذا ما يبدو إنجازًا يعتمد على الأجهزة فقط، هو في الواقع ذكاءٌ مُتكامل يُمكّن هذه الآلات من المشي والتفاعل والتعلم في بيئات غير مُصممة للأتمتة. سنناقش أيضًا كيف نُقارب التسويق التجاري من خلال النشر المُبكر والشراكات طويلة الأمد.
كيف يدفع البشر الذكاء الاصطناعي إلى العالم الحقيقي
لا تزال الفجوة بين الأداء الافتراضي والموثوقية المادية من أكثر التحديات التي يُغفل عنها في مجال الذكاء الاصطناعي. يستطيع روبوت المحادثة إنشاء فقرات نصية سلسة دون الحاجة إلى التفاعل معها، تمامًا كما يستطيع نموذج الرؤية تحديد خطوة في صورة ما دون الحاجة إلى التنقل فيها جسديًا أو المخاطرة بالسقوط. أما الروبوتات البشرية فلا تتمتع بهذه الرفاهية.
لكي يعمل الذكاء الاصطناعي في العالم الحقيقي، عليه أن يتخلى عن قواعد البيانات الثابتة والظروف المُتحكم بها. عليه أن يرى ويتخذ القرارات ويتصرف في بيئات متغيرة باستمرار. يشمل ذلك الأرضيات غير المستوية، والأشياء غير الموضوعة في أماكنها الصحيحة، والسلوك البشري غير المتوقع، والإشارات غير اللفظية المرتبطة بالسياق. والنتيجة هي مواجهة يومية مع الضوضاء والغموض واحتمال الفشل.
هنا يبدأ التفكير المتجسد - حيث ترتكز اللغة على المكان والزمان والعواقب - في أن يصبح أكثر أهمية من التنبؤ الرمزي. على سبيل المثال، إذا قال إنسان "احذر، إنه زلق"، يحتاج الروبوت إلى ربط هذه العبارة ليس فقط بتعريف الكلمة، بل أيضًا بالوعي المكاني، والمخاطر المحتملة، والتعديلات الفورية.
في الوقت نفسه، يُصبح التعلم متعدد الوسائط ضروريًا، إذ لا توجد قناة إدخال واحدة موثوقة بما يكفي للعمل بمفردها. قد تخطئ الكاميرا في رصد سطح زلق، لكن مستشعرات الضغط في القدم قادرة على رصد فقدان مفاجئ للثبات. أو، في حالة أخرى، قد يفشل التعرف على الكلام في مستودع صاخب، لكن الإشارات أو الإيماءات البصرية قادرة على سد هذه الفجوة.
يصبح التعميم أيضًا بالغ الأهمية. لا يمكن للروبوت الاعتماد على رؤية البيئة المحيطة مرتين. عليه أن يُكيّف سلوكه عندما تكون الأرضية مبللة، أو تتغير الإضاءة، أو عندما لا يكون الصندوق في مكانه السابق. وهذا ما يُشكّل الفرق بين التنفيذ الناجح والفشل.
في هيومانويد، لهذا السبب نبدأ الاختبارات مبكرًا مع شركائنا التجاريين. ندمج روبوتاتنا في بيئات حية لاكتشاف العيوب المحتملة بسرعة وضمان الأداء الأمثل قبل النشر. الروبوت الذي يُبلي بلاءً حسنًا في المحاكاة أو العرض التوضيحي يختلف عن الروبوت الذي يكتسب ثقةً تحت الضغط، لأن هذه الثقة تُبنى في النهاية على التعلم من العالم الواقعي.
نعلم أن الروبوتات البشرية ستتوفر تجاريًا خلال العامين المقبلين، لكننا لا ننتظر. بالنسبة لنا، يبدأ التسويق مبكرًا. هذا يعني بناء شراكات طويلة الأمد حول حالات استخدام حقيقية. من خلال سلسلة من البرامج التجريبية، لا نُعلّم شركائنا حول هذه التقنية فحسب، بل نتعلم معهم أيضًا. تساعدنا عملية التعلم المشتركة هذه أيضًا على تحسين هياكل التكلفة وموثوقية الأداء منذ البداية، مما يضمن أفضل تكلفة إجمالية ممكنة للملكية (TCO) مع توسع الأنظمة.
لماذا تعتبر الكائنات البشرية بمثابة الاختبار الأمثل للذكاء العام؟
العالم الذي صنعناه على مدى المئة عام الماضية مُصممٌّ ليناسب حجم الإنسان. مقابض الأبواب، والرافعات الشوكية، والمستودعات - كل شيءٍ له أبعادٌ ونطاقات حركةٍ مُحددة، وسلوكيات اجتماعية ضمنية. يجب على الكائنات البشرية أن تتكيف مع هذا الواقع، وإلا ستُصبح وظائفها محدودةً للغاية.
للصعود إلى الطابق العلوي، أو حمل شيء ما، أو تفسير إشارة، أو تمييز التردد في الصوت، يجب على الروبوت فهم السياق بما يتجاوز بكثير التصنيف البصري أو تخطيط الحركة المبرمج. يجب عليه استنتاج النية، وتعلم مهمة جديدة من خلال مراقبة الإنسان، وتكييف هذه المهارة مع تصميم مختلف قليلاً، وتحسين أدائه بمرور الوقت. عمليًا، يُوسّع هذا النظام نطاق قدرات الذكاء الاصطناعي في ظل قيود حقيقية.
في هيومانويد، نُسرّع هذه العملية من خلال التشغيل عن بُعد. في المراحل الأولى من التطوير، يُوجّه مُشغّلون بشريون الروبوت لأداء مهام رئيسية. تُصبح هذه البيانات العملية أساسًا لتدريب سلوكيات جديدة. مع مرور الوقت، تُغذّي هذه العروض التوضيحية نماذجنا الشاملة، مما يُساعدنا على بناء استقلالية موثوقة.
من الأنظمة الضيقة إلى الذكاء المتكامل
تتفوق معظم أنظمة الذكاء الاصطناعي اليوم في مهام محدودة. كلٌّ منها يعمل بكفاءة عند عزله. لكن الروبوتات البشرية لا تحتاج إلى متخصصين منفصلين. لكي ندمجها بنجاح، نحتاج إلى أنظمة قادرة على التفكير عبر مختلف الوسائط والجداول الزمنية.
قد يتلقى الإنسان الآلي تعليمات غامضة نسبيا - "اذهب وأحضر لي الصندوق الأصفر من غرفة التخزين عبر الردهة" - ويجب عليه فك شفرتها إلى سلسلة من المهام الفرعية: تحديد موقع المتحدث، والتنقل في الممر، وتحديد الصندوق الصحيح، وضبط قوة القبضة، وتجنب الاصطدامات، وبالطبع العودة بأمان.
يتضمن كل جزء من هذا التسلسل نظامًا فرعيًا مختلفًا - الرؤية، والحركة، واللغة، والتلاعب، والتغذية الراجعة. وتعتمد موثوقية هذا النظام على مدى كفاءة تواصل هذه الأجزاء في ظل الظروف المتغيرة.
تُعدّ الهندسة المعمارية المعيارية وسيلةً لمواجهة هذا التحدي. فهي تُمكّننا من العمل على الأنظمة الفرعية بشكلٍ مستقل مع الحفاظ على التنسيق على مستوى النظام. كما تُمكّننا من توسيع نطاق الإمكانيات عبر بيئات متعددة دون الحاجة إلى إعادة البناء من الصفر. وهكذا ننتقل من العروض التوضيحية المغلقة إلى أداءٍ في عالم مفتوح.
إن المخاطر هائلة - وهي عالمية
من السهل تصوير الروبوتات البشرية على أنها مستقبلية. لكن عندما نتحدث مع عملائنا، تكون الحاجة ملحة. العديد من المستودعات وخطوط التجميع وغيرها من مواقع العمل، التي كانت مكتظة في السابق، تكافح الآن للحفاظ على كوادرها.
إن نقص العمالة هذا يُمثل مشكلة ديموغرافية. ففي اليابان، ما يقرب من 30% من السكان يزيد عمرهم عن 65 عامًافي أوروبا، هناك قطاعات رئيسية - والتي لديها مجتمعة رواتب بقيمة 1.7 تريليون دولار - هم النضال من أجل توظيف عمال أصغر سناهذه ليست الأدوار التي يريدها معظم الناس، وبشكل متزايد، ليست الأدوار التي يرغب الناس في القيام بها.
بفضل دورهم كمساعدين، لا كبدائل، يمكن للروبوتات البشرية القيام بمهام تتطلب جهدًا بدنيًا كبيرًا، أو متكررة، أو خطيرة - مثل نقل المخزون، وتحميل المنصات، وتشغيل الآلات - دون التعرض لخطر التعب أو الإصابة. وهذا يُتيح للعمال التركيز على جوانب أكثر تعقيدًا وإبداعًا وتفاعلًا مع الآخرين في العمل.
علاوة على ذلك، يُعزز هذا مرونة الاقتصاد على المدى الطويل. فعندما تكون العمالة متقلبة أو غير متوفرة، يُمكن للآلات الذكية أن تُساعد في ضمان الاستمرارية، دون المساس بالسلامة أو الجودة أو القدرة على التكيف.
من الجوانب الأخرى الجديرة بالاهتمام الإطار التنظيمي. معظم الفرق - وخاصةً في الولايات القضائية ذات التنظيم المرن - تنتظر التفكير في هذا الأمر. بدأنا من هناك. تُعدّ قوانين السلامة والبيانات الأوروبية من بين الأشد صرامةً في العالم، ولكن بدلًا من اعتبارها عقبات، نعتبرها ميزة تنافسية لنا. مع اعتماد أسواق أخرى للوائح أكثر صرامة، سنكون مستعدين لمواجهتها، بينما قد تُسارع شركات أخرى إلى ذلك.
سباق جديد للذكاء الاصطناعي - ولكن ليس السباق الذي تظنه
يتمحور جزء كبير من النقاش الدائر حول الذكاء الاصطناعي اليوم حول قوة الحوسبة والمعايير وبيانات التدريب. لكن الاختراق الحقيقي قد يأتي من آفاق مختلفة: التكامل في العالم المادي. هناك، يجب أن يتعلم الذكاء الاصطناعي كيفية الأداء، بدلاً من مجرد التنبؤ.
في هذا الصدد، يدور السباق حول النظام الأكثر كفاءة - نظام قادر على العمل في الأماكن العامة، مع مراعاة معايير السلامة، وبمشاركة بشرية. هذا النظام، بالإضافة إلى التعلم من البيانات، سيتعلم أيضًا - وخاصةً - من الواقع، ويعمل جنبًا إلى جنب مع الناس دون تعطيل سير الأمور.
لهذا السبب، لا ننتظر حتى بدء النشر. منذ البداية، نعمل مباشرةً مع شركائنا التجاريين لدمج النظام في بيئات حقيقية، مما يضمن تحسين النظام في الجوانب الأكثر أهمية: عمليًا.
هذا النوع من التعلم الواقعي هو بالضبط ما تعجز عنه الأنظمة المحدودة. مع أنها قد أوصلتنا إلى آفاق جديدة، إلا أنها لم تُصمَّم قط لهذا النوع من التعقيد. تتطلب الكائنات البشرية شيئًا آخر - التنسيق والمتانة، وكما ذُكر، القدرة على التعلم من المفاجآت.
هذه هي الفرصة الهائلة أمامنا. ليس أتمتة كل شيء، بل بناء آلات قادرة على فهم العالم البشري والتنقل فيه والتعاون معه.












