الذكاء الاصطناعي
التفكير على الطريق: هل يمكن لشركة NVIDIA حل مشكلة الحالات الحدودية في السيارات ذاتية القيادة؟

لقد أحرزت المركبات ذاتية القيادة تقدمًا ملحوظًا خلال العقد الماضي، حيث جمعت ملايين الأميال وأدت بشكل جيد على الطرق السريعة، في مناطق الاختبار الخاضعة للرقابة، وفي مناطق حضرية محددة. ومع ذلك، فإن القيادة في العالم الحقيقي لا تزال تكشف عن قيود حرجة حتى في عام 2026. على سبيل المثال، لا تزال منعطفات اليسار غير المحمية أثناء هطول الأمطار الغزير، ومناطق البناء مع علامات مسارات مبهة أو مفقودة، وتنظيمات تقاطعات حيث يستخدم موظفو الطوارئ إشارات يدوية مؤقتة، وتعرض أنظمة القيادة الذاتية المتقدمة للتحدي.
لا تمثل هذه المواقف حالات شاذة نادرة يمكن حلها بمجرد زيادة كمية البيانات. بل تبرز مشكلة أعمق في تقنية المركبات ذاتية القيادة الحالية. تكون الأنظمة الحديثة قادرة على كشف الأجسام وتنظيم البيئة، ومع ذلك، تعاني من صعوبة في التفكير في الأحداث المستقبلية، وتفسير نوايا مستخدمي الطريق الآخرين، واتخاذ قرارات حساسة للسياق. وبالتالي، فإن الإدراك وحده غير كافٍ لضمان السلامة في السيناريوهات المعقدة وغير المتوقعة.
للتغلب على هذا التحدي، قدمت شركة NVIDIA نظام Alpamayo في معرض CES 2026. يتكون هذا النظام من عائلة من نماذج الرؤية واللغة والعمل المفتوحة التي تدمج طبقة تفكير صريحة فوق الإدراك. من خلال الجمع بين الإدراك والتفكير، يسمح نظام Alpamayo للسيارات بالتنقل في مواقف القيادة النادرة والمعقدة بأمان أكبر، مع تقديم تفسيرات يمكن تفسيرها لكل قرار. وبالتالي، يمثل خطوة كبيرة نحو الأنظمة الذاتية التي يمكنها التفكير والتوضيح والتكيف بدلاً من مجرد الملاحظة.
فهم مشكلة الحالات الحدودية في القيادة الذاتية
تعد الحالات الحدودية واحدة من أكثر المشاكل تعقيدًا في السيارات ذاتية القيادة. هذه هي المواقف النادرة التي يعتمد فيها الإجراء الأكثر أمانًا على سياق دقيق، وقواعد اجتماعية غير مكتوبة، وتفاعلات في الوقت الفعلي مع مستخدمي الطريق الآخرين. على سبيل المثال، قد يوجه راكب دراجة هوائية سيارة عبر تقاطع حتى لو كان لديه الحق في المرور. أو قد تحتوي منطقة البناء على علامات مسارات مبهة أو مفقودة تتعارض مع مخروطات مؤقتة. لا تحدث هذه المواقف بشكل متكرر، ربما مرة واحدة كل بضع آلاف ميل، ولكنها تسبب نسبة كبيرة من حوادث السلامة وأخطاء النظام.
تظهر تقارير انقطاع كاليفورنيا لعام 2024 هذا بوضوح. عبر 31 شركة مركبة ذاتية قيادة مرخصة، قادت أكثر من 2800 سيارة اختبار مئات الآلاف من الأميال. ومع ذلك، حدثت العديد من الفشلات في تخطيطات طرق غير عادية، أو التحكم في المرور المؤقت، أو عندما كان سلوك الإنسان غير متوقع. هذه هي بالضبط المواقف النادرة التي ت투غها النماذج التقليدية للقيادة الذاتية. يمكن للبشر التنقل فيها باستخدام الخبرة والتفكير السريع والقضاء في اللحظة.
تعد تقنية القيادة الذاتية الحديثة جيدة جدًا في الإدراك. يمكن للنظم كشف المركبات ودراجات الهوائية والراكبين وعلامات المرور بدقة عالية باستخدام الكاميرات والليزر والرادار. بالإضافة إلى ذلك، تحول النماذج من النهاية إلى النهاية بيانات الحس إلى أوامر التوجيه والغاز. على الطرق المألوفة، يسمح هذا للسيارات بالقيادة بسلاسة وأمان.
ومع ذلك، لا يمكن للإدراك وحده التعامل مع جميع المواقف. لا يمكنه الإجابة على الأسئلة المهمة التي تطرح في السيناريوهات المعقدة أو غير المتوقعة. على سبيل المثال، هل سيتجاوز راكب دراجة هوائية الشارع؟ هل من الأفضل Yield في هذه اللحظة أو اتخاذ مخاطرة صغيرة؟ لماذا يكون مناورة أكثر أمانًا من أخرى؟ تجعل النماذج السوداء هذه الأسئلة أكثر صعوبة لأنها لا يمكن أن تفسر قراراتها. وبالتالي، قد يجد فريق السلامة والمنظمون صعوبة في الثقة بهذه الأنظمة.
تعد مخططات القواعد محدودة أيضًا. بينما توفر تعليمات واضحة، يصبح برمجة قواعد لكل موقف نادر أمرًا مستحيلًا بسرعة. وبالتالي، الاعتماد فقط على الإدراك أو القواعد الثابتة يترك فجوات في السلامة وصنع القرار.
تظهر هذه التحديات لماذا تكون طبقة التفكير ضرورية للسيارات ذاتية القيادة. يمكن لنظام مثل هذا فهم الوضع، وتوقع ما قد يحدث بعد ذلك، واتخاذ قرارات يمكن للمشرعين والبشر الثقة بها. بالإضافة إلى ذلك، يمكن أن تنتج نماذج التفكير تفسيرات يمكن مراجعتها، مما يزيد من الثقة في إجراءات المركبة.
NVIDIA Alpamayo والتحول نحو الاستقلال القائم على التفكير
تقدم شركة NVIDIA نظام Alpamayo، وهو منصة تركز على التفكير مصممة للتعامل مع الحالات الحدودية التي لا تزال تبطئ التقدم نحو القيادة الذاتية من المستوى 4. ومع ذلك، بدلاً من العمل كنظام قيادة ذاتي بالكامل داخل المركبة، يعمل نظام Alpamayo كبيئة بحث وتطوير مفتوحة. يجمع هذا النظام ثلاثة مكونات متصلة密ًا: نماذج الرؤية واللغة والعمل، وإطار عمل محاكاة AlpaSim، ومجموعات بيانات القيادة الفيزيائية الكبيرة. معًا، تدعم هذه العناصر دراسة واختبار وتحسين سياسات القيادة التي يجب أن تعمل في ظل عدم اليقين والتعقيد الاجتماعي مع الحفاظ على قابلية الفهم للنقاد البشر.
النواة الأساسية لهذه المنصة هي نظام Alpamayo 1. في هذا النموذج، يجمع حوالي 10 مليارات معامل بين هيكل رؤية ولغة متقدم مع وحدة تنبؤ إجراء ومسار مخصصة. ونتيجة لذلك، يمكن للنظام معالجة الإدخال من عدة مناظير للكاميرا، وتوقع حركة المركبة المستقبلية، وتوليد تفسيرات واضحة ومفصلة لكل قرار. تتبع هذه التفسيرات تسلسلًا منظمًا. أولاً، يحدد النظام مستخدمي الطريق القريبين. ثم يقدر نواياهم المحتملة. بعد ذلك، يقيم حدود الرؤية ومخاطر السلامة. وأخيرًا، يختار مناورة مناسبة. على سبيل المثال، عندما تحجب مركبة التوصيل جزءًا من المسار، قد يعتبر النموذج إمكانية ظهور راكب دراجة هوائية من وراءها. ثم يتحقق من حركة المرور في المسارات المجاورة. ونتيجة لذلك، قد يختار مسارًا محدثًا بحذر بدلاً من تغيير مسار مفاجئ. يعتمد هذا العملية التفكيرية بشكل وثيق على كيفية تفكير سائق بشري محترف في نفس المواقف.
تعزز أساليب التدريب هذا التركيز على التفكير. في البداية، يطور نظام Alpamayo فهمًا عامًا سببيًا من مجموعات بيانات متعددة الوسائط الكبيرة. بعد ذلك، يتم تعديله باستخدام بيانات محددة من التسجيلات العالمية وال محاكاة. بالإضافة إلى ذلك، تفرض محاكاة قائمة على الفيزياء قيود السلامة مثل الحفاظ على مسافة توقف كافية وتجنب افتراضات المسؤولية غير الآمنة. وفي الوقت نفسه، يقيم النظام نتائج مستقبلية بديلة بدلاً من الاعتماد على تنبؤ واحد. وبالتالي، من خلال النظر في ما قد يحدث بعد ذلك وميل إلى الاستجابات المحافظة، يقلل النظام من مخاطر الفشل في الظروف غير المألوفة.
كيف يطبق نظام Alpamayo سلاسل التفكير في الحالات الحدودية
يعالج نظام Alpamayo المواقف الصعبة من خلال التفكير الصريح والقائم على العالم الحقيقي الذي يتكيف مع سلوك الطريق الفعلي. بدلاً من الاستجابة للمواقف ككل، يفرق النظام كل موقف إلى سلسلة من الخطوات المنطقية. وبالتالي، لا يتم إنتاج القرارات كإخراج واحد، بل كنتيجة لتحليل منظم. ي镜 هذا النهج التفكير البشري ويقلل السلوك غير المتوقع في الظروف غير المألوفة.
أولاً، يحدد النظام جميع الوكلاء ذوي الصلة في المشهد، بما في ذلك المركبات ودراجات الهوائية والراكبين والأجسام المؤقتة. ثم يفترض النية المحتملة من خلال فحص أنماط الحركة والسياق والإشارات الاجتماعية. بعد ذلك، يقيم حدود الرؤية والغموض والمخاطر المحتملة المخفية. بالإضافة إلى ذلك، يعتبر النتائج المضادة، مثل ما قد يحدث إذا قفز راكب دراجة هوائية فجأة إلى الأمام. فقط بعد ذلك يقارن النظام مسارات متعددة محتملة بالقيود الأمنية قبل اختيار إجراء نهائي. وفي الوقت نفسه، ينتج النظام مسارًا تفكيريًا واضحًا ومفصلاً يفسر كل خطوة بالترتيب.
يصبح هذا العملية حرجة في البيئات الغامضة. على سبيل المثال، عندما تحجب مركبة التوصيل جزءًا من مسار مدينة ضيق، لا يعتمد نظام Alpamayo فقط على نمط متعلم. بل يفكر في المواقف خطوة خطوة. يحدد المنطقة المخفية خلف المركبة. ثم يتوقع إمكانية ظهور راكب دراجة هوائية أو راكب دراجة. بعد ذلك، يتحقق من حركة المرور القادمة في أفق زمني قصير. ونتيجة لذلك، قد يختار تعديلًا جانبيًا صغيرًا يحافظ على حيز أمان بدلاً من الالتزام بتغيير مسار كامل. يُدعم هذا القرار بالتفكير بدلاً من درجات الثقة فقط.
إغلاق فجوة البيانات الطويلة من خلال التفكير والمحاكاة
لا تحل الأنظمة القائمة على التفكير مثل نظام Alpamayo مشكلة الحالات الحدودية ببساطة من خلال جمع المزيد من بيانات القيادة. بل تغير كيفية تفسير البيانات الحالية، وتوسيعها، واختبارها. وبالتالي، يعتمد التقدم على استخدام البيانات بشكل أكثر فعالية بدلاً من زيادة عدد الأميال فقط. تتعامل شركة NVIDIA مع هذا التحدي من خلال التكامل الوثيق لمجموعات بيانات القيادة الفيزيائية مع بيئة محاكاة AlpaSim، وكلاهما مصمم لدعم التطوير الموجه بالتفكير.
تتضمن مجموعات بيانات القيادة الفيزيائية من شركة NVIDIA أكثر من 1700 ساعة من بيانات القيادة المزامنة التي تم جمعها عبر 25 دولة وألاف المدن. تجمع هذه البيانات الإدخال من الكاميرات والليزر والرادار لتقديم نطاقًا واسعًا من سلوك الطريق الفعلي. ومن المهم أن تمتد هذه التسجيلات إلى ما وراء منطقة أو ثقافة قيادة واحدة. ونتيجة لذلك، تعكس هذه النماذج أمثلة واقعية للمواقف النادرة والمبهمة، مثل تقاطعات غير واضحة، أو علامات مسارات تالفة، أو طرق حيث يتحكم التفاوض بدلاً من اتباع القواعد الصارمة. وبالتالي، يتم تدريب نماذج التفكير على ظروف أكثر تشابهًا مع التعقيد الفعلي في العالم.
الآثار الصناعية والتحديات المستمرة
يتماشى نظام Alpamayo مع استراتيجية شركة NVIDIA الأوسع لنظام القيادة الذاتية من خلال دمج التدريب على نطاق كبير والمحاكاة وتحميل المركبات. يحدث التدريب والتقييم على أنظمة GPU عالية الأداء في مراكز البيانات. وفي الوقت نفسه، تعمل نماذج أصغر مشتقة من هذا العمل على أجهزة السيارات، مثل منصة DRIVE Thor، مما يسمح باتخاذ القرارات في الوقت الفعلي في المركبات. وبالمثل، تمتد الأنظمة ذات الصلة إلى الروبوتات من خلال منصات Jetson. وبالتالي، يسمح نظام Alpamayo للسيارات ولبقية الأنظمة الفيزيائية بمشاركة إطار عمل تطوير مشترك.
يعكس الاهتمام الصناعي هذا النهج. هناك العديد من الشركات ومجموعات البحث التي تختبر نظام Alpamayo كطبقة تفكير فوق أنظمة الإدراك الحالية. على سبيل المثال، تخطط شركة Mercedes-Benz لاستكشاف دمجها في المركبات المستقبلية، بينما تدرس شركة Jaguar Land Rover استخدامها لتقييم المواقف القيادة المعقدة. وفي الوقت نفسه، تقوم منظمات مثل Lucid وUber وBerkeley DeepDrive بتطبيق نظام Alpamayo لاختبار السياسات وتحقق السلامة. ونتيجة لذلك، يُعتبر النظام أقل كبديل لأنظمة الاستقلال واكثر كأداة لتحسين منطق السلامة ودعم أهداف المستوى 4.
على الرغم من هذه التطورات، لا تزال هناك تحديات رئيسية، وتتطلب الانتباه الدقيق. على سبيل المثال، قد يصف التفكير في سلسلة الأفكار القرارات بعد الحادث بدلاً من反عكس العملية الداخلية الفعلية، مما يُ复ق التحقيقات في الحوادث. بالإضافة إلى ذلك، قد يضعف الحفاظ على سلوك الحذر من النماذج الكبيرة إلى نماذج أصغر في المركبات تحت قيود حسابية غير كافية. وبالتالي، يُعتبر الاختبار الشامل ضروريًا للحفاظ على السلوك المتسق في ظل القيود الحسابية الصارمة.
تخلق فروق التوزيع مخاطر مستمرة. قد لا ينتقل التفكير المطور في بيئات حضرية منظمة بشكل سلس إلى مناطق ذات مرور غير رسمي، أو تقاطعات آسيوية مزدحمة، أو طرق ريفية غير ممهدة. وبالتالي، يُعتبر التحقق المحلي والتعديل ضروريين للحفاظ على السلامة عبر ظروف متنوعة. بالإضافة إلى ذلك، يعتمد الثقة العامة والموافقة التنظيمية على إثبات أن مخرجات التفكير تؤدي إلى تحسينات حقيقية في السلامة، مثل تقليل الانقطاعات والخطرات وقرارات الكفالة.












