الذكاء الاصطناعي
NVIDIA Cosmos: تمكين الذكاء الاصطناعي المادي من خلال المحاكاة

يعتمد تطوير أنظمة الذكاء الاصطناعي المادية، مثل الروبوتات في المصانع والمركبات ذاتية القيادة في الشوارع، بشكل كبير على مجموعات بيانات ضخمة وعالية الجودة للتدريب. ومع ذلك، فإن جمع البيانات الواقعية مكلف ويستغرق وقتًا طويلاً، وغالبًا ما يقتصر على عدد قليل من شركات التكنولوجيا الكبرى. كوزموس من إنفيديا تعالج منصة كوزموس هذا التحدي باستخدام محاكاة فيزيائية متقدمة لتوليد بيانات تركيبية واقعية على نطاق واسع. يُمكّن هذا المهندسين من تدريب نماذج الذكاء الاصطناعي دون التكلفة والتأخير المرتبطين بجمع البيانات الواقعية. تناقش هذه المقالة كيف يُحسّن كوزموس الوصول إلى بيانات التدريب الأساسية ويُسرّع تطوير ذكاء اصطناعي آمن وموثوق للتطبيقات الواقعية.
فهم الذكاء الاصطناعي المادي
الذكاء الاصطناعي المادي يشير مصطلح "الذكاء الاصطناعي" إلى أنظمة الذكاء الاصطناعي القادرة على إدراك العالم المادي وفهمه والعمل فيه. بخلاف الذكاء الاصطناعي التقليدي، الذي قد يُحلل النصوص أو الصور، يتعين على الذكاء الاصطناعي المادي التعامل مع تعقيدات العالم الحقيقي، مثل العلاقات المكانية والقوى الفيزيائية والبيئات الديناميكية. على سبيل المثال، تحتاج السيارة ذاتية القيادة إلى التعرّف على المشاة، والتنبؤ بتحركاتهم، وتعديل مسارها آنيًا، مع مراعاة عوامل مثل الطقس وحالة الطرق. وبالمثل، يتعين على الروبوت في المستودعات تجاوز العوائق والتعامل مع الأشياء بدقة.
يُمثل تطوير الذكاء الاصطناعي المادي تحديًا كبيرًا، إذ يتطلب كميات هائلة من البيانات لتدريب النماذج على سيناريوهات واقعية متنوعة. وقد يكون جمع هذه البيانات، سواءً كانت ساعات من تصوير القيادة أو عروضًا توضيحية لمهام الروبوتات، مُستهلكًا للوقت ومكلفًا. علاوة على ذلك، قد يكون اختبار الذكاء الاصطناعي في الواقع محفوفًا بالمخاطر، إذ قد تؤدي الأخطاء إلى حوادث. ويعالج نظام NVIDIA Cosmos هذه التحديات باستخدام عمليات محاكاة قائمة على الفيزياء لتوليد بيانات تركيبية واقعية. يُبسط هذا النهج ويُسرّع تطوير أنظمة الذكاء الاصطناعي المادي.
ما هي نماذج مؤسسة العالم؟
في قلب إنفيديا كوزموس هي مجموعة من نماذج الذكاء الاصطناعي تسمى العالم نماذج الأساس (WFMs)صُممت نماذج الذكاء الاصطناعي هذه خصيصًا لمحاكاة بيئات افتراضية تُحاكي العالم المادي عن كثب. من خلال إنشاء مقاطع فيديو أو سيناريوهات مُراعية للفيزياء، تُحاكي نماذج WFM كيفية تفاعل الأشياء بناءً على العلاقات المكانية والقوانين الفيزيائية. على سبيل المثال، يُمكن لنموذج WFM محاكاة سيارة تسير خلال عاصفة ممطرة، مُوضحًا كيف يؤثر الماء على قوة الجر أو كيف تنعكس المصابيح الأمامية عن الأسطح المبللة.
تُعدّ نماذج WFM بالغة الأهمية للذكاء الاصطناعي المادي، إذ تُوفّر بيئة آمنة وقابلة للتحكم لتدريب أنظمة الذكاء الاصطناعي واختبارها. فبدلاً من جمع بيانات واقعية، يُمكن للمطورين استخدام نماذج WFM لتوليد بيانات تركيبية - محاكاة واقعية للبيئات والتفاعلات. لا يُخفّض هذا النهج التكاليف فحسب، بل يُسرّع أيضاً عملية التطوير، ويتيح اختبار سيناريوهات مُعقّدة ونادرة (مثل حالات المرور غير الاعتيادية) دون المخاطر المُرتبطة بالاختبارات الواقعية. تُعدّ نماذج WFM نماذج عامة الأغراض يُمكن ضبطها بدقة لتطبيقات مُحدّدة، على غرار كيفية تكييف نماذج اللغات الكبيرة لمهام مثل الترجمة أو برامج الدردشة الآلية.
الكشف عن NVIDIA Cosmos
NVIDIA Cosmos هي منصة مصممة لتمكين المطورين من بناء وتخصيص نماذج WFM لتطبيقات الذكاء الاصطناعي المادية، وخاصةً في المركبات ذاتية القيادة والروبوتات. تدمج Cosmos نماذج توليدية متقدمة، وأدوات معالجة بيانات، وميزات أمان لتطوير أنظمة ذكاء اصطناعي تتفاعل مع العالم المادي. المنصة مفتوحة المصدر، مع توفر نماذج بموجب تراخيص مُرخصة.
تتضمن المكونات الرئيسية للمنصة ما يلي:
- نماذج مؤسسة العالم التوليدي (WFMs): نماذج مدربة مسبقًا تحاكي البيئات والتفاعلات المادية.
- المُرمزات المتقدمة: أدوات تعمل على ضغط البيانات ومعالجتها بكفاءة لتدريب النموذج بشكل أسرع.
- خط أنابيب معالجة البيانات المتسارعة: نظام للتعامل مع مجموعات البيانات الكبيرة، مدعوم بالبنية التحتية للحوسبة الخاصة بشركة NVIDIA.
من أهمّ ميزات كوزموس الجديدة نموذجه الاستدلالي للذكاء الاصطناعي المادي. يُتيح هذا النموذج للمطورين القدرة على إنشاء عوالم افتراضية وتعديلها. يمكنهم تصميم محاكاة تناسب احتياجات محددة، مثل اختبار قدرة الروبوت على التقاط الأشياء أو تقييم استجابة المركبات ذاتية القيادة لعائق مفاجئ.
الميزات الرئيسية لبرنامج NVIDIA Cosmos
توفر NVIDIA Cosmos مكونات مختلفة لمعالجة التحديات المحددة في تطوير الذكاء الاصطناعي المادي:
- نقل الكون WFMs: تستقبل هذه النماذج مُدخلات فيديو مُهيكلة، مثل خرائط التجزئة، وخرائط العمق، أو مسوحات الليدار، وتُنتج مُخرجات فيديو واقعية وقابلة للتحكم. تُعد هذه الإمكانية مفيدة بشكل خاص لإنشاء بيانات مُركبة لتدريب الذكاء الاصطناعي على الإدراك، مثل الأنظمة التي تُساعد المركبات ذاتية القيادة على تحديد الأشياء، أو الروبوتات على التعرّف على محيطها.
- Cosmos Predict WFMs: تُولّد نماذج Cosmos Predict حالات العالم الافتراضي بناءً على مُدخلات متعددة الوسائط، بما في ذلك النصوص والصور والفيديو. ويمكنها التنبؤ بالسيناريوهات المستقبلية، مثل كيفية تطور المشهد مع مرور الوقت، ودعم توليد إطارات متعددة للتسلسلات المعقدة. ويمكن للمطورين تخصيص هذه النماذج باستخدام مجموعة بيانات الذكاء الاصطناعي المادية من NVIDIA لتلبية احتياجاتهم الخاصة، مثل التنبؤ بحركات المشاة أو حركات الروبوتات.
- سبب الكون WFM: نموذج كوزموس ريزن هو نموذج WFM قابل للتخصيص بالكامل مع وعي زماني مكاني. تُمكّنه قدرته على التفكير المنطقي من فهم العلاقات المكانية وكيفية تغيرها بمرور الوقت. يستخدم النموذج التفكير المنطقي التسلسلي لتحليل بيانات الفيديو والتنبؤ بالنتائج، مثل ما إذا كان الشخص سيخطو على ممر المشاة، أو ما إذا كان صندوق سيسقط من على رف.
التطبيقات وحالات الاستخدام
يُحدث نظام NVIDIA Cosmos تأثيرًا كبيرًا على الصناعة، حيث تبنته العديد من الشركات الرائدة في مشاريع الذكاء الاصطناعي المادي. ويُبرز هؤلاء المُستخدمون الأوائل تنوع Cosmos وتأثيره العملي في مختلف القطاعات:
- 1X:استخدام Cosmos في مجال الروبوتات المتقدمة لتحسين قدرتهم على تطوير الروبوتات التي تعتمد على الذكاء الاصطناعي.
- الروبوتات أجيليتي:توسيع شراكتهم مع NVIDIA للاستفادة من Cosmos في أنظمة الروبوتات البشرية.
- الشكل AI:استخدام Cosmos لتطوير الروبوتات البشرية، مع التركيز على الذكاء الاصطناعي القادر على أداء مهام معقدة.
- فوريتيليكس:تطبيق Cosmos في محاكاة المركبات ذاتية القيادة لإنشاء مجموعة واسعة من سيناريوهات الاختبار.
- مهارة الذكاء الاصطناعي:استخدام Cosmos لتطوير حلول تعتمد على الذكاء الاصطناعي لتطبيقات مختلفة.
- اوبر:دمج Cosmos في تطوير المركبات ذاتية القيادة لتحسين بيانات التدريب لأنظمة القيادة الذاتية.
- Oxa:استخدام Cosmos لتسريع أتمتة التنقل الصناعي.
- شق افتراضي:استكشاف Cosmos للروبوتات الجراحية لتحسين الدقة في الرعاية الصحية.
تُظهر حالات الاستخدام هذه كيف يمكن لـ Cosmos تلبية مجموعة واسعة من الاحتياجات، بدءًا من النقل إلى الرعاية الصحية، من خلال توفير البيانات الاصطناعية لتدريب أنظمة الذكاء الاصطناعي المادية هذه.
التداعيات المستقبلية
يُعد إطلاق NVIDIA Cosmos أمرًا بالغ الأهمية لتطوير أنظمة الذكاء الاصطناعي المادية. فمن خلال توفير منصة مفتوحة المصدر مزودة بأدوات ونماذج فعّالة، تُتيح NVIDIA تطوير الذكاء الاصطناعي المادي لمجموعة أوسع من المطورين والمؤسسات. وهذا من شأنه أن يُفضي إلى تطورات كبيرة في عدة مجالات.
في مجال النقل الذاتي، قد تؤدي بيانات التدريب المُحسّنة وعمليات المحاكاة إلى سيارات ذاتية القيادة أكثر أمانًا وموثوقية. وفي مجال الروبوتات، قد يُحدث التطوير السريع للروبوتات القادرة على أداء مهام معقدة نقلة نوعية في قطاعات مثل التصنيع والخدمات اللوجستية والرعاية الصحية. وفي مجال الرعاية الصحية، قد تُحسّن تقنيات مثل الروبوتات الجراحية، كما استكشفتها شركة Virtual Incision، دقة الإجراءات الطبية ونتائجها.
الخط السفلي
تلعب منصة NVIDIA Cosmos دورًا محوريًا في تطوير الذكاء الاصطناعي المادي. تتيح هذه المنصة للمطورين توليد بيانات تركيبية عالية الجودة من خلال توفير نماذج أساسية عالمية (WFM) مُدربة مسبقًا وقائمة على الفيزياء لإنشاء محاكاة واقعية. بفضل إمكانية الوصول مفتوحة المصدر، وميزاتها المتقدمة، وضماناتها الأخلاقية، تُمكّن Cosmos من تطوير ذكاء اصطناعي أسرع وأكثر كفاءة. تُسهم المنصة بالفعل في تحقيق تقدم كبير في قطاعات مثل النقل، والروبوتات، والرعاية الصحية، من خلال توفير بيانات تركيبية لبناء أنظمة ذكية تتفاعل مع العالم المادي.