الذكاء الاصطناعي
Mistral 2 و Mistral NeMo: دليل شامل لأحدث نموذج LLM القادم من باريس

تأسست من قبل خريجي Google’s DeepMind و Meta ، وقد أحدثت شركة Mistral AI التي تتخذ من باريس مقراً لها ضجة في مجتمع الذكاء الاصطناعي منذ عام 2023.
أول ما لفت Mistral AI الانتباه إلى نفسها كان مع ظهور نموذجها الأول ، Mistral 7B ، الذي تم إطلاقه في عام 2023. وسرعان ما حصل هذا النموذج ذو المعاملات 7 مليارات على قبول واسع لادائه المثير للإعجاب ، متجاوزاً نماذج أكبر مثل Llama 2 13B في العديد من المعايير ، وحتى منافسة Llama 1 34B في العديد من المقاييس. ما ميز Mistral 7B ليس فقط أدائه ، ولكن أيضًا سهولة الوصول إليه – يمكن تحميل النموذج بسهولة من GitHub أو حتى عبر تورنت يبلغ حجمه 13.4 جيجابايت ، مما يجعله متاحًا بسهولة للباحثين والمطورين في جميع أنحاء العالم.
المنهج غير التقليدية لشركة Mistral AI في الإصدارات ، غالبًا ما تتخلى عن الأوراق البحثية التقليدية أو المدونات أو إعلانات الصحافة ، أثبتت أنها فعالة بشكل ملحوظ في جذب انتباه مجتمع الذكاء الاصطناعي. هذا المنهج ، إلى جانب التزامهم بمبادئ البرمجيات مفتوحة المصدر ، وضع Mistral AI في موقع قوي في مشهد الذكاء الاصطناعي.
الارتفاع السريع لشركة Mistral AI في الصناعة يتضح أيضًا من نجاحها الأخير في التمويل. حققت الشركة تقييمًا يبلغ 2 مليار دولار بعد جولة تمويل بقيادة Andreessen Horowitz. جاء هذا في أعقاب جولة بذور تاريخية بقيمة 118 مليون دولار – أكبر جولة بذور في تاريخ أوروبا – مما يظهر الإيمان الهائل الذي لديه المستثمرين في رؤية و قدرات Mistral AI.
علاوة على تقدمها التكنولوجي ، شاركت Mistral AI أيضًا بنشاط في تشكيل سياسات الذكاء الاصطناعي ، خاصة في المناقشات حول قانون الاتحاد الأوروبي للذكاء الاصطناعي ، حيث دافعت عن انخفاض التنظيم في الذكاء الاصطناعي مفتوح المصدر.
الآن ، في عام 2024 ، أحدثت Mistral AI مرة أخرى الركائز مع نموذجين رائدين: Mistral Large 2 (المعروف أيضًا باسم Mistral-Large-Instruct-2407) و Mistral NeMo. في هذا الدليل الشامل ، سنغوص sâu في الميزات والأداء والتطبيقات المحتملة لهذه النماذج الإيضاحية.
المواصفات الرئيسية ل Mistral Large 2 تشمل:
- 123 مليار معامل
- 128k نافذة سياق
- دعم لآلاف اللغات
- البراعة في 80+ لغة برمجة
- قابليات متقدمة لاستدعاء الدوال
تم تصميم النموذج لتحقيق حدود الكفاءة في التكلفة والسرعة والأداء ، مما يجعله خيارًا جذابًا لكل من الباحثين والشركات التي تبحث عن استغلال الذكاء الاصطناعي المتقدم.
Mistral NeMo: النموذج الأصغر الجديد
في حين يمثل Mistral Large 2 أفضل ما تقدمه Mistral AI من نماذج كبيرة النطاق ، يتبنى Mistral NeMo ، الذي تم إطلاقه في يوليو 2024 ، نهجًا مختلفًا. تم تطويره بالتعاون مع NVIDIA ، Mistral NeMo هو نموذج مدمج يبلغ 12 مليار معامل لا يزال يقدم قدرات مثيرة للإعجاب:
- 12 مليار معامل
- 128k سياق نافذة
- أداء على مستوى الدولة في فئته الحجم
- رخصة Apache 2.0 للاستخدام المفتوح
- تدريب حساس للكمية لاستدعاء كفء
يتم وضع Mistral NeMo كبديل للاستخدام في الأنظمة التي تستخدم حاليًا Mistral 7B ، مع تقديم أداء محسّن مع الحفاظ على سهولة الاستخدام ومتطلبات التوافق.
الميزات والقدرات الرئيسية
يتشارك كل من Mistral Large 2 و Mistral NeMo في عدة ميزات رئيسية تتميز بها في مشهد الذكاء الاصطناعي:
- نوافذ سياق كبيرة: مع أطوال سياق 128k ، يمكن للنموذجين معالجة وفهم قطع نص أطول ، مما يتيح إخراجًا أكثر اتساقًا وملاءمة للسياق.
- دعم متعدد اللغات: يمتاز النماذج بالتألق في مجموعة واسعة من اللغات ، بما في ذلك الإنجليزية والفرنسية والألمانية والإسبانية والإيطالية والصينية واليابانية والكورية والعربية والهندية.
- قدرات برمجة متقدمة: يبرزان النماذج براعة استثنائية في توليد الشفرة عبر لغات برمجة عديدة.
- التوجيه: تحسينات كبيرة تم إجراؤها في قدرة النماذج على اتباع تعليمات دقيقة وتحديد محادثات متعددة.
- استدعاء الدوال: دعم أصلي لاستدعاء الدوال يسمح للنماذج بالتفاعل ديناميكيًا مع أدوات وخدمات خارجية.
- الاستدلال والتحليل: قدرات محسنة في الاستدلال الرياضي ومهام حل المشكلات المعقدة.
دعونا نستكشف بعض هذه الميزات ونفحص كيفية أدائها في الممارسة.
معايير الأداء
لفهم القدرات الحقيقية ل Mistral Large 2 و Mistral NeMo ، من الضروري النظر في أدائهم عبر معايير مختلفة. دعونا ننظر في بعض المقاييس الرئيسية:
معايير Mistral Large 2
هذا الجدول يعرض براعة مختلف نماذج LLM في لغات برمجة مختلفة. يتم تقييم نماذج مثل Mistral Large 2 (24.07) و Llama 3.1 (405B) و GPT-4o على قدرتهم على فهم وتوليد شفرة بلغات مثل Python و C++ و Bash و Java و TypeScript و PHP و C#.












