اتصل بنا للحصول على مزيد من المعلومات

Meta's Llama 3.2: إعادة تعريف الذكاء الاصطناعي التوليدي مفتوح المصدر مع إمكانات على الجهاز ومتعددة الوسائط

الذكاء الاصطناعي

Meta's Llama 3.2: إعادة تعريف الذكاء الاصطناعي التوليدي مفتوح المصدر مع إمكانات على الجهاز ومتعددة الوسائط

mm

إطلاق Meta الأخير لـ Llama 3.2، أحدث إصدار في سلسلة Llama الخاصة بها نماذج لغوية كبيرة، يُعد هذا التحديث تطورًا مهمًا في تطور نظام الذكاء الاصطناعي التوليدي مفتوح المصدر. يعمل هذا التحديث على توسيع قدرات Llama في بعدين. من ناحية، يسمح Llama 3.2 بمعالجة البيانات متعددة الوسائط - دمج الصور والنصوص والمزيد - مما يجعل قدرات الذكاء الاصطناعي المتقدمة أكثر سهولة في الوصول إليها لجمهور أوسع. من ناحية أخرى، يوسع إمكانات نشره على الأجهزة الطرفية، مما يخلق فرصًا مثيرة لتطبيقات الذكاء الاصطناعي في الوقت الفعلي على الجهاز. في هذه المقالة، سوف نستكشف هذا التطور وتداعياته على مستقبل نشر الذكاء الاصطناعي.

تطور اللاما

بدأت رحلة ميتا مع لاما في أوائل عام 2023وفي ذلك الوقت، شهدت السلسلة نموًا هائلاً وتبنيًا. بدءًا من Llama 1، الذي كان مقتصرًا على الاستخدام غير التجاري ولا يمكن الوصول إليه إلا من قبل مؤسسات بحثية مختارة، انتقلت السلسلة إلى عالم مفتوح المصدر مع إصدار Llama 2 في عام 2023. كان إطلاق Llama 3.1 في وقت سابق من هذا العام خطوة كبيرة إلى الأمام في التطور، حيث قدم أكبر نموذج مفتوح المصدر عند 405 مليار معلمة، وهو ما يعادل أو يفوق منافسيه. يأخذ الإصدار الأخير، Llama 3.2، هذه الخطوة إلى الأمام من خلال تقديم نماذج جديدة خفيفة الوزن ومركزة على الرؤية، مما يجعل الذكاء الاصطناعي على الجهاز و متعدد الوسائط إن تفاني Meta في الانفتاح وإمكانية التعديل سمح لشركة Llama بأن تصبح نموذجًا رائدًا في مجتمع المصادر المفتوحة. تعتقد الشركة أنه من خلال الالتزام بالشفافية وإمكانية الوصول، يمكننا دفع ابتكار الذكاء الاصطناعي إلى الأمام بشكل أكثر فعالية - ليس فقط للمطورين والشركات، ولكن للجميع في جميع أنحاء العالم.

تقديم اللاما 3.2

Llama 3.2 هو أحدث إصدار من سلسلة Llama من Meta، والذي يتضمن مجموعة متنوعة من نماذج اللغة المصممة لتلبية متطلبات متنوعة. تم تصميم النماذج الأكبر حجمًا ومتوسطة الحجم، والتي تتضمن 90 و11 مليار معلمة، للتعامل مع معالجة البيانات المتعددة الوسائط بما في ذلك النصوص والصور. يمكن لهذه النماذج تفسير المخططات والرسوم البيانية وغيرها من أشكال البيانات المرئية بشكل فعال، مما يجعلها مناسبة لبناء التطبيقات في مجالات مثل الرؤية الحاسوبية وتحليل المستندات وأدوات الواقع المعزز. تم اعتماد النماذج الخفيفة الوزن، التي تضم مليارًا و1 مليارات معلمة، خصيصًا للأجهزة المحمولة. تتميز هذه النماذج النصية فقط بقدرات توليد النصوص متعددة اللغات واستدعاء الأدوات، مما يجعلها فعالة للغاية لمهام مثل التوليد المعزز بالاسترجاع والتلخيص وإنشاء تطبيقات مخصصة قائمة على الوكيل على الأجهزة الطرفية.

أهمية اللاما 3.2

يمكن التعرف على هذا الإصدار من Llama 3.2 للتقدم الذي أحرزته في منطقتين رئيسيتين.

عصر جديد من الذكاء الاصطناعي المتعدد الوسائط

لاما 3.2 هو أول نموذج مفتوح المصدر من ميتا، يتمتع بقدرات معالجة النصوص والصور. ويمثل هذا تطورًا هامًا في تطور الذكاء الاصطناعي التوليدي مفتوح المصدر، إذ يُمكّن النموذج من تحليل المدخلات البصرية والاستجابة لها جنبًا إلى جنب مع البيانات النصية. على سبيل المثال، يمكن للمستخدمين الآن تحميل الصور وتلقي تحليلات أو تعديلات مفصلة بناءً على توجيهات اللغة الطبيعية، مثل تحديد الكائنات أو إنشاء التسميات التوضيحية. وقد أكد مارك زوكربيرج على هذه الإمكانية خلال الإطلاق، مشيرًا إلى أن لاما 3.2 مصمم "لتمكين العديد من التطبيقات الشيقة التي تتطلب فهمًا بصريًا". ويوسع هذا التكامل نطاق لاما ليشمل القطاعات التي تعتمد على المعلومات متعددة الوسائط، بما في ذلك تجارة التجزئة والرعاية الصحية والتعليم والترفيه.

وظائف على الجهاز لسهولة الوصول

من بين الميزات البارزة في Llama 3.2 هو تحسينه للنشر على الجهاز، وخاصة في البيئات المحمولة. تم تصميم الإصدارات الخفيفة الوزن من النموذج مع 1 مليار و 3 مليار معلمة، خصيصًا للتشغيل على الهواتف الذكية وغيرها من الأجهزة الطرفية التي تعمل بأجهزة Qualcomm و MediaTek. تتيح هذه الأداة للمطورين إنشاء تطبيقات دون الحاجة إلى موارد حسابية مكثفة. علاوة على ذلك، تتفوق إصدارات النموذج هذه في معالجة النصوص متعددة اللغات وتدعم طول سياق أطول يبلغ 128 ألف رمز، مما يتيح للمستخدمين تطوير تطبيقات معالجة اللغة الطبيعية بلغاتهم الأصلية. بالإضافة إلى ذلك، تتميز هذه النماذج بقدرات استدعاء الأدوات، مما يسمح للمستخدمين بالانخراط في تطبيقات الوكيل، مثل إدارة دعوات التقويم والتخطيط للرحلات مباشرة على أجهزتهم.

إن القدرة على نشر نماذج الذكاء الاصطناعي محليًا تمكن الذكاء الاصطناعي مفتوح المصدر من التغلب على التحديات المرتبطة بالحوسبة السحابية، بما في ذلك مشكلات زمن الوصول، ومخاطر الأمن، وتكاليف التشغيل المرتفعة، والاعتماد على الاتصال بالإنترنت. يتمتع هذا التقدم بإمكانية تحويل الصناعات مثل الرعاية الصحية والتعليم والخدمات اللوجستية، مما يسمح لها بتوظيف الذكاء الاصطناعي دون قيود البنية التحتية السحابية أو مخاوف الخصوصية، وفي المواقف في الوقت الفعلي. وهذا يفتح الباب أيضًا أمام الذكاء الاصطناعي للوصول إلى المناطق ذات الاتصال المحدود، مما يجعل الوصول إلى التكنولوجيا المتطورة ديمقراطيًا.

ميزة تنافسية

تشير تقارير Meta إلى أن أداء Llama 3.2 كان تنافسيًا مع النماذج الرائدة من OpenAI وAnthropic من حيث الأداء. يزعمون أن Llama 3.2 يتفوق على منافسين مثل Claude 3-Haiku وGPT-4o-mini في معايير مختلفة، بما في ذلك مهام متابعة التعليمات وتلخيص المحتوى. هذه الميزة التنافسية حيوية بالنسبة لشركة Meta لأنها تهدف إلى ضمان بقاء الذكاء الاصطناعي مفتوح المصدر على قدم المساواة مع النماذج الملكية في مجال الذكاء الاصطناعي التوليدي سريع التطور.

Llama Stack: تبسيط نشر الذكاء الاصطناعي

أحد الجوانب الرئيسية لإصدار Llama 3.2 هو تقديم Llama Stack. تسهل مجموعة الأدوات هذه على المطورين العمل مع نماذج Llama عبر بيئات مختلفة، بما في ذلك الإعدادات الفردية والمحلية والسحابية وعلى الجهاز. تتضمن Llama Stack دعمًا لتطبيقات RAG والأدوات الممكّنة، مما يوفر إطارًا مرنًا وشاملًا لنشر نماذج الذكاء الاصطناعي التوليدي. من خلال تبسيط عملية النشر، تمكن Meta المطورين من دمج نماذج Llama بسهولة في تطبيقاتهم، سواء للبيئات السحابية أو المحمولة أو المكتبية.

الخط السفلي

اللاما ميتا 3.2 إن Llama 3.2 هي لحظة حيوية في تطور الذكاء الاصطناعي التوليدي مفتوح المصدر، حيث تضع معايير جديدة لإمكانية الوصول والوظائف والتنوع. بفضل قدراتها على الجهاز والمعالجة المتعددة الوسائط، يفتح هذا النموذج إمكانيات تحويلية عبر الصناعات، من الرعاية الصحية إلى التعليم، مع معالجة المخاوف الحرجة مثل الخصوصية والوقت المستغرق وقيود البنية التحتية. من خلال تمكين المطورين من نشر الذكاء الاصطناعي المتقدم محليًا وبكفاءة، لا يعمل Llama XNUMX على توسيع نطاق تطبيقات الذكاء الاصطناعي فحسب، بل يعمل أيضًا على إضفاء الطابع الديمقراطي على الوصول إلى التقنيات المتطورة على نطاق عالمي.

الدكتور تحسين ضياء هو أستاذ مشارك دائم في جامعة كومساتس إسلام أباد، ويحمل درجة الدكتوراه في الذكاء الاصطناعي من جامعة فيينا للتكنولوجيا، النمسا. متخصص في الذكاء الاصطناعي، والتعلم الآلي، وعلوم البيانات، ورؤية الكمبيوتر، وقد قدم مساهمات كبيرة من خلال منشورات في المجلات العلمية ذات السمعة الطيبة. كما قاد الدكتور تحسين العديد من المشاريع الصناعية كمحقق رئيسي وعمل كمستشار في الذكاء الاصطناعي.