رطم قوة بحجم الجيب: الكشف عن Phi-3 من Microsoft، نموذج اللغة الذي يناسب هاتفك - Unite.AI
اتصل بنا للحصول على مزيد من المعلومات

الذكاء الاصطناعي

قوة بحجم الجيب: الكشف عن Phi-3 من Microsoft، نموذج اللغة الذي يناسب هاتفك

mm
تحديث on

في مجال الذكاء الاصطناعي سريع التطور، وبينما يميل الاتجاه غالبًا نحو نماذج أكبر وأكثر تعقيدًا، تتبنى Microsoft نهجًا مختلفًا مع جهاز Phi-3 Mini. هذا نموذج اللغة الصغيرة (SLM)، الآن في جيله الثالث، يجمع القدرات القوية للنماذج الأكبر حجمًا في إطار عمل يتلاءم مع قيود الموارد الصارمة للهواتف الذكية. مع 3.8 مليار معلمة، فإن Phi-3 Mini يطابق أداء نماذج اللغات الكبيرة (LLMs) عبر مهام مختلفة بما في ذلك معالجة اللغة، والاستدلال، والترميز، والرياضيات، وهي مصممة للتشغيل الفعال على الأجهزة المحمولة من خلال التكميم.

تحديات نماذج اللغات الكبيرة

يأتي تطوير Phi SLMs من Microsoft استجابةً للتحديات الكبيرة التي تطرحها LLMs، والتي تتطلب قوة حسابية أكبر مما هو متاح عادةً على الأجهزة الاستهلاكية. يؤدي هذا الطلب المرتفع إلى تعقيد استخدامها على أجهزة الكمبيوتر والأجهزة المحمولة القياسية، ويثير مخاوف بيئية بسبب استهلاكها للطاقة أثناء التدريب والتشغيل، ويخاطر بإدامة التحيزات مع مجموعات بيانات التدريب الكبيرة والمعقدة. يمكن لهذه العوامل أيضًا أن تضعف استجابة النماذج في تطبيقات الوقت الفعلي وتجعل التحديثات أكثر صعوبة.

Phi-3 Mini: تبسيط الذكاء الاصطناعي على الأجهزة الشخصية لتعزيز الخصوصية والكفاءة

فاي-3 ميني تم تصميمه بشكل استراتيجي لتقديم بديل فعال من حيث التكلفة وفعال لدمج الذكاء الاصطناعي المتقدم مباشرة على الأجهزة الشخصية مثل الهواتف وأجهزة الكمبيوتر المحمولة. ويسهل هذا التصميم استجابات أسرع وأكثر فورية، مما يعزز تفاعل المستخدم مع التكنولوجيا في سيناريوهات الحياة اليومية.

يتيح Phi-3 Mini إمكانية معالجة وظائف الذكاء الاصطناعي المتطورة مباشرة على الأجهزة المحمولة، مما يقلل الاعتماد على الخدمات السحابية ويعزز معالجة البيانات في الوقت الفعلي. تعتبر هذه القدرة محورية للتطبيقات التي تتطلب معالجة فورية للبيانات، مثل الرعاية الصحية المتنقلة، وترجمة اللغات في الوقت الفعلي، والتعليم الشخصي، مما يسهل التقدم في هذه المجالات. إن فعالية النموذج من حيث التكلفة لا تقلل التكاليف التشغيلية فحسب، بل تعمل أيضًا على توسيع إمكانية تكامل الذكاء الاصطناعي عبر مختلف الصناعات، بما في ذلك الأسواق الناشئة مثل التكنولوجيا القابلة للارتداء والأتمتة المنزلية. يتيح Phi-3 Mini معالجة البيانات مباشرة على الأجهزة المحلية مما يعزز خصوصية المستخدم. قد يكون هذا أمرًا حيويًا لإدارة المعلومات الحساسة في مجالات مثل الصحة الشخصية والخدمات المالية. علاوة على ذلك، تساهم متطلبات الطاقة المنخفضة للنموذج في عمليات الذكاء الاصطناعي المستدامة بيئيًا، بما يتماشى مع جهود الاستدامة العالمية.

فلسفة التصميم وتطور فاي

فلسفة التصميم فاي يعتمد على مفهوم تعلم المناهج، والذي يستمد الإلهام من النهج التعليمي حيث يتعلم الأطفال من خلال أمثلة أكثر تحديًا بشكل تدريجي. الفكرة الرئيسية هي بدء تدريب الذكاء الاصطناعي بأمثلة أسهل وزيادة تعقيد بيانات التدريب تدريجيًا مع تقدم عملية التعلم. وقد نفذت مايكروسوفت هذه الإستراتيجية التعليمية من خلال بناء مجموعة بيانات من الكتب المدرسية، كما هو مفصل في دراستهم “الكتب المدرسية هي كل ما تحتاجه". تم إطلاق سلسلة Phi في يونيو 2023، بدءًا من Phi-1، وهو نموذج مدمج يضم 1.3 مليار معلمة. وسرعان ما أثبت هذا النموذج فعاليته، خاصة في مهام برمجة بايثون، حيث تفوق في الأداء على النماذج الأكبر حجمًا والأكثر تعقيدًا. وبناءً على هذا النجاح، قامت مايكروسوفت مؤخرًا بتطوير فاي -1.5، والتي حافظت على نفس عدد المعلمات ولكنها وسعت قدراتها في مجالات مثل المنطق السليم وفهم اللغة. تألقت السلسلة مع إصدار فاي -2 في ديسمبر 2023. مع 2.7 مليار معلمة، أظهر Phi-2 مهارات رائعة في التفكير وفهم اللغة، مما جعله منافسًا قويًا ضد نماذج أكبر بكثير.

Phi-3 مقابل نماذج اللغات الصغيرة الأخرى

بالتوسع على سابقاتها، يعمل Phi-3 Mini على توسيع تقدم Phi-2 من خلال تجاوز SLMs الأخرى، مثل جوجل جيما, ميسترال ميسترال, Meta's Llama3-Instructو GPT3.5، في مجموعة متنوعة من التطبيقات الصناعية. تشمل هذه التطبيقات فهم اللغة والاستدلال، والمعرفة العامة، والمنطق السليم، ومشاكل الكلمات الرياضية في المدرسة الابتدائية، والإجابة على الأسئلة الطبية، مما يعرض الأداء المتفوق مقارنة بهذه النماذج. خضع Phi-3 Mini أيضًا للاختبار دون الاتصال بالإنترنت على iPhone 14 لمختلف المهام، بما في ذلك إنشاء المحتوى وتقديم اقتراحات الأنشطة المصممة خصيصًا لمواقع محددة. ولهذا الغرض، تم تكثيف Phi-3 Mini إلى 1.8 جيجابايت باستخدام عملية تسمى توضيح، الذي يعمل على تحسين النموذج للأجهزة محدودة الموارد عن طريق تحويل البيانات الرقمية للنموذج من أرقام الفاصلة العائمة 32 بت إلى تنسيقات أكثر إحكاما مثل الأعداد الصحيحة 4 بت. وهذا لا يقلل من أثر ذاكرة النموذج فحسب، بل يعمل أيضًا على تحسين سرعة المعالجة وكفاءة الطاقة، وهو أمر حيوي للأجهزة المحمولة. يستخدم المطورون عادةً أطر عمل مثل TensorFlow لايت or PyTorch موبايل، بدمج أدوات التكميم المضمنة لأتمتة هذه العملية وتحسينها.

مقارنة الميزات: Phi-3 Mini مقابل Phi-2 Mini

أدناه، نقارن بعض ميزات Phi-3 مع سابقتها Phi-2.

  • العمارة النموذجية: يعمل Phi-2 على بنية قائمة على المحولات مصممة للتنبؤ بالكلمة التالية. يستخدم Phi-3 Mini أيضًا بنية فك تشفير المحولات ولكنه يتماشى بشكل أوثق مع هيكل نموذج Llama-2، باستخدام نفس الرمز المميز بحجم مفردات يبلغ 320,641. يضمن هذا التوافق أن الأدوات التي تم تطويرها لـ Llama-2 يمكن تكييفها بسهولة للاستخدام مع Phi-3 Mini.
  • طول السياق: يدعم Phi-3 Mini طول سياق يبلغ 8,000 رمزًا مميزًا، وهو أكبر بكثير من 2 رمزًا مميزًا لـ Phi-2,048. تسمح هذه الزيادة لـ Phi-3 Mini بإدارة تفاعلات أكثر تفصيلاً ومعالجة مساحات أطول من النص.
  • التشغيل محليًا على الأجهزة المحمولة: يمكن ضغط Phi-3 Mini إلى 4 بت، ويشغل حوالي 1.8 جيجابايت من الذاكرة، على غرار Phi-2. تم اختباره وهو يعمل دون الاتصال بالإنترنت على iPhone 14 باستخدام شريحة A16 Bionic، حيث حقق سرعة معالجة تزيد عن 12 رمزًا في الثانية، مما يتوافق مع أداء Phi-2 في ظل ظروف مماثلة.
  • نموذج الحجم: مع 3.8 مليار معلمة، يتمتع Phi-3 Mini بمقياس أكبر من Phi-2، الذي يحتوي على 2.7 مليار معلمة. وهذا يعكس قدراتها المتزايدة.
  • بيانات التدريب: على عكس Phi-2، الذي تم تدريبه على 1.4 تريليون رمز، تم تدريب Phi-3 Mini على مجموعة أكبر بكثير من 3.3 تريليون رمز، مما يسمح له بتحقيق فهم أفضل لأنماط اللغة المعقدة.

معالجة قيود Phi-3 Mini

في حين يُظهر جهاز Phi-3 Mini تطورات كبيرة في مجال نماذج اللغات الصغيرة، إلا أنه لا يخلو من القيود. يتمثل القيد الأساسي لـ Phi-3 Mini، نظرًا لصغر حجمه مقارنة بنماذج اللغات الضخمة، في قدرته المحدودة على تخزين المعرفة الواقعية الواسعة. يمكن أن يؤثر ذلك على قدرته على التعامل بشكل مستقل مع الاستفسارات التي تتطلب عمقًا في البيانات الواقعية المحددة أو معرفة الخبراء التفصيلية. ومع ذلك يمكن التخفيف من ذلك من خلال دمج Phi-3 Mini مع محرك البحث. وبهذه الطريقة يمكن للنموذج الوصول إلى نطاق أوسع من المعلومات في الوقت الفعلي، والتعويض بشكل فعال عن قيود المعرفة المتأصلة فيه. يمكّن هذا التكامل جهاز Phi-3 Mini من العمل كمتحدث ذو قدرة عالية، والذي، على الرغم من الفهم الشامل للغة والسياق، قد يحتاج أحيانًا إلى "البحث" عن المعلومات لتقديم إجابات دقيقة وحديثة.

التوفر

Phi-3 متاح الآن على عدة منصات، بما في ذلك مايكروسوفت أزور AI ستوديو, وجه يعانقو أولاما. في Azure AI، يتضمن النموذج سير عمل النشر والتقييم والضبط الدقيق، وفي Ollama، يمكن تشغيله محليًا على أجهزة الكمبيوتر المحمولة. تم تصميم النموذج من أجل وقت تشغيل ONNX ويدعم ويندوز دايركتملمما يضمن أنه يعمل بشكل جيد عبر أنواع الأجهزة المختلفة مثل وحدات معالجة الرسومات ووحدات المعالجة المركزية والأجهزة المحمولة. بالإضافة إلى ذلك، يتم تقديم Phi-3 كخدمة صغيرة عبر نفيديا نيم، مزود بواجهة برمجة تطبيقات قياسية لسهولة النشر عبر بيئات مختلفة ومُحسّن خصيصًا لوحدات معالجة الرسومات NVIDIA. تخطط Microsoft لتوسيع سلسلة Phi-3 في المستقبل القريب من خلال إضافة طرازات Phi-3-small (7B) وPhi-3-medium (14B)، مما يوفر للمستخدمين خيارات إضافية لتحقيق التوازن بين الجودة والتكلفة.

الخط السفلي

يحقق جهاز Phi-3 Mini من Microsoft خطوات كبيرة في مجال الذكاء الاصطناعي من خلال تكييف قوة نماذج اللغات الكبيرة للاستخدام المحمول. يعمل هذا النموذج على تحسين تفاعل المستخدم مع الأجهزة من خلال معالجة أسرع وفي الوقت الفعلي وميزات الخصوصية المحسنة. فهو يقلل من الحاجة إلى الخدمات المستندة إلى السحابة، مما يقلل من تكاليف التشغيل ويوسع نطاق تطبيقات الذكاء الاصطناعي في مجالات مثل الرعاية الصحية والأتمتة المنزلية. مع التركيز على الحد من التحيز من خلال تعلم المناهج الدراسية والحفاظ على الأداء التنافسي، يتطور جهاز Phi-3 Mini ليصبح أداة رئيسية للذكاء الاصطناعي المحمول الفعال والمستدام، مما يؤدي بمهارة إلى تحويل كيفية تفاعلنا مع التكنولوجيا يوميًا.

الدكتور تحسين ضياء هو أستاذ مشارك دائم في جامعة كومساتس إسلام أباد، ويحمل درجة الدكتوراه في الذكاء الاصطناعي من جامعة فيينا للتكنولوجيا، النمسا. متخصص في الذكاء الاصطناعي، والتعلم الآلي، وعلوم البيانات، ورؤية الكمبيوتر، وقد قدم مساهمات كبيرة من خلال منشورات في المجلات العلمية ذات السمعة الطيبة. كما قاد الدكتور تحسين العديد من المشاريع الصناعية كمحقق رئيسي وعمل كمستشار في الذكاء الاصطناعي.