الذكاء الاصطناعي العام
Inflection-2.5: محرك LLM القوي المنافس لجبت-4 و Gemini
Inflection AI قد أحدثت ضجة في مجال النماذج اللغوية الكبيرة (LLMs) مع الكشف عن Inflection-2.5، وهو نموذج منافس للنماذج الرائدة في العالم، بما في ذلك GPT-4 و Gemini من جوجل.
ازدادت صعود Inflection AI بسرعة بفضل جولة تمويل ضخمة بقيمة 1.3 مليار دولار، بقيادة عمالقة الصناعة مثل مايكروسوفت وNVIDIA ومستثمرين مشهورين مثل ريد هوفمان وبيل غيتس واريك شميت. يرفع هذا الاستثمار الإجمالي للمستثمرات التي جمعتها الشركة إلى 1.525 مليار دولار.
بالتعاون مع الشركاء CoreWeave وNVIDIA، تقوم Inflection AI ببناء أكبر кластер AI في العالم، يتألف من 22,000 وحدة معالجة رسومات H100 Tensor Core من NVIDIA. سيدعم هذا القدر الهائل من القوة الحاسوبية تدريب وتحديث جيل جديد من نماذج AI كبيرة النطاق، مما يسمح لشركة Inflection AI بالتوسع في حدود ما هو ممكن في مجال الذكاء الاصطناعي الشخصي.
أدت الأعمال الرائدة للشركة إلى نتائج متميزة، حيث حقق кластер Inflection AI، الذي يتألف حاليًا من أكثر من 3,500 وحدة معالجة رسومات H100 Tensor Core من NVIDIA، أداءً على أعلى مستوى في اختبار MLPerf المفتوح. في تقديم مشترك مع CoreWeave وNVIDIA، أكمل الكلاستر مهمة التدريب المرجعية للنماذج اللغوية الكبيرة في غضون 11 دقيقة فقط، مما يؤكد موقعه كأسرع кластер في هذا الاختبار.
يتبع هذا الإنجاز الكشف عن Inflection-1، نموذج LLM الداخلي لشركة Inflection AI، الذي تم وصفه بأنه أفضل نموذج في فئته. حيث يتفوق على عمالقة الصناعة مثل GPT-3.5 وLLaMA وChinchilla وPaLM-540B في مجموعة من الاختبارات الشائعة المستخدمة لمقارنة النماذج LLM، يتيح Inflection-1 للمستخدمين التفاعل مع Pi، الذكاء الاصطناعي الشخصي لشركة Inflection AI، بطريقة بسيطة وطبيعية، والحصول على معلومات وساعد سريعة ومفيدة.
تظهر التزام شركة Inflection AI بالشفافية وإمكانية التكرار في إصدار مذكرة تقنية تفاصيل تقييم أداء Inflection-1 على مختلف الاختبارات. تكشف المذكرة أن Inflection-1 يتفوق على النماذج في نفس فئة الحوسبة، والتي تعرف بأنها نماذج تم تدريبها باستخدام ما يصل إلى عمليات الفاصلة العائمة (FLOPs) من PaLM-540B.
يبرز نجاح Inflection-1 وتوسيع البنية التحتية الحاسوبية بسرعة، مدفوعًا بجولة التمويل الكبيرة، التزام شركة Inflection AI بتقديم مهمتها لإنشاء ذكاء اصطناعي شخصي للجميع. مع دمج Inflection-1 في Pi، يمكن للمستخدمين الآن استيعاب قوة الذكاء الاصطناعي الشخصي، والاستفادة من شخصيته المتعاطفة ومعيار الأمان.
Inflection-2.5
Inflection-2.5 متاح الآن لجميع مستخدمي Pi، مساعد الذكاء الاصطناعي الشخصي لشركة Inflection AI، عبر منصات متعددة، بما في ذلك الويب (pi.ai) وiOS وAndroid وتطبيق سطح المكتب الجديد. يعتبر هذا التكامل علامة فارقة في مهمة شركة Inflection AI لإنشاء ذكاء اصطناعي شخصي للجميع، حيث يجمع بين القدرة الخام وpersonality المتعاطفة ومعيار الأمان.
قفزة في الأداء كان نموذج شركة Inflection AI السابق، Inflection-1، يستخدم حوالي 4% من عمليات الفاصلة العائمة (FLOPs) من GPT-4 وأظهر أداءً متوسطًا يبلغ حوالي 72% مقارنةً بـGPT-4 عبر مجموعة من المهام الموجهة إلى الذكاء. مع Inflection-2.5، حققت شركة Inflection AI تحسنًا كبيرًا في القدرات الفكرية لشركة Pi، مع التركيز على البرمجة والرياضيات.
يظهر أداء النموذج على معايير الصناعة الرئيسية قوته، حيث يظهر أكثر من 94% من أداء GPT-4 المتوسط عبر مجموعة من المهام، مع التركيز بشكل خاص على التميز في مجالات STEM. هذا الإنجاز المذهل هو شهادة على التزام شركة Inflection AI بتحقيق التقدم التكنولوجي مع الحفاظ على التركيز على تجربة المستخدم والأمان.
البرمجة والرياضيات يبرز Inflection-2.5 في البرمجة والرياضيات، حيث يظهر تحسنًا يزيد عن 10% على Inflection-1 في BIG-Bench-Hard، وهو مجموعة فرعية من المشاكل الصعبة للنماذج اللغوية الكبيرة. تكشف معايير البرمجة MBPP+ وHumanEval+ عن تحسينات كبيرة على Inflection-1، مما يؤكد موقف Inflection-2.5 كقوة هامة في مجال البرمجة.
على معيار MBPP+، يتفوق Inflection-2.5 على سابقه بفارق كبير، حيث يظهر مستوى أداء قابل للمقارنة مع GPT-4، حسبما أفادت DeepSeek Coder. وبالمثل، على معيار HumanEval+، يظهر Inflection-2.5 تقدمًا ملحوظًا، حيث يتفوق على أداء Inflection-1 ويتقرب من مستوى GPT-4، حسبما أفادت EvalPlus leaderboard.
السيطرة على معايير الصناعة
يبرز Inflection-2.5 في معايير الصناعة، حيث يظهر تحسينات كبيرة على Inflection-1 في معيار MMLU ومعيار GPQA Diamond، الذي يتميز بالصعوبة على مستوى الخبراء. يؤكد أداء النموذج على هذه المعايير قدرته على التعامل مع مجموعة واسعة من المهام، من مشاكل المدرسة الثانوية إلى التحديات على مستوى المحترفين.
التميز في الامتحانات العلمية يمتد قوة النموذج إلى الامتحانات العلمية، حيث يظهر أداءً متميزًا في امتحان الرياضيات الهنغاري وامتحان GRE للفيزياء. في امتحان الرياضيات الهنغاري، يظهر Inflection-2.5 قدرته الرياضية من خلال الاستفادة من الدفعة القليلة المقدمة والتنسيق، مما يسمح بسهولة التكرار.
في امتحان GRE للفيزياء، وهو امتحان قبول الدراسات العليا في الفيزياء، يصل Inflection-2.5 إلى النسبة 85 من المتقدمين البشر في maj@8 (التصويت الأكثر شيوعًا عند 8)، مما يؤكد موقعه كمنافس قوي في مجال حل مشاكل الفيزياء. بالإضافة إلى ذلك، يصل النموذج إلى أعلى الدرجات في maj@32، مما يظهر قدرته على التعامل مع مشاكل الفيزياء المعقدة بدقة ملحوظة.
تحسين تجربة المستخدم لا يُحافظ Inflection-2.5 فقط على شخصية Pi المميزة ومعيار الأمان، بل يرفع أيضًا من وضعها كذكاء اصطناعي شخصي متعدد الاستخدامات عبر مواضيع متنوعة. من مناقشة الأحداث الجارية إلى طلب التوصيات المحلية، والدراسة للاختبارات، والبرمجة، وحتى المحادثات غير الرسمية، يعد Pi مدعومًا بتقنيات Inflection-2.5 واعدًا بتجربة مستخدم غنية.
مع قدرات Inflection-2.5 القوية، يتعامل المستخدمون مع Pi على نطاق أوسع من المواضيع أكثر من أي وقت مضى. يضمن khả năng النموذج في التعامل مع المهام المعقدة، مع شخصيته المتعاطفة وخصائص البحث على الويب في الوقت الفعلي، أن المستخدمين يحصلون على معلومات وارشادات عالية الجودة ومحدثة.
التفاعل والاستمرار للمستخدمين يظهر تأثير دمج Inflection-2.5 في Pi بالفعل في مشاعر المستخدمين ومتغيرات التفاعل والاستمرار. وقد شهدت شركة Inflection AI تسارعًا كبيرًا في نمو المستخدمين النشطين يوميًا، حيث يتبادل أكثر من مليون مستخدم نشط يوميًا وستة ملايين مستخدم نشط شهريًا أكثر من أربعة مليارات رسالة مع Pi.
بمعدل، تستمر المحادثات مع Pi لمدة 33 دقيقة، ويستمر واحد من كل عشرة مستخدمين في التفاعل مع Pi لمدة تزيد عن ساعة كل يوم. بالإضافة إلى ذلك، يعود حوالي 60% من الأشخاص الذين يتفاعلون مع Pi في أسبوع معين في الأسبوع التالي، مما يظهر لزومًا أشهر من المنافسين الرائدين في هذا المجال.
التفاصيل الفنية وشفافية المعايير
تماشيًا مع التزام شركة Inflection AI بالشفافية وإمكانية التكرار، قدمت الشركة نتائج تقنية شاملة وتفاصيل حول أداء Inflection-2.5 عبر معايير الصناعة المختلفة.
على سبيل المثال، على الإصدار المُصحح من مجموعة بيانات MT-Bench، الذي يعالج مشاكل الحلول المرجعية غير الصحيحة والافتراضات المعيبة في مجموعة البيانات الأصلية، يظهر Inflection-2.5 أداءً يتوافق مع التوقعات بناءً على معايير أخرى.
كما قيمت شركة Inflection AI أداء Inflection-2.5 على HellaSwag وARC-C، معايير الشعور السليم والعلوم التي أبلغ عنها مجموعة واسعة من النماذج، ويوضح النتائج أداءً قويًا على هذه المعايير المشبعة.
من المهم ملاحظة أن التقييمات المقدمة تمثل النموذج الذي يدير Pi، وقد تختلف تجربة المستخدم قليلاً بسبب عوامل مثل تأثير استرجاع الويب (الذي لم يتم استخدامه في المعايير)، هيكل الدفعة القليلة، والاختلافات الأخرى في الإنتاج.
الاستنتاج
يمثل Inflection-2.5 قفزة كبيرة في مجال النماذج اللغوية الكبيرة، حيث يتنافس مع قدرات الرائدين في الصناعة مثل GPT-4 وGemini، مع استخدام جزء صغير من الموارد الحاسوبية. مع أدائه المتميز عبر مجموعة واسعة من المعايير، خاصة في مجالات STEM والبرمجة والرياضيات، يضع Inflection-2.5 نفسه كمنافس قوي في مشهد الذكاء الاصطناعي.
يدل دمج Inflection-2.5 في Pi، مساعد الذكاء الاصطناعي الشخصي لشركة Inflection AI، على تجربة مستخدم محسنة، حيث يجمع بين القدرة الخام وpersonality المتعاطفة ومعيار الأمان. مع استمرار شركة Inflection AI في دفع حدود ما هو ممكن مع النماذج LLM، ينتظر مجتمع الذكاء الاصطناعي بفارغ الصبر الموجة القادمة من الابتكارات والانجازات من هذه الشركة الرائدة.














