الذكاء الاصطناعي العام

Inflection-2.5: نموذج لغة كبير يتنافس مع GPT-4 وGemini

mm
Inflection-2.5 PI

Inflection AI قد أحدثت ضجة في مجال النماذج اللغوية الكبيرة (LLMs) مع الكشف عن Inflection-2.5، وهو نموذج يتنافس مع النماذج اللغوية الكبيرة الرائدة في العالم، بما في ذلك GPT-4 وGemini من Google.

الارتفاع السريع لشركة Inflection AI قد تم تعزيزه من خلال جولة تمويل ضخمة بقيمة 1.3 مليار دولار، بقيادة عمالقة الصناعة مثل Microsoft وNVIDIA ومستثمرين مشهورين بما في ذلك ريد هوفمان وبيل غيتس واريك شميدت. هذا الاستثمار الكبير يرفع الإجمالي الاستثماري لشركة إلى 1.525 مليار دولار.

في сотруд مع شركاء CoreWeave وNVIDIA، تعمل Inflection AI على بناء أكبر кластер إيه آي في العالم، يتألف من 22,000 وحدة معالجة رسومات H100 Tensor Core من NVIDIA. هذا القدر الهائل من القوة الحاسوبية سيدعم تدريب وتحديث جيل جديد من النماذج الإيه آي الكبيرة، مما يسمح لشركة Inflection AI بتحقيق تقدم في مجال الإيه آي الشخصي.

العمل الرائد للشركة قد أنتج بالفعل نتائج ملحوظة، حيث حقق кластер Inflection AI، الذي يتألف حاليًا من أكثر من 3,500 وحدة معالجة رسومات H100 Tensor Core من NVIDIA، أداءً على مستوى الفن في اختبار MLPerf المفتوح. في تقديم مشترك مع CoreWeave وNVIDIA، أكمل الكلاستر مهمة التدريب المرجعية للنماذج اللغوية الكبيرة في غضون 11 دقيقة، مما يؤكد موقعه كأسرع кластер في هذا الاختبار.

يتلو هذا الإنجاز الكشف عن Inflection-1، نموذج لغة كبير داخلي لشركة Inflection AI، الذي تم وصفه بأنه أفضل نموذج في فئته الحاسوبية. حيث يتفوق على عمالقة الصناعة مثل GPT-3.5 وLLaMA وChinchilla وPaLM-540B في مجموعة من الاختبارات الشائعة المستخدمة لمقارنة النماذج اللغوية الكبيرة، يسمح Inflection-1 للمستخدمين بالتفاعل مع Pi، مساعد الإيه آي الشخصي لشركة Inflection AI، بطريقة بسيطة وطبيعية، ويتلقون معلومات وساعدة سريعة وملائمة.

التزام شركة Inflection AI بالشفافية والتناسق واضح في إصدار مذكرة تقنية تفاصيل فيها تقييم أداء Inflection-1 على مختلف الاختبارات. تكشف المذكرة أن Inflection-1 يتفوق على النماذج في نفس فئة الحوسبة، التي يتم تعريفها على أنها نماذج تم تدريبها باستخدام معاملات الفاصلة العائمة من PaLM-540B.

ينصب نجاح Inflection-1 والتوسع السريع في بنية الحوسبة للشركة، مدفوعًا بالجولة الكبيرة من التمويل، على إظهار التزام شركة Inflection AI بتحقيق مهمتها في إنشاء إيه آي شخصي للجميع. مع دمج Inflection-1 في Pi، يمكن للمستخدمين الآن الاستمتاع بقوة الإيه آي الشخصي، والاستفادة من شخصيته المتعاطفة وفائدة وأمانه.

Inflection-2.5

Inflection-2.5 متاح الآن لجميع مستخدمي Pi، مساعد الإيه آي الشخصي لشركة Inflection AI، عبر منصات متعددة، بما في ذلك الويب (pi.ai) وiOS وAndroid وتطبيق سطح المكتب الجديد. يعتبر هذا التكامل خطوة مهمة في مهمة شركة Inflection AI لإنشاء إيه آي شخصي للجميع، حيث يجمع بين القدرة الخام وشخصية متعاطفة ومعايير أمان.

قفزة في الأداء نموذج شركة Inflection AI السابق، Inflection-1، استخدم حوالي 4% من معاملات الفاصلة العائمة لتدريب GPT-4 وأظهر أداءً متوسطًا يبلغ حوالي 72% مقارنةً بـGPT-4 عبر مهام مختلفة موجهة إلى الذكاء. مع Inflection-2.5، حققت شركة Inflection AI تحسنًا كبيرًا في القدرات الفكرية لPi، مع التركيز على البرمجة والرياضيات.

أداء النموذج على الاختبارات الصناعية الرئيسية يظهر قوته، حيث يظهر أكثر من 94% من أداء GPT-4 المتوسط عبر مهام مختلفة، مع التركيز على التميز في مجالات العلوم والتقنية والهندسة والرياضيات. هذا الإنجاز المذهل هو شهادة على التزام شركة Inflection AI بتحقيق تقدم تقني مع الحفاظ على تركيز قوي على تجربة المستخدم وأمانه.

البرمجة والرياضيات قوة Inflection-2.5 تبرز في البرمجة والرياضيات، حيث يظهر تحسنًا يزيد عن 10% مقارنةً بـInflection-1 على BIG-Bench-Hard، مجموعة فرعية من المشاكل الصعبة للنماذج اللغوية الكبيرة. تكشف两个 اختبار للبرمجة، MBPP+ وHumanEval+، تحسينات كبيرة على Inflection-1، مما يؤكد موقف Inflection-2.5 كقوة يجب مراعاتها في مجال البرمجة.

على اختبار MBPP+، يتفوق Inflection-2.5 على سلفه بفارق كبير، حيث يظهر مستوى أداء مشابه لما لدى GPT-4، حسب ما ورد في DeepSeek Coder. وبالمثل، على اختبار HumanEval+، يظهر Inflection-2.5 تقدمًا ملحوظًا، متجاوزًا أداء Inflection-1 واقترابًا من مستوى GPT-4، حسب ما ورد على لوحة EvalPlus.

هيمنة معايير الصناعة

يبرز Inflection-2.5 في معايير الصناعة، حيث يظهر تحسينات كبيرة على Inflection-1 على اختبار MMLU واختبار GPQA Diamond، الذي يتميز بالصعوبة على مستوى الخبراء. يؤكد أداء النموذج على هذه الاختبارات قدرته على التعامل مع مجموعة واسعة من المهام، من مشاكل المدرسة الثانوية إلى التحديات على مستوى المهنيين.

التميز في الامتحانات العلمية يمتد قوة النموذج إلى الامتحانات العلمية، حيث يظهر أداءً ممتازًا في امتحان الرياضيات الهنغاري وامتحان GRE للفيزياء. في امتحان الرياضيات الهنغاري، يظهر Inflection-2.5 قدرته الرياضية من خلال الاستفادة من الدفع القليل وتنسيقها، مما يسمح بسهولة التكرار.

في امتحان GRE للفيزياء، امتحان القبول للدراسات العليا في الفيزياء، يصل Inflection-2.5 إلى النسبة 85 من المتقدمين البشر في maj@8 (التصويت الأكثر شعبية عند 8)، مما يؤكد موقعه كمنافس قوي في مجال حل مشاكل الفيزياء. بالإضافة إلى ذلك، يقترب النموذج من أعلى درجة في maj@32، مما يظهر قدرته على التعامل مع مشاكل فيزياء معقدة بدقة ملحوظة.

تحسين تجربة المستخدم لا يقتصر Inflection-2.5 على الحفاظ على شخصية Pi المتعاطفة ومعايير الأمان، بل يرفع من وضعها كإيه آي شخصي متعدد الاستخدامات عبر مواضيع متنوعة. من مناقشة الأحداث الجارية إلى طلب التوصيات المحلية، ودراسة الامتحانات، والبرمجة، وحتى المحادثات غير الرسمية، يpromis Inflection-2.5 تجربة مستخدم محسنة.

بفضل قدرات Inflection-2.5 القوية، يتفاعل المستخدمون مع Pi على نطاق أوسع من المواضيع أكثر من أي وقت مضى. قدرة النموذج على التعامل مع المهام المعقدة، متوافقة مع شخصيته المتعاطفة وقدراته البحثية على الويب في الوقت الفعلي، يضمن للمستخدمين الحصول على معلومات وارشادات عالية الجودة ومحدثة.

استخدام المستخدم وتفاعله تأثير دمج Inflection-2.5 في Pi واضح في مشاعر المستخدم ومتغيرات التفاعل والاحتفاظ. تشهد شركة Inflection AI تسارعًا كبيرًا في نمو المستخدمين العضويين، مع مليون مستخدم نشط يوميًا وستة ملايين مستخدم نشط شهرًا يتبادلون أكثر من أربعة مليارات رسالة مع Pi.

بمتوسط، تستمر المحادثات مع Pi لمدة 33 دقيقة، حيث يستمر واحد من كل عشرة محادثات لمدة تزيد عن ساعة كل يوم. بالإضافة إلى ذلك، يعود حوالي 60% من الأشخاص الذين يتفاعلون مع Pi في أسبوع معين إلى التفاعل في الأسبوع التالي، مما يظهر لزومًا شهرًا أعلى من المنافسين الرائدين في هذا المجال.

التفاصيل الفنية وشفافية المعايير

في خطوة متوافقة مع التزام شركة Inflection AI بالشفافية والتناسق، قدمت الشركة نتائج تقنية شاملة وتفاصيل حول أداء Inflection-2.5 على معايير الصناعة المختلفة.

على سبيل المثال، على الإصدار المعدل من مجموعة بيانات MT-Bench، الذي يعالج القضايا المتعلقة بالحلول المرجعية غير الصحيحة والافتراضات الخاطئة في مجموعة البيانات الأصلية، يظهر Inflection-2.5 أداءً يتوافق مع التوقعات بناءً على اختبارات أخرى.

كما قامت شركة Inflection AI بتقييم Inflection-2.5 على HellaSwag وARC-C، اختبارات الشائعة والعلمية التي يتم الإبلاغ عنها من قبل مجموعة واسعة من النماذج، ويوضح النتائج أداءً قويًا على هذه الاختبارات المشبعة.

من المهم ملاحظة أن التقييمات المقدمة تمثل النموذج الذي ي驱ر Pi، ويمكن أن تختلف تجربة المستخدم قليلاً بسبب عوامل مثل تأثير استرجاع الويب (الذي لم يتم استخدامه في الاختبارات)، هيكل الدفع القليل، والاختلافات الأخرى في الإنتاج.

الختام

يمثل Inflection-2.5 خطوة كبيرة إلى الأمام في مجال النماذج اللغوية الكبيرة، حيث يتنافس مع قدرات النماذج الرائدة في الصناعة مثل GPT-4 وGemini، مع استخدام جزء صغير فقط من الموارد الحاسوبية. مع أدائه الممتاز على نطاق واسع من الاختبارات، خاصة في مجالات العلوم والتقنية والهندسة والرياضيات والبرمجة، يضع Inflection-2.5 نفسه كمنافس قوي في مشهد الإيه آي.

دمج Inflection-2.5 في Pi، مساعد الإيه آي الشخصي لشركة Inflection AI، يpromis تجربة مستخدم محسنة، حيث يجمع بين القدرة الخام وشخصية متعاطفة ومعايير أمان. مع استمرار شركة Inflection AI في دفع حدود ما هو ممكن مع النماذج اللغوية الكبيرة، ينتظر مجتمع الإيه آي بفارغ الصبر الموجة التالية من الابتكارات والانجازات من هذه الشركة الرائدة.

يتجاوز نهج شركة Inflection AI الرؤيوي تطوير النماذج فقط، حيث تعترف الشركة بأهمية التدريب المسبق والتعدين الدقيق في إنشاء تجارب إيه آي عالية الجودة وأمنها وفائدة. كاستوديو إيه آي متكامل رأسيًا، تتعامل شركة Inflection AI مع عملية كاملة بدءًا من استهلاك البيانات وتصميم النموذج إلى البنية التحتية عالية الأداء.

لقد قمت بإنفاق الخمس سنوات الماضية في غمرة العالم المثير للاهتمام من التعلم الآلي والتعلم العميق. وقد أدت شغفي وخبرتي إلى المساهمة في أكثر من 50 مشروعًا متنوعًا في هندسة البرمجيات، مع التركيز بشكل خاص على الذكاء الاصطناعي والتعلم الآلي. كما أدت فضولي المستمر إلى جذبي نحو معالجة اللغة الطبيعية، وهو مجال أنا متحمس لاستكشافه بشكل أكبر.