الذكاء الاصطناعي
تقدم شركة Cerebras أسرع حل استدلال للذكاء الاصطناعي في العالم: سرعة 20x بجزء بسيط من التكلفة

نظم Cerebras، الشركة الرائدة في مجال حوسبة الذكاء الاصطناعي عالية الأداء، قدمت حلاً مبتكرًا تم إعداده لإحداث ثورة في استدلال الذكاء الاصطناعي. وفي 27 أغسطس 2024، أعلنت الشركة عن إطلاق خدمة Cerebras Inference، وهي أسرع خدمة استدلال للذكاء الاصطناعي في العالم. بفضل مقاييس الأداء التي تتضاءل أمام تلك الخاصة بالأنظمة التقليدية المعتمدة على وحدة معالجة الرسومات، توفر Cerebras Inference سرعة تعادل 20 ضعفًا مقابل جزء صغير من التكلفة، مما يضع معيارًا جديدًا في حوسبة الذكاء الاصطناعي.
سرعة غير مسبوقة وكفاءة في التكلفة
تم تصميم Cerebras Inference لتقديم أداء استثنائي عبر نماذج الذكاء الاصطناعي المختلفة، لا سيما في قطاع سريع التطور نماذج اللغات الكبيرة (ماجستير في القانون). على سبيل المثال، تقوم بمعالجة 1,800 رمزًا في الثانية لنموذج Llama 3.1 8B و450 رمزًا في الثانية لنموذج Llama 3.1 70B. وهذا الأداء ليس أسرع بـ 20 مرة فقط من أداء الحلول المستندة إلى NVIDIA GPU ولكنه يأتي أيضًا بتكلفة أقل بكثير. تقدم Cerebras هذه الخدمة بسعر يبدأ من 10 سنتات فقط لكل مليون رمز لنموذج Llama 3.1 8B و60 سنتًا لكل مليون رمز لنموذج Llama 3.1 70B، مما يمثل تحسنًا بمقدار 100 مرة في أداء السعر مقارنة بالعروض القائمة على وحدة معالجة الرسومات.
الحفاظ على الدقة أثناء تجاوز حدود السرعة
أحد الجوانب الأكثر إثارة للإعجاب في Cerebras Inference هو قدرته على الحفاظ على أحدث دقة مع تقديم سرعة لا مثيل لها. على عكس الأساليب الأخرى التي تضحي بالدقة من أجل السرعة، يظل حل Cerebras ضمن نطاق 16 بت طوال فترة تشغيل الاستدلال. وهذا يضمن أن مكاسب الأداء لا تأتي على حساب جودة مخرجات نموذج الذكاء الاصطناعي، وهو عامل حاسم للمطورين الذين يركزون على الدقة.
وسلط ميكا هيل سميث، المؤسس المشارك والرئيس التنفيذي لشركة التحليل الاصطناعي، الضوء على أهمية هذا الإنجاز: "تقدم Cerebras سرعات أكبر بكثير من الحلول المعتمدة على وحدة معالجة الرسومات لنماذج Meta's Llama 3.1 8B و70B AI. نحن نقيس سرعات أعلى من 1,800 رمز إخراج في الثانية على Llama 3.1 8B، وأكثر من 446 رمز إخراج في الثانية على Llama 3.1 70B - وهو رقم قياسي جديد في هذه المعايير."
الأهمية المتزايدة لاستدلال الذكاء الاصطناعي
استنتاج الذكاء الاصطناعي هو القطاع الأسرع نموًا في حوسبة الذكاء الاصطناعي، حيث يمثل حوالي 40% من إجمالي سوق أجهزة الذكاء الاصطناعي. إن ظهور استدلال الذكاء الاصطناعي عالي السرعة، مثل ذلك الذي تقدمه شركة سيريبراس، يشبه إدخال الإنترنت عريض النطاق - مما يفتح فرصًا جديدة ويبشر بعصر جديد لتطبيقات الذكاء الاصطناعي. باستخدام Cerebras Inference، يمكن للمطورين الآن إنشاء تطبيقات الذكاء الاصطناعي من الجيل التالي التي تتطلب أداءً معقدًا في الوقت الفعلي، مثل وكلاء الذكاء الاصطناعي والأنظمة الذكية.
أكد أندرو إنج، مؤسس DeepLearning.AI، على أهمية السرعة في تطوير الذكاء الاصطناعي: "يحتوي DeepLearning.AI على العديد من مسارات العمل الوكيلة التي تتطلب مطالبة ماجستير إدارة الأعمال بشكل متكرر للحصول على نتيجة. قامت Cerebras ببناء قدرة استدلال سريعة بشكل مثير للإعجاب والتي ستكون مفيدة جدًا لأعباء العمل هذه."
دعم الصناعة واسعة النطاق والشراكات الاستراتيجية
حصلت Cerebras على دعم قوي من قادة الصناعة وشكلت شراكات استراتيجية لتسريع تطوير تطبيقات الذكاء الاصطناعي. أكد كيم برانسون، نائب الرئيس الأول للذكاء الاصطناعي/تعلم الآلة في شركة GlaxoSmithKline، أحد عملاء Cerebras الأوائل، على الإمكانات التحويلية لهذه التكنولوجيا: "السرعة والحجم يغيران كل شيء."
شركات أخرى، مثل LiveKit، حيرةوMeter أيضًا عن حماسهم للتأثير الذي سيحدثه Cerebras Inference على عملياتهم. تستفيد هذه الشركات من قوة القدرات الحاسوبية لشركة Cerebras لإنشاء تجارب ذكاء اصطناعي أكثر استجابة وشبه بشرية، وتحسين تفاعل المستخدم في محركات البحث، وتعزيز أنظمة إدارة الشبكة.
استنتاج Cerebras: الطبقات وإمكانية الوصول
يتوفر Cerebras Inference عبر ثلاث مستويات بأسعار تنافسية: مجاني، ومطور، ومؤسسي. توفر الطبقة المجانية وصولاً مجانيًا لواجهة برمجة التطبيقات (API) مع حدود استخدام سخية، مما يجعلها في متناول مجموعة واسعة من المستخدمين. توفر طبقة المطورين خيار نشر مرن بدون خادم، مع نماذج Llama 3.1 بسعر 10 سنتات و60 سنتًا لكل مليون رمز مميز. تلبي فئة Enterprise احتياجات المؤسسات ذات أعباء العمل المستمرة، وتقدم نماذج مضبوطة بدقة، واتفاقيات مستوى خدمة مخصصة، ودعمًا مخصصًا، مع توفر الأسعار عند الطلب.
تعزيز استنتاج Cerebras: محرك مقياس الويفر 3 (WSE-3)
في قلب Cerebras Inference يوجد نظام Cerebras CS-3، المدعوم بمحرك Wafer Scale Engine 3 (WSE-3) الرائد في الصناعة. معالج الذكاء الاصطناعي هذا لا مثيل له من حيث الحجم والسرعة، حيث يوفر نطاق ترددي للذاكرة أكبر بـ 7,000 مرة من معالج NVIDIA's H100. يتيح النطاق الضخم لـ WSE-3 التعامل مع العديد من المستخدمين المتزامنين، مما يضمن سرعات مذهلة دون المساس بالأداء. تسمح هذه البنية لشركة Cerebras بتجنب المقايضات التي عادة ما تصيب الأنظمة المستندة إلى وحدة معالجة الرسومات، مما يوفر الأداء الأفضل في فئته لأحمال عمل الذكاء الاصطناعي.
التكامل السلس وواجهة برمجة التطبيقات الصديقة للمطورين
تم تصميم Cerebras Inference مع وضع المطورين في الاعتبار. ويتميز بواجهة برمجة تطبيقات متوافقة تمامًا مع OpenAI Chat Completions API، مما يسمح بالانتقال بسهولة مع الحد الأدنى من تغييرات التعليمات البرمجية. يضمن هذا النهج الصديق للمطورين أن يكون دمج Cerebras Inference في سير العمل الحالي سلسًا قدر الإمكان، مما يتيح النشر السريع لتطبيقات الذكاء الاصطناعي عالية الأداء.
أنظمة سيريبراس: قيادة الابتكار عبر الصناعات
إن شركة Cerebras Systems ليست مجرد شركة رائدة في مجال حوسبة الذكاء الاصطناعي ولكنها أيضًا لاعب رئيسي في مختلف الصناعات، بما في ذلك الرعاية الصحية والطاقة والحكومة والحوسبة العلمية والخدمات المالية. لقد لعبت حلول الشركة دورًا أساسيًا في تحقيق التقدم في مؤسسات مثل National Laboratories، وAleph Alpha، وMayo Clinic، وGlaxoSmithKline.
ومن خلال توفير سرعة وقابلية توسع ودقة لا مثيل لها، تعمل Cerebras على تمكين المؤسسات عبر هذه القطاعات من معالجة بعض المشكلات الأكثر صعوبة في الذكاء الاصطناعي وخارجه. سواء كان الأمر يتعلق بتسريع اكتشاف الأدوية في مجال الرعاية الصحية أو تعزيز القدرات الحسابية في البحث العلمي، فإن Cerebras هي في طليعة قيادة الابتكار.
الخلاصة: عصر جديد لاستدلال الذكاء الاصطناعي
تضع شركة Cerebras Systems معيارًا جديدًا لاستدلال الذكاء الاصطناعي من خلال إطلاق Cerebras Inference. من خلال تقديم 20 ضعف سرعة الأنظمة التقليدية المعتمدة على وحدة معالجة الرسومات بجزء بسيط من التكلفة، فإن Cerebras لا تجعل الذكاء الاصطناعي أكثر سهولة فحسب، بل تمهد الطريق أيضًا للجيل القادم من تطبيقات الذكاء الاصطناعي. بفضل تقنيتها المتطورة وشراكاتها الإستراتيجية والتزامها بالابتكار، تستعد Cerebras لقيادة صناعة الذكاء الاصطناعي إلى عصر جديد من الأداء غير المسبوق وقابلية التوسع.
لمزيد من المعلومات حول أنظمة Cerebras وتجربة Cerebras Inference، تفضل بزيارة www.cerebras.ai.