ہمارے ساتھ رابطہ

سیریبراس نے دنیا کا تیز ترین AI انفرنس سلوشن متعارف کرایا: قیمت کے ایک حصے پر 20x رفتار

مصنوعی ذہانت

سیریبراس نے دنیا کا تیز ترین AI انفرنس سلوشن متعارف کرایا: قیمت کے ایک حصے پر 20x رفتار

mm

سیربراس سسٹماعلی کارکردگی والے AI کمپیوٹ میں ایک علمبردار، نے ایک اہم حل متعارف کرایا ہے جو AI تخمینہ میں انقلاب لانے کے لیے تیار ہے۔ 27 اگست 2024 کو، کمپنی نے Cerebras Inference کے آغاز کا اعلان کیا، جو دنیا کی تیز ترین AI inference سروس ہے۔ پرفارمنس میٹرکس کے ساتھ جو روایتی GPU پر مبنی سسٹمز کو بونا کرتے ہیں، Cerebras Inference لاگت کے ایک حصے پر 20 گنا رفتار فراہم کرتا ہے، جو AI کمپیوٹنگ میں ایک نیا بینچ مارک قائم کرتا ہے۔

بے مثال رفتار اور لاگت کی کارکردگی

Cerebras Inference کو مختلف AI ماڈلز میں غیر معمولی کارکردگی فراہم کرنے کے لیے ڈیزائن کیا گیا ہے، خاص طور پر تیزی سے ترقی پذیر طبقہ میں بڑے زبان کے ماڈل (LLMs)۔ مثال کے طور پر، یہ Llama 1,800 3.1B ماڈل کے لیے 8 ٹوکن فی سیکنڈ اور Llama 450 3.1B ماڈل کے لیے 70 ٹوکن فی سیکنڈ پر کارروائی کرتا ہے۔ یہ کارکردگی NVIDIA GPU پر مبنی سلوشنز کے مقابلے میں نہ صرف 20 گنا تیز ہے بلکہ نمایاں طور پر کم قیمت پر بھی آتی ہے۔ Cerebras یہ سروس Llama 10 3.1B ماڈل کے لیے صرف 8 سینٹ فی ملین ٹوکن اور Llama 60 3.1B ماڈل کے لیے 70 سینٹ فی ملین ٹوکن سے شروع کرتے ہوئے پیش کرتا ہے، جو موجودہ GPU پر مبنی پیشکشوں کے مقابلے قیمت کی کارکردگی میں 100x بہتری کی نمائندگی کرتا ہے۔

رفتار کی حدود کو آگے بڑھاتے ہوئے درستگی کو برقرار رکھنا

Cerebras Inference کے سب سے زیادہ متاثر کن پہلوؤں میں سے ایک یہ ہے کہ اس کی بے مثال رفتار فراہم کرتے ہوئے جدید ترین درستگی کو برقرار رکھنے کی صلاحیت ہے۔ دوسرے طریقوں کے برعکس جو رفتار کے لیے درستگی کی قربانی دیتے ہیں، سیریبراس کا حل 16 بٹ ڈومین کے اندر ہی رہتا ہے۔ یہ اس بات کو یقینی بناتا ہے کہ کارکردگی کے فوائد AI ماڈل آؤٹ پٹ کے معیار کی قیمت پر نہیں آتے ہیں، جو کہ درستگی پر مرکوز ڈویلپرز کے لیے ایک اہم عنصر ہے۔

میکاہ ہل اسمتھ، مصنوعی تجزیہ کے شریک بانی اور سی ای او نے اس کامیابی کی اہمیت پر روشنی ڈالی:Cerebras Meta's Llama 3.1 8B اور 70B AI ماڈلز کے لیے GPU پر مبنی حل کے مقابلے میں تیز رفتاری کا آرڈر فراہم کر رہا ہے۔ ہم Llama 1,800 3.1B پر 8 آؤٹ پٹ ٹوکن فی سیکنڈ سے اوپر کی رفتار اور Llama 446 3.1B پر 70 آؤٹ پٹ ٹوکنز فی سیکنڈ سے اوپر کی رفتار کی پیمائش کر رہے ہیں – ان بینچ مارکس میں ایک نیا ریکارڈ۔

اے آئی انفرنس کی بڑھتی ہوئی اہمیت

AI کا اندازہ AI کمپیوٹ کا سب سے تیزی سے ترقی کرنے والا طبقہ ہے، جو کل AI ہارڈویئر مارکیٹ کا تقریباً 40% ہے۔ تیز رفتار AI تخمینہ کی آمد، جیسا کہ Cerebras کی طرف سے پیش کی گئی ہے، براڈ بینڈ انٹرنیٹ کے تعارف کے مترادف ہے- نئے مواقع کو کھولنا اور AI ایپلی کیشنز کے لیے ایک نئے دور کا آغاز کرنا۔ Cerebras Inference کے ساتھ، ڈویلپرز اب اگلی نسل کی AI ایپلی کیشنز بنا سکتے ہیں جن کے لیے پیچیدہ، حقیقی وقت کی کارکردگی، جیسے AI ایجنٹس اور ذہین نظام کی ضرورت ہوتی ہے۔

ڈیپ لرننگ ڈاٹ اے آئی کے بانی اینڈریو این جی نے اے آئی کی ترقی میں رفتار کی اہمیت پر زور دیا:DeepLearning.AI میں متعدد ایجنٹی ورک فلو ہیں جن کے لیے نتیجہ حاصل کرنے کے لیے بار بار LLM کا اشارہ کرنا پڑتا ہے۔ Cerebras نے ایک متاثر کن تیز رفتار اندازہ لگانے کی صلاحیت بنائی ہے جو اس طرح کے کام کے بوجھ کے لیے بہت مددگار ثابت ہوگی۔"

وسیع صنعت کی حمایت اور اسٹریٹجک شراکت داری

Cerebras نے صنعت کے رہنماؤں سے مضبوط حمایت حاصل کی ہے اور AI ایپلی کیشنز کی ترقی کو تیز کرنے کے لیے اسٹریٹجک شراکت داری قائم کی ہے۔ GlaxoSmithKline میں AI/ML کے SVP، Cerebras کے ایک ابتدائی صارف، Kim Branson نے اس ٹیکنالوجی کی تبدیلی کی صلاحیت پر زور دیا: "رفتار اور پیمانہ سب کچھ بدل دیتا ہے۔"

دیگر کمپنیاں، جیسے LiveKit، اضطراب۔، اور میٹر، نے بھی ان کے کاموں پر سیریبراس انفرنس کے اثرات کے لیے جوش و خروش کا اظہار کیا ہے۔ یہ کمپنیاں سیریبراس کی کمپیوٹ صلاحیتوں کی طاقت سے فائدہ اٹھا رہی ہیں تاکہ زیادہ جوابدہ، انسان نما AI تجربات تخلیق کیے جا سکیں، سرچ انجنوں میں صارف کے تعامل کو بہتر بنایا جا سکے، اور نیٹ ورک مینجمنٹ سسٹم کو بہتر بنایا جا سکے۔

سیریبراس انفرنس: درجے اور رسائی

Cerebras Inference تین مسابقتی قیمتوں میں دستیاب ہے: مفت، ڈیولپر، اور انٹرپرائز۔ فری ٹائر فراخ استعمال کی حدوں کے ساتھ مفت API رسائی فراہم کرتا ہے، جو اسے صارفین کی وسیع رینج کے لیے قابل رسائی بناتا ہے۔ ڈیولپر ٹائر ایک لچکدار، سرور کے بغیر تعیناتی کا اختیار پیش کرتا ہے، جس میں Llama 3.1 ماڈلز کی قیمت 10 سینٹ اور 60 سینٹ فی ملین ٹوکن ہے۔ انٹرپرائز ٹائر مسلسل کام کا بوجھ رکھنے والی تنظیموں کو پورا کرتا ہے، فائن ٹیونڈ ماڈلز، کسٹم سروس لیول ایگریمنٹس، اور ڈیڈیکیٹڈ سپورٹ، درخواست پر دستیاب قیمتوں کے ساتھ۔

پاورنگ سیریبراس انفرنس: دی ویفر اسکیل انجن 3 (WSE-3)

Cerebras Inference کے مرکز میں Cerebras CS-3 سسٹم ہے، جو انڈسٹری کے معروف Wafer Scale Engine 3 (WSE-3) سے چلتا ہے۔ یہ AI پروسیسر اپنے سائز اور رفتار میں بے مثال ہے، NVIDIA کے H7,000 سے 100 گنا زیادہ میموری بینڈوڈتھ پیش کرتا ہے۔ WSE-3 کا بڑا پیمانہ کارکردگی پر سمجھوتہ کیے بغیر اس کو بہت سے ایک ساتھ استعمال کرنے والوں کو سنبھالنے کے قابل بناتا ہے۔ یہ فن تعمیر سیریبراس کو تجارتی بندش کو پیچھے چھوڑنے کی اجازت دیتا ہے جو عام طور پر GPU پر مبنی سسٹمز کو طاعون دیتے ہیں، جو AI کام کے بوجھ کے لیے بہترین درجے کی کارکردگی فراہم کرتے ہیں۔

سیملیس انٹیگریشن اور ڈیولپر فرینڈلی API

Cerebras Inference کو ڈویلپرز کو ذہن میں رکھ کر ڈیزائن کیا گیا ہے۔ اس میں ایک ایسا API ہے جو OpenAI Chat Completions API کے ساتھ مکمل طور پر مطابقت رکھتا ہے، جس سے کوڈ میں کم سے کم تبدیلیوں کے ساتھ آسانی سے منتقلی کی اجازت دی گئی ہے۔ یہ ڈویلپر دوستانہ نقطہ نظر اس بات کو یقینی بناتا ہے کہ موجودہ ورک فلو میں سیریبراس انفرنس کو ضم کرنا ہر ممکن حد تک ہموار ہے، جس سے اعلیٰ کارکردگی والی AI ایپلی کیشنز کی تیزی سے تعیناتی ممکن ہو گی۔

سیریبرا سسٹمز: تمام صنعتوں میں جدت طرازی کا آغاز

Cerebras Systems نہ صرف AI کمپیوٹنگ میں ایک رہنما ہے بلکہ صحت کی دیکھ بھال، توانائی، حکومت، سائنسی کمپیوٹنگ، اور مالیاتی خدمات سمیت مختلف صنعتوں میں ایک اہم کھلاڑی ہے۔ کمپنی کے حل نیشنل لیبارٹریز، ایلیف الفا، دی میو کلینک، اور گلیکسو سمتھ کلائن جیسے اداروں میں کامیابیاں حاصل کرنے میں اہم کردار ادا کر رہے ہیں۔

بے مثال رفتار، اسکیل ایبلٹی، اور درستگی فراہم کرکے، Cerebras ان شعبوں میں تنظیموں کو AI اور اس سے آگے کے کچھ انتہائی مشکل مسائل سے نمٹنے کے قابل بنا رہا ہے۔ چاہے یہ صحت کی دیکھ بھال میں منشیات کی دریافت کو تیز کرنا ہو یا سائنسی تحقیق میں کمپیوٹیشنل صلاحیتوں کو بڑھانا ہو، Cerebras ڈرائیونگ جدت میں سب سے آگے ہے۔

نتیجہ: اے آئی انفرنس کے لیے ایک نیا دور

Cerebras Systems Cerebras Inference کے آغاز کے ساتھ AI inference کے لیے ایک نیا معیار ترتیب دے رہا ہے۔ قیمت کے ایک حصے پر روایتی GPU پر مبنی سسٹمز کی رفتار سے 20 گنا زیادہ پیش کرتے ہوئے، Cerebras نہ صرف AI کو مزید قابل رسائی بنا رہا ہے بلکہ AI ایپلی کیشنز کی اگلی نسل کے لیے بھی راہ ہموار کر رہا ہے۔ اپنی جدید ٹیکنالوجی، اسٹریٹجک شراکت داری، اور جدت طرازی کے عزم کے ساتھ، Cerebras AI صنعت کو بے مثال کارکردگی اور توسیع پذیری کے ایک نئے دور میں لے جانے کے لیے تیار ہے۔

Cerebras Systems کے بارے میں مزید معلومات کے لیے اور Cerebras Inference کو آزمانے کے لیے، ملاحظہ کریں۔ www.cerebras.ai.

Antoine Unite.AI کے ایک وژنری رہنما اور بانی پارٹنر ہیں، جو AI اور روبوٹکس کے مستقبل کو تشکیل دینے اور اسے فروغ دینے کے غیر متزلزل جذبے سے کارفرما ہیں۔ ایک سیریل انٹرپرینیور، اس کا ماننا ہے کہ AI معاشرے کے لیے بجلی کی طرح خلل ڈالنے والا ہوگا، اور وہ اکثر خلل ڈالنے والی ٹیکنالوجیز اور AGI کی صلاحیت کے بارے میں بڑبڑایا جاتا ہے۔

ایک مستقبل، وہ اس بات کی کھوج کے لیے وقف ہے کہ یہ اختراعات ہماری دنیا کو کیسے تشکیل دیں گی۔ اس کے علاوہ، وہ کے بانی ہیں Securities.io، ایک پلیٹ فارم جدید ترین ٹیکنالوجیز میں سرمایہ کاری پر توجہ مرکوز کرتا ہے جو مستقبل کی نئی تعریف کر رہے ہیں اور تمام شعبوں کو نئی شکل دے رہے ہیں۔