ہمارے ساتھ رابطہ

اینتھروپک کے نئے کلاڈ ماڈلز AI پاور اور عملییت کے درمیان خلا کو پُر کرتے ہیں

مصنوعی ذہانت

اینتھروپک کے نئے کلاڈ ماڈلز AI پاور اور عملییت کے درمیان خلا کو پُر کرتے ہیں

mm

انتھروپک نے حال ہی میں اہم اپڈیٹس کی نقاب کشائی کی۔ اس کے کلاڈ اے آئی ماڈل فیملی کو۔ اعلان نے کلاڈ 3.5 سونیٹ کا ایک بہتر ورژن متعارف کرایا اور ایک نئے کلاڈ 3.5 ہائیکو ماڈل کا آغاز کیا، جس سے کارکردگی کی صلاحیتوں اور لاگت کی کارکردگی دونوں میں خاطر خواہ پیش رفت ہوئی ہے۔

ریلیز اے آئی لینڈ اسکیپ میں ایک اسٹریٹجک ترقی کی نمائندگی کرتی ہے، خاص طور پر پروگرامنگ کی صلاحیتوں اور منطقی استدلال میں بہتری کے لیے قابل ذکر۔ جبکہ پورے شعبے میں کمپنیاں AI کی ترقی کی حدود کو آگے بڑھا رہی ہیں، Anthropic کی تازہ ترین ریلیز نمایاں ہے۔

کارکردگی کی کامیابیاں

نئے ہائیکو ماڈل کے خاص طور پر قابل ذکر نتائج حاصل کرنے کے ساتھ، بہتر ماڈلز متعدد بینچ مارکس میں نمایاں بہتری کا مظاہرہ کرتے ہیں۔ پروگرامنگ کے کاموں میں، SWE بینچ تصدیق شدہ ٹیسٹ پر اپ ڈیٹ کردہ سونیٹ ماڈل کی کارکردگی 49.0% تک بڑھ گئی، جس نے خصوصی پروگرامنگ سسٹمز سمیت عوامی طور پر دستیاب ماڈلز کے لیے ایک نیا معیار قائم کیا۔

لاگت کی کارکردگی ان پیشرفتوں کے ایک اہم پہلو کے طور پر ابھرتی ہے۔ ہائیکو کا نیا ماڈل نمایاں طور پر کم آپریشنل اخراجات کو برقرار رکھتے ہوئے پچھلے فلیگ شپ Claude 3 Opus کے مقابلے کارکردگی پیش کرتا ہے۔ $1 فی ملین ان پٹ ٹوکن اور $5 فی ملین آؤٹ پٹ ٹوکن پر قیمتوں کے تعین کے ساتھ، تنظیمیں فوری کیشنگ اور بیچ پروسیسنگ جیسی خصوصیات کے ذریعے اپنے AI کے نفاذ کو بہتر بنا سکتی ہیں۔

بینچ مارک کی بہتری پروگرامنگ کی صلاحیتوں سے باہر ہوتی ہے۔ ماڈلز عام زبان کی فہم اور منطقی استدلال جیسے شعبوں میں بہتر کارکردگی دکھاتے ہیں۔ TAU بینچ پر، جو ٹول کے استعمال کی صلاحیتوں کا جائزہ لیتا ہے، سونیٹ نے مختلف شعبوں میں خاطر خواہ بہتری کا مظاہرہ کیا، بشمول ریٹیل ایپلی کیشنز میں 62.6% سے 69.2% تک نمایاں اضافہ۔

یہ پیشرفتیں AI کی ترقی میں ایک بدلتے ہوئے نمونے کی تجویز کرتی ہیں، جہاں اعلیٰ کارکردگی کی صلاحیتیں اب ضروری نہیں کہ ممنوعہ اخراجات سے مربوط ہوں۔ اعلی درجے کی AI صلاحیتوں کی اس جمہوری کاری کے کاروباروں اور ڈویلپرز کے لیے دور رس اثرات مرتب ہو سکتے ہیں جو AI سلوشنز کو نافذ کرنا چاہتے ہیں۔

ماخذ: Anthropic

کمپیوٹر تعامل

تنگ، کام کے لیے مخصوص ٹولز تیار کرنے کے بجائے، کمپنی نے کلاڈ کو کمپیوٹر کی عمومی مہارتوں سے لیس کرکے ایک وسیع تر طریقہ اختیار کیا ہے۔ یہ جدت AI ماڈلز کو معیاری سافٹ ویئر انٹرفیس کے ساتھ بات چیت کرنے کے قابل بناتی ہے جو اصل میں انسانی صارفین کے لیے ڈیزائن کیے گئے ہیں۔

اس پیشرفت کا سنگ بنیاد ایک نیا API ہے جو کلاڈ کو کمپیوٹر انٹرفیس کو براہ راست سمجھنے اور جوڑ توڑ کرنے کی اجازت دیتا ہے۔ یہ نظام AI کو مجازی کی بورڈ کے ذریعے ماؤس کی نقل و حرکت، عنصر کا انتخاب، اور ٹیکسٹ ان پٹ جیسے اعمال انجام دینے کا اختیار دیتا ہے۔ ٹیکنالوجی زیادہ بدیہی انسانی-AI تعاون کی طرف ایک قدم کی نمائندگی کرتی ہے، جس سے کمپیوٹر کے ٹھوس اقدامات میں قدرتی زبان کی ہدایات کے ترجمے کو قابل بنایا جا سکتا ہے۔

تاہم، موجودہ صلاحیتیں وعدے اور حدود دونوں کو ظاہر کرتی ہیں۔ جب کہ Claude 3.5 Sonnet نے OSWorld بینچ مارک کے "صرف اسکرین شاٹس" کے زمرے میں 14.9% سکور حاصل کیا جو کہ اگلے بہترین AI سسٹم سے تقریباً دوگنا ہے- یہ کارکردگی اب بھی انسانی صلاحیتوں کے مقابلے میں بہتری کی اہم گنجائش کی نشاندہی کرتی ہے۔ بنیادی اعمال جو انسان فطری طور پر انجام دیتے ہیں، جیسے اسکرولنگ اور زومنگ، AI سسٹم کے لیے چیلنجنگ رہتے ہیں۔

کلاڈ | خودکار آپریشنز کے لیے کمپیوٹر کا استعمال

مارکیٹ کے اثرات اور ایپلی کیشنز

ان پیشرفتوں کے کاروباری مضمرات متعدد شعبوں میں پھیلے ہوئے ہیں۔ تنظیمیں اب زیادہ قابل انتظام لاگت پوائنٹس پر اعلی درجے کی AI صلاحیتوں تک رسائی حاصل کر سکتی ہیں، ممکنہ طور پر صنعتوں میں AI کو اپنانے میں تیزی لاتی ہے۔ پروگرامنگ کی بہتر صلاحیتیں خاص طور پر سوفٹ ویئر ڈیولپمنٹ ٹیموں کو فائدہ پہنچاتی ہیں، جبکہ زبان کی بہتر فہم کسٹمر سروس اور مواد تیار کرنے والی ایپلی کیشنز کے لیے فوائد فراہم کرتی ہے۔

صنعت کی پوزیشننگ کے لحاظ سے، Anthropic کا نقطہ نظر عملی قابل اطلاق اور لاگت کی تاثیر پر اپنی توجہ کے ذریعے خود کو ممتاز کرتا ہے۔ بہتر کارکردگی کے میٹرکس اور معقول آپریشنل لاگت کا امتزاج ان ماڈلز کو بڑے کاروباری اداروں اور چھوٹی تنظیموں دونوں کے لیے قابل عمل حل کے طور پر رکھتا ہے جو AI کے نفاذ کو تلاش کر رہے ہیں۔

عملی ایپلی کیشنز مختلف استعمال کے معاملات پر محیط ہیں:

  • سافٹ ویئر ڈویلپمنٹ: بہتر کوڈ جنریشن اور ڈیبگنگ کی صلاحیتیں۔
  • کسٹمر سروس: مزید نفیس چیٹ بوٹ تعاملات
  • ڈیٹا تجزیہ: پیچیدہ ڈیٹا کی تشریح کے لیے بہتر منطقی استدلال
  • کاروباری عمل آٹومیشن: معمول کے کاموں کے لیے براہ راست کمپیوٹر انٹرفیس ہیرا پھیری

ان جدید خصوصیات کی رسائی، خاص طور پر بڑے کلاؤڈ پلیٹ فارمز جیسے Amazon Bedrock اور Google Cloud's Vertex AI کے ذریعے، ان تنظیموں کے لیے انضمام کو آسان بناتا ہے جو پہلے سے ان خدمات کو استعمال کر رہی ہیں۔ یہ وسیع دستیابی، لچکدار قیمتوں کے ماڈلز کے ساتھ مل کر، انٹرپرائز AI کو اپنانے میں ممکنہ سرعت کا مشورہ دیتی ہے۔

مستقبل میں

ان بہتر ماڈلز کی ریلیز AI ٹیکنالوجی میں صرف اضافی بہتری کی نمائندگی کرتی ہے۔ یہ ایک ایسے مستقبل کا اشارہ دیتا ہے جہاں AI سسٹمز زیادہ قدرتی طور پر موجودہ کمپیوٹر سسٹمز اور ورک فلو کے ساتھ مربوط ہو سکتے ہیں۔ اگرچہ موجودہ حدود موجود ہیں، خاص طور پر انسان جیسے کمپیوٹر کے تعاملات میں، اس سمت میں مسلسل ترقی کی بنیاد رکھی گئی ہے۔

نفاذ کے لیے انتھروپک کا محتاط انداز، ڈویلپرز کو کم خطرے والے کاموں سے شروع کرنے کی سفارش، ٹیکنالوجی کی صلاحیت اور اس کی موجودہ رکاوٹوں دونوں کی سمجھ کو ظاہر کرتا ہے۔ یہ پیمائش شدہ موقف، شفاف کارکردگی کے میٹرکس کے ساتھ مل کر، تنظیمی اپنانے کے لیے حقیقت پسندانہ توقعات قائم کرنے میں مدد کرتا ہے۔

ترقیاتی روڈ میپ کے مضمرات اہم ہیں۔ ہائیکو ماڈل کے لیے نالج کٹ آف کی تاریخوں میں جولائی 2024 تک توسیع کے ساتھ، ہم مزید موجودہ اور متعلقہ AI سسٹمز کی طرف رجحان دیکھ رہے ہیں۔ اس پیشرفت سے پتہ چلتا ہے کہ مستقبل کی تکرار AI علم کے اڈوں اور حقیقی وقت کی معلومات کی ضروریات کے درمیان فرق کو مزید کم کر سکتی ہے۔

مستقبل کی پیشرفت کے لئے اہم تحفظات میں شامل ہیں:

  • کمپیوٹر کے تعامل کی صلاحیتوں کی مسلسل تطہیر
  • کارکردگی سے لاگت کے تناسب کی مزید اصلاح
  • موجودہ کاروباری نظاموں کے ساتھ بہتر انضمام
  • نئے شعبوں اور استعمال کے معاملات میں توسیع شدہ ایپلی کیشنز

نیچے کی لکیر

Anthropic کی تازہ ترین ریلیزز AI ٹیکنالوجی کے ارتقاء میں ایک اہم سنگ میل کی نشاندہی کرتی ہیں، جو جدید صلاحیتوں اور عملی نفاذ کے تحفظات کے درمیان ایک اہم توازن قائم کرتی ہے۔ اگرچہ انسانی جیسا کمپیوٹر تعاملات کو حاصل کرنے میں چیلنجز بدستور موجود ہیں، بہتر کارکردگی میٹرکس، اختراعی خصوصیات، اور قابل رسائی قیمتوں کے ماڈلز کا امتزاج پوری صنعتوں میں تبدیلی کی ایپلی کیشنز کے لیے ایک بنیاد قائم کرتا ہے، جس سے ممکنہ طور پر تنظیمیں اپنے روزمرہ کے کاموں میں AI کے نفاذ تک کیسے پہنچتی ہیں۔

 

Alex McFarland ایک AI صحافی اور مصنف ہے جو مصنوعی ذہانت میں تازہ ترین پیشرفت کی کھوج لگا رہا ہے۔ اس نے دنیا بھر میں متعدد AI اسٹارٹ اپس اور اشاعتوں کے ساتھ تعاون کیا ہے۔