مصنوعی ذہانت
کلاڈ 3.7 سونیٹ انتھروپک کا AI پنروتھن ہے۔

انتھروپک نے جاری کیا ہے۔ کلاڈ 3.7 سونیٹ، اس میں ایک انتہائی متوقع اپ گریڈ بڑی زبان کا ماڈل (LLM) خاندان کمپنی کے "آج تک کا سب سے ذہین ماڈل" اور مارکیٹ میں پہلی ہائبرڈ ریجننگ AI کے طور پر بل کیا گیا، Claude 3.7 Sonnet نے اپنے پیشرو (کلاڈ 3.5 سونیٹرفتار، استدلال، اور حقیقی دنیا کے کام کی کارکردگی میں۔
یہ رول آؤٹ اوپن اے آئی اور xAI کے حالیہ حریفوں کی جانب سے تیز رفتار ترقی کے درمیان آیا ہے۔ گروک 3, بہت سے AI پرجوشوں (بشمول مجھ) کو اس لانچ کو حالیہ اختراعات کے لیے Anthropic کے جواب کے طور پر دیکھنے کی راہنمائی کر رہے ہیں۔ نئے ماڈل کا مقصد فوری بات چیت کے جوابات کو ایک نظام میں گہری تجزیاتی سوچ کے ساتھ ملانا ہے - ایک متحد نقطہ نظر جو ہمیں دکھا سکتا ہے کہ مستقبل میں AI کے ساتھ تعامل کیسا ہوگا۔
ایک محبوب AI اسسٹنٹ میں طویل انتظار کے ساتھ اپ گریڈ
بہت سے باقاعدہ AI صارفین کے لیے، Claude 3.5 Sonnet پہلے سے ہی ایک ٹول تھا۔ اسے وہاں کے بہترین میں سے ایک سمجھا جاتا تھا۔ تاہم، حالیہ مہینوں میں Anthropic کو بڑھتے ہوئے دباؤ کا سامنا کرنا پڑا۔ اے آئی انڈسٹری نئی خصوصیات اور ماڈلز کے ساتھ دیوانہ ہو رہی ہے – اوپن اے آئی کے چیٹ جی پی ٹی نے آواز حاصل کی، کثیر مرحلہ استدلال کی صلاحیتیں، اور گہری تحقیق. Grok 3 نے اپنا آغاز ریئل ٹائم X ڈیٹا اور دیگر پلیٹ فارمز کے ساتھ کیا۔ اضطراب۔ اور جیمنی ریلیز کو جاری رکھا. بہت سے مبصرین نے نوٹ کرنا شروع کر دیا کہ انتھروپک پیچھے پڑنا شروع کر رہا ہے۔ کمیونٹی انتھروپک کے جواب کا بے تابی سے انتظار کر رہی تھی، اس توقع کے ساتھ کہ کلاڈ کا ایک نیا ماڈل کسی بھی دن آنے والا ہے۔
کلاڈ 3.7 سونیٹ ان توقعات پر پورا اترنے کے لیے آخر میں پہنچا۔ یہ ایک معمولی موافقت کے بجائے کلاڈ 3.5 سے ایک اہم چھلانگ ہے۔ انتھروپک اسے ایک جامع اپ گریڈ کے طور پر بیان کرتا ہے: تیز، زیادہ ہوشیار، اور زیادہ ورسٹائل۔
ماڈل کی رفتار اور آؤٹ پٹ کوالٹی حیران کن ہے۔ میرے اپنے ٹیسٹوں میں، میں نے اسے آخری ورژن کے مقابلے میں ناقابل یقین حد تک تیز پایا، لمبے ٹیکسٹ ان پٹس کو تقریباً فوری طور پر پروسیسنگ کرتا ہوں۔ اینتھروپک کے سست اپ ڈیٹ سائیکل کو دیکھتے ہوئے، 3.7 ریلیز ایک طویل انتظار کی طرح محسوس ہوتا ہے کہ دوبارہ دعوی کرتا ہے AI ریس میں کلاڈ کی پوزیشن۔ Claude 3.7 اس بات سے دوگنا ہو جاتا ہے جس کی وجہ سے صارفین Claude 3.5 سے محبت کرتے ہیں – عملی کاموں میں غیر معمولی کارکردگی – اور جدید استدلال کی صلاحیتوں کو شامل کرتے ہوئے۔
ہائبرڈ ریزننگ: فوری جوابات اور ایک میں گہری سوچ
کلاڈ 3.7 سونیٹ کی سرخی کی خصوصیت اس کی ہائبرڈ استدلال کی صلاحیت ہے۔ سادہ الفاظ میں، یہ ماڈل دو طریقوں میں کام کر سکتا ہے: قریب کے فوری ردعمل کے لیے ایک معیاری موڈ، اور ایک نیا "توسیع شدہ سوچ" موڈ جہاں یہ قدم بہ قدم مسائل کے ذریعے کام کرتا ہے سوچ کا سلسلہ صارف کو
ایک الگ کلاڈ ریجننگ ایڈیشن جاری کرنے کے بجائے، انتھروپک نے تیز اور گہری سوچ دونوں کو ایک AI میں ضم کر دیا ہے۔ "جس طرح انسان فوری ردعمل اور گہری عکاسی دونوں کے لیے ایک ہی دماغ کا استعمال کرتے ہیں، ہمارا ماننا ہے کہ استدلال کو مکمل طور پر ایک الگ ماڈل کے بجائے ایک مربوط صلاحیت ہونی چاہیے،" کمپنی نے اس میں وضاحت کی اعلان, ایک ہموار صارف کے تجربے کے لیے ایک متحد نقطہ نظر پر زور دینا۔
عملی طور پر، اس کا مطلب ہے کہ صارفین فیصلہ کر سکتے ہیں کہ وہ کب ایک تیز جواب چاہتے ہیں اور کب Claude کو جان بوجھ کر لمبائی میں جانے دینا ہے۔ اگر کسی سوال کے لیے تفصیلی تجزیہ یا ملٹی سٹیپ منطق کی ضرورت ہو تو ایک سادہ ٹوگل آپ کو توسیعی موڈ پر سوئچ کرنے دیتا ہے۔ معیاری موڈ میں، کلاڈ 3.7 سونیٹ 3.5 کے بہتر ورژن کی طرح کام کرتا ہے - تیز اور زیادہ بہتر، لیکن واقف فوری گفتگو کے انداز کے ساتھ۔ توسیعی موڈ میں، AI جواب دینے سے پہلے "خود کی عکاسی کرتا ہے"، اپنے استدلال کے عمل کو اندرونی طور پر لکھتا ہے (اور اسے ظاہر کرتا ہے) تاکہ زیادہ درست یا پیچیدہ حل تک پہنچ سکے۔
سوچ کا سلسلہ اسکرین پر قدم بہ قدم اسکرول کرتا ہے، یہ ایک خصوصیت جو دوسرے جدید ترین AI سسٹمز میں مقبول ہو چکی ہے اور اب آخر کار کلاڈ پر آتی ہے۔

الیکس میک فارلینڈ / یونائیٹ اے آئی
انتھروپک کا فلسفہ یہاں جان بوجھ کر کچھ حریفوں سے متصادم ہے۔ مثال کے طور پر، OpenAI نے الگ الگ ماڈلز یا موڈز پیش کیے ہیں، جو کچھ لوگوں کے لیے الجھن میں پڑتے ہیں۔ Claude 3.7 کا ہمہ جہت نقطہ نظر صارفین کے لیے چیزوں کو آسان بنانا ہے۔ موڈز کے درمیان سوئچ کرنا سیدھا سیدھا ہے، اور فوری انداز وہی رہتا ہے۔ پاور استعمال کرنے والے اس بات کو بھی ٹھیک کر سکتے ہیں کہ AI کتنا سوچتا ہے: API کے ذریعے، ڈویلپر جواب کو حتمی شکل دینے سے پہلے Claude کو بتاتے ہوئے کہ کتنی دیر تک غور کرنا ہے (بڑے پیمانے پر 128k-ٹوکن سوچ کے عمل تک) API کے ذریعے ایک ٹوکن بجٹ سیٹ کر سکتے ہیں۔ یہ دانے دار کنٹرول کسی کو مانگ کے مطابق پوری رفتار کے لیے تجارت کرنے دیتا ہے۔
کلاڈ 3.7 سونیٹ میں کلیدی اصلاحات:
یہاں کچھ اہم اصلاحات ہیں جو ہم کلاڈ 3.7 سونیٹ سے دیکھتے ہیں:
- ہائبرڈ ریزننگ موڈز - فوری جوابات اور ایک توسیعی سوچ موڈ دونوں پیش کرتا ہے جہاں AI نظر آنے والی استدلال کے ساتھ مرحلہ وار مسائل کے ذریعے کام کرتا ہے۔ صارفین فی استفسار موڈ کا انتخاب کرتے ہیں، ایک نظام میں تیز چیٹ اور گہرے تجزیہ کو یکجا کرتے ہیں۔
- یونیفائیڈ ماڈل فلسفہ - استعمال میں آسانی کے لیے ایک ہی AI "دماغ" میں فوری اور عکاس سوچ کو مربوط کرتا ہے۔ یہ ان حریفوں سے متصادم ہے جن کو متعدد ماڈلز یا پلگ انز کی ضرورت ہوتی ہے، جس سے اختتامی صارف کے لیے پیچیدگی کم ہوتی ہے۔
- رفتار اور ردعمل - Claude 3.5 سے زیادہ تیزی سے جوابات فراہم کرتا ہے۔ ابتدائی ٹیسٹ معیاری موڈ میں نمایاں طور پر بہتر کارکردگی دکھاتے ہیں۔
- توسیع شدہ سوچ کنٹرول - API کے ذریعے، صارف ضرورت کے مطابق رفتار بمقابلہ معیار کو متوازن کرنے کے لیے AI کی استدلال کی لمبائی (128,000 ٹوکنز تک) کو محدود یا بڑھا سکتے ہیں۔ یہ یقینی بناتا ہے کہ توسیعی موڈ صرف اتنا ہی استعمال کیا جائے جتنا ضروری ہو۔
- حقیقی دنیا کا ٹاسک فوکس – کمپنی کے مطابق، Claude 3.7 کی تربیت کو ریاضی کے مشکل اولمپیاڈ پہیلیاں کی بجائے عملی کاروبار اور تخلیقی کاموں کی طرف منتقل کر دیا گیا تھا۔ یہ ماڈل روزمرہ کے مسائل کو حل کرنے اور کاموں میں مہارت رکھتا ہے جو عام استعمال کے معاملات کی عکاسی کرتے ہیں۔
- کوڈنگ اور ٹول کا استعمال - پروگرامنگ کے کاموں میں مضبوط کارکردگی، خاص طور پر فرنٹ اینڈ ویب ڈویلپمنٹ۔ انتھروپک نے ایک ساتھی ٹول بھی لانچ کیا، کلاڈ کوڈ، جو ڈویلپرز کو کوڈ لکھنے اور ٹھیک کرنے کے لیے کمانڈ لائن سے Claude استعمال کرنے کی اجازت دیتا ہے۔ ابتدائی معیارات حقیقی سافٹ ویئر کے مسائل کو حل کرنے میں Claude 3.7 ٹاپنگ چارٹ دکھاتے ہیں۔
AI صارفین کے لیے حدود اور آگے کیا ہے۔
تمام تر جوش کے باوجود، Claude 3.7 Sonnet بغیر کسی حد کے نہیں ہے، اور یہ تمام AI چیلنجز کے لیے جادوئی گولی نہیں ہے۔ ایک تو، انتھروپک نے اس ماڈل کی تربیت میں شعوری طور پر کچھ ڈومینز پر زور نہیں دیا۔ انہوں نے روزمرہ کے زیادہ کاروباری کاموں کے حق میں "ریاضی اور کمپیوٹر سائنس کے مقابلے کے مسائل کے لیے کچھ کم بہتر بنایا"۔ اس کا مطلب یہ ہے کہ اگرچہ Claude 3.7 یقینی طور پر ریاضی اور کوڈنگ کے سوالات کو حل کر سکتا ہے (اکثر 3.5 سے بہتر ہے)، ہو سکتا ہے کہ یہ ہر تعلیمی معیار یا پہیلی پر لیڈر بورڈ میں سرفہرست نہ ہو۔ وہ صارفین جن کی ضروریات ریاضی کے پیچیدہ ثبوتوں یا مخصوص کوڈنگ مقابلوں کی طرف متوجہ ہوتی ہیں وہ اب بھی ایسے علاقے تلاش کر سکتے ہیں جہاں کلاڈ کے جوابات کو دوہری جانچ پڑتال کی ضرورت ہوتی ہے یا جہاں اس مقام کے لیے مدمقابل کا ماڈل بہتر کام کرتا ہے۔ ایسا لگتا ہے کہ انتھروپک نے اس تجارت کو قبول کر لیا ہے، جس کا مقصد ماڈل کو نظریاتی قابلیت پر عملی افادیت پر رکھنا ہے۔
مزید برآں، ایکسٹینڈڈ تھنکنگ موڈ، طاقتور ہونے کے باوجود، کچھ پیچیدگیاں متعارف کراتا ہے۔ یہ معیاری موڈ سے فطری طور پر سست ہے۔ جب AI گہری سوچ میں ہوتا ہے، صارفین کو ایک مختصر وقفہ نظر آئے گا کیونکہ یہ اپنے استدلال کے ذریعے کام کرتا ہے۔ اس کی توقع کی جاتی ہے - مکمل طور پر تجارت کی رفتار - لیکن اس کا مطلب ہے کہ صارفین کو یہ فیصلہ کرنا ہوگا کہ انہیں اصل میں اس اضافی طاقت کی ضرورت کب ہے۔ بہت سے روزمرہ کے چیٹ کے سوالات میں، معیاری موڈ کافی ہوگا اور زیادہ موثر ہوگا۔ یہ حقیقت بھی ہے کہ توسیعی استدلال بعض اوقات اسے حد سے زیادہ کر سکتا ہے اور آپ کو درحقیقت ضرورت سے بہت زیادہ فراہم کر سکتا ہے۔ کچھ معاملات میں، یہ مغلوب ہو سکتا ہے یا ٹریک سے ہٹ سکتا ہے۔ انتھروپک کو اس بات کو یقینی بنانے کی ضرورت ہوگی کہ آئیڈیاز کے ساتھ "بڑا جانے" کے لیے اے آئی کی رضامندی متعلقہ اور موضوع پر برقرار رہے۔ صارف زیادہ درست طریقے سے اشارہ کرنا سیکھ سکتے ہیں یا بھاگنے والے ٹینجنٹ کو روکنے کے لیے ٹوکن کی حدیں مقرر کر سکتے ہیں۔
نیچے کی لکیر
Claude 3.7 Sonnet کی ریلیز ایک بیان ہے کہ OpenAI، Google/DeepMind، اور xAI جیسے نئے کھلاڑیوں کے ساتھ گیم میں Anthropic بہت زیادہ ہے۔ AI کے شائقین اور ڈویلپرز کے لیے، یہ تجربہ کرنے کے لیے ایک اور اعلیٰ درجے کا ماڈل شامل کرتا ہے، جو اپنی ہائبرڈ استدلال کے ساتھ ایک منفرد موڑ پیش کرتا ہے۔
مسابقتی AI صنعت میں، Anthropic کا تازہ ترین اقدام اس بات پر بھی اثر انداز ہو سکتا ہے کہ کمپنیاں اپنے ماڈلز کی پوزیشن کیسے رکھتی ہیں۔ بڑے پیمانے پر ماڈل سائز جمپ یا چمکدار ملٹی ماڈل ڈیمو نہ کرنے کا انتخاب کرکے، بلکہ اس کے بجائے صارف کے تجربے (طریقوں کی یکجہتی، رفتار، عملی استعمال کے معاملات)، اینتھروپک ایک ایسی جگہ تراش رہا ہے جس کی توجہ قابل استعمال اور قابل اعتماد ہے۔
مجموعی طور پر، کلاڈ 3.7 سونیٹ انتھروپک کے لیے ایک اہم لمحہ ہے۔ یہ Claude سیریز کا ایک ارتقاء ہے جو کہ کمپنی کو کمیونٹی کی ضروریات سے سیکھتے ہوئے دکھاتا ہے – کمزوریوں کو دور کرتے ہوئے اپنی طاقت کو دوگنا کرتا ہے۔ دیکھنے کے لیے ابھی بھی علاقے باقی ہیں (اور مستقبل میں کلاؤڈ کے اعادہ کی توقع ہے)، لیکن اس ریلیز نے واضح طور پر اینتھروپک کے صارف کی بنیاد کو دوبارہ متحرک کر دیا ہے۔