ہمارے ساتھ رابطہ

جیمنی 2.5 پرو یہاں ہے — اور یہ AI گیم کو بدل دیتا ہے (دوبارہ)

اعلانات

جیمنی 2.5 پرو یہاں ہے — اور یہ AI گیم کو بدل دیتا ہے (دوبارہ)

mm
(ماخذ: گوگل ڈیپ مائنڈ)

گوگل نے انکشاف کیا ہے۔ Gemini 2.5 Pro, اسے اس کا کہتے ہیں "انتہائی ذہین اے آئی ماڈل" آج تک گوگل ڈیپ مائنڈ ٹیم کے ذریعہ تیار کردہ اس تازہ ترین بڑے لینگویج ماڈل کو ایک "سوچ ماڈل" کے طور پر بیان کیا گیا ہے جو جواب دینے سے پہلے اندرونی طور پر اقدامات کے ذریعے استدلال کرتے ہوئے پیچیدہ مسائل سے نمٹنے کے لیے ڈیزائن کیا گیا ہے۔ ابتدائی بینچ مارکس گوگل کے اعتماد کی پشت پناہی کرتے ہیں: جیمنی 2.5 پرو (2.5 سیریز کی تجرباتی پہلی ریلیز) #1 پر ڈیبیو کر رہا ہے۔ LMArena لیڈر بورڈ AI معاونین کی ایک اہم مارجن سے، اور یہ کوڈنگ، ریاضی اور سائنس کے کاموں کے لیے بہت سے معیاری ٹیسٹوں کی رہنمائی کرتا ہے۔

جیمنی 2.5 پرو میں کلیدی نئی صلاحیتیں اور خصوصیات شامل ہیں:

  • سلسلہ فکری استدلال: زیادہ سیدھے چیٹ بوٹس کے برعکس، جیمنی 2.5 پرو اندرونی طور پر کسی مسئلے کو واضح طور پر "سوچتا ہے"۔ یہ مشکل سوالات پر زیادہ منطقی، درست جوابات کی طرف لے جاتا ہے، مشکل منطقی پہیلیاں سے لے کر پیچیدہ منصوبہ بندی کے کاموں تک۔
  • اسٹیٹ آف دی آرٹ کارکردگی: گوگل نے رپورٹ کیا ہے کہ 2.5 پرو کئی بینچ مارکس پر OpenAI اور Anthropic کے جدید ترین ماڈلز کو پیچھے چھوڑ دیتا ہے۔ مثال کے طور پر، اس نے سخت استدلال کے ٹیسٹوں پر نئی بلندیاں قائم کیں۔ انسانیت کا آخری امتحان (OpenAI کے ماڈل کے لیے 18.8% بمقابلہ 14% اور Anthropic's کے لیے 8.9% اسکور) اور یہ مختلف ریاضی اور سائنس کے چیلنجوں میں آگے بڑھتا ہے بغیر مہنگی چالوں جیسے کہ ووٹنگ کی ضرورت کے۔
  • اعلی درجے کی کوڈنگ کی مہارتیں: ماڈل اپنے پیشرو کے مقابلے کوڈنگ کی صلاحیت میں بہت بڑی چھلانگ دکھاتا ہے۔ یہ ویب ایپس اور یہاں تک کہ خود مختار "ایجنٹ" اسکرپٹس کے لیے کوڈ بنانے اور اس میں ترمیم کرنے میں بھی مہارت رکھتا ہے۔ SWE-Bench کوڈنگ بینچ مارک پر، Gemini 2.5 Pro نے 63.8% کامیابی کی شرح حاصل کی – OpenAI کے نتائج سے بہت آگے، حالانکہ ابھی بھی Anthropic کے خصوصی Claude 3.7 "Sonnet" ماڈل (70.3%) سے تھوڑا پیچھے ہے۔
  • ملٹی موڈل تفہیم: پہلے جیمنی ماڈلز کی طرح، 2.5 پرو ہے۔ مقامی ملٹی موڈل - یہ ایک بات چیت میں متن، تصاویر، آڈیو، یہاں تک کہ ویڈیو اور کوڈ ان پٹ کو قبول اور استدلال کرسکتا ہے۔ اس استقامت کا مطلب ہے کہ یہ ایک ہی سیشن میں کسی تصویر کو بیان کر سکتا ہے، کسی پروگرام کو ڈیبگ کر سکتا ہے، اور اسپریڈ شیٹ کا تجزیہ کر سکتا ہے۔
  • بڑے پیمانے پر سیاق و سباق کی کھڑکی: شاید سب سے زیادہ متاثر کن، Gemini 2.5 Pro سیاق و سباق کے 1 ملین ٹوکنز کو سنبھال سکتا ہے (افق پر 2 ملین ٹوکن اپ ڈیٹ کے ساتھ)۔ عملی اصطلاحات میں، اس کا مطلب ہے کہ یہ تفصیلات کے ٹریک کو کھوئے بغیر سینکڑوں صفحات کے متن یا پورے کوڈ کے ذخیروں کو ایک ساتھ ہضم کر سکتا ہے۔ یہ لمبی یادداشت بہت زیادہ اس سے کہیں زیادہ ہے جو زیادہ تر دیگر AI ماڈلز پیش کرتے ہیں، جس سے جیمنی کو بہت بڑی دستاویزات یا مباحثوں کی تفصیلی سمجھ رکھنے کی اجازت ملتی ہے۔

گوگل کے مطابق، یہ پیش رفت تربیت کے بعد کی بہتر تکنیکوں کے ساتھ مل کر نمایاں طور پر بہتر بیس ماڈل سے حاصل ہوئی ہے۔ خاص طور پر، گوگل جیمنی 2.0 کے لیے استعمال ہونے والی علیحدہ "فلیش تھنکنگ" برانڈنگ کو بھی ختم کر رہا ہے۔ 2.5 کے ساتھ، استدلال کی صلاحیتیں اب تمام مستقبل کے ماڈلز میں بطور ڈیفالٹ بلٹ ان ہیں۔ صارفین کے لیے، اس کا مطلب ہے کہ جیمنی کے ساتھ عمومی تعاملات بھی اس گہرے درجے کی "سوچ" سے مستفید ہوں گے۔

آٹومیشن اور ڈیزائن کے لیے مضمرات

بینچ مارکس اور مسابقت سے پرے، Gemini 2.5 Pro کی اصل اہمیت اس چیز میں مضمر ہو سکتی ہے جو یہ اختتامی صارفین اور صنعتوں کے لیے قابل بناتا ہے۔ کوڈنگ اور استدلال کے کاموں میں ماڈل کی مضبوط کارکردگی صرف ڈینگ مارنے کے حقوق کے لیے پہیلیاں حل کرنے کے بارے میں نہیں ہے - یہ کام کی جگہ کے آٹومیشن، سافٹ ویئر کی ترقی، اور یہاں تک کہ تخلیقی ڈیزائن کے لیے نئے امکانات کی طرف اشارہ کرتا ہے۔

مثال کے طور پر کوڈنگ لیں۔ ایک سادہ پرامپٹ سے ورکنگ کوڈ بنانے کی صلاحیت کے ساتھ، Gemini 2.5 Pro ڈویلپرز کے لیے ایک پروجیکٹ ضرب کے طور پر کام کر سکتا ہے۔ ایک انجینئر ممکنہ طور پر ویب ایپلیکیشن کا پروٹو ٹائپ کر سکتا ہے یا AI کی مدد کے ساتھ پورے کوڈ بیس کا تجزیہ کر سکتا ہے جو کہ زیادہ تر گرنٹ کام کو سنبھال سکتا ہے۔ گوگل کے ایک ڈیمو میں، ماڈل نے شروع سے ہی ایک بنیادی ویڈیو گیم بنایا جس میں صرف ایک جملے کی تفصیل دی گئی۔ یہ ایک ایسے مستقبل کی تجویز کرتا ہے جہاں نان پروگرامرز ایک آئیڈیا بیان کریں گے اور جواب میں ایک چلانے والی ایپ حاصل کریں گے ("وائب کوڈنگ")، سافٹ ویئر کی تخلیق میں رکاوٹ کو تیزی سے کم کرنا۔

جیمنی 2.5: ایک ہی لائن پرامپٹ سے اپنا ڈائناسور گیم بنائیں

یہاں تک کہ تجربہ کار ڈویلپرز کے لیے بھی، ایک AI کا ہونا جو بڑے کوڈ ریپوزٹری کو سمجھ سکتا ہے اور اس میں ترمیم کر سکتا ہے (اس 1M-ٹوکن سیاق و سباق کی بدولت) کا مطلب ہے تیز تر ڈیبگنگ، کوڈ کے جائزے اور ری فیکٹرنگ۔ ہم AI جوڑی پروگرامرز کے دور کی طرف بڑھ رہے ہیں جو برقرار رکھ سکتے ہیں۔ "بڑی تصویر" ان کے دماغ میں ایک پیچیدہ پروجیکٹ ہے، لہذا آپ کو انہیں ہر اشارہ کے ساتھ سیاق و سباق کی یاد دلانے کی ضرورت نہیں ہے۔

جیمنی 2.5 کی جدید استدلال کی صلاحیتیں نالج ورک آٹومیشن میں بھی کردار ادا کرتی ہیں۔ ابتدائی صارفین نے طویل معاہدوں میں کھانا کھلانے کی کوشش کی ہے اور ماڈل سے اہم شقیں نکالنے یا نکات کا خلاصہ کرنے کو کہا ہے، جس کے امید افزا نتائج ہیں۔ AI کو سیکڑوں صفحات پر مشتمل دستاویزات کے ذریعے قانونی جائزے، مستعدی تحقیق، یا مالیاتی تجزیے کے خودکار حصوں کا تصور کریں اور ان چیزوں کو نکالیں جو اہم ہیں - ایسے کام جو فی الحال ان گنت انسانی گھنٹے ضائع کرتے ہیں۔

جیمنی کی ملٹی موڈل مہارت کا مطلب ہے کہ یہ متنوں، اسپریڈ شیٹس اور خاکوں کے مرکب کا ایک ساتھ تجزیہ بھی کر سکتا ہے، جس سے ایک مربوط خلاصہ ملتا ہے۔ اس قسم کی AI قانون، طب، انجینئرنگ، یا ڈیٹا اور دستاویزات میں ڈوبنے والے کسی بھی شعبے کے پیشہ ور افراد کے لیے ایک انمول معاون بن سکتی ہے۔

تخلیقی شعبوں اور مصنوعات کے ڈیزائن کے لیے، جیمنی 2.5 پرو جیسے ماڈلز بھی دلچسپ امکانات کو کھولتے ہیں۔ وہ ذہن سازی کرنے والے شراکت داروں کے طور پر کام کر سکتے ہیں - مثلاً ضروریات کے بارے میں استدلال کرتے ہوئے ڈیزائن کے تصورات یا مارکیٹنگ کی کاپی تیار کرنا - یا تیز رفتار پروٹو ٹائپرز کے طور پر جو کسی کھردرے خیال کو ٹھوس مسودے میں بدل دیتے ہیں۔ ایجنٹی رویے پر گوگل کا زور (ماڈل کی ٹولز کو استعمال کرنے کی صلاحیت اور خود مختاری سے ملٹی سٹیپ پلانز انجام دینے کی صلاحیت) اشارہ کرتا ہے کہ مستقبل کے ورژن براہ راست سافٹ ویئر کے ساتھ ضم ہو سکتے ہیں۔

کوئی ایک ایسے ڈیزائن AI کا تصور کر سکتا ہے جو نہ صرف آئیڈیاز تجویز کرتا ہے بلکہ ڈیزائن سافٹ ویئر کو نیویگیٹ بھی کرتا ہے یا ان آئیڈیاز کو عملی جامہ پہنانے کے لیے کوڈ لکھتا ہے، یہ سب اعلیٰ درجے کی انسانی ہدایات کے ذریعے رہنمائی کرتے ہیں۔ اس طرح کی صلاحیتیں AI کے دائرے میں "مفکر" اور "کرنے والے" کے درمیان لائن کو دھندلا کر دیتی ہیں، اور جیمنی 2.5 اس سمت میں ایک قدم ہے - ایک AI جو حل کو تصور کر سکتا ہے اور مختلف ڈومینز میں ان پر عمل درآمد کر سکتا ہے۔

تاہم، یہ پیش رفت بھی اہم سوالات کو جنم دیتی ہے۔ جیسا کہ AI زیادہ پیچیدہ کام کرتا ہے، ہم یہ کیسے یقینی بناتے ہیں کہ یہ اہمیت اور اخلاقی حدود کو سمجھتا ہے (مثال کے طور پر، یہ فیصلہ کرنے میں کہ کون سی معاہدے کی شقیں حساس ہیں، یا ڈیزائن میں تخلیقی بمقابلہ عملی پہلوؤں میں توازن کیسے رکھا جائے)؟ گوگل اور دیگر کو مضبوط گارڈریلز بنانے کی ضرورت ہوگی، اور صارفین کو نئے ہنر سیکھنے کی ضرورت ہوگی - AI کی حوصلہ افزائی اور نگرانی کرنا - کیونکہ یہ ٹولز ساتھی کارکن بن جاتے ہیں۔

بہر حال، رفتار واضح ہے: جیمنی 2.5 پرو جیسے ماڈلز AI کو ان کرداروں میں مزید گہرائی تک پہنچا رہے ہیں جن کے لیے پہلے انسانی ذہانت اور تخلیقی صلاحیتوں کی ضرورت تھی۔ پیداواریت اور اختراع کے مضمرات بہت زیادہ ہیں، اور ہم ممکنہ طور پر اس بات پر اثرات دیکھیں گے کہ مصنوعات کیسے بنتی ہیں اور بہت سی صنعتوں میں کام کیسے ہوتا ہے۔

جیمنی 2.5: اقتصادی ڈیٹا کا ایک انٹرایکٹو پلاٹ بنائیں

جیمنی 2.5 اور نیو اے آئی فیلڈ

Gemini 2.5 Pro کے ساتھ، Google AI ریس میں سب سے آگے ہونے کا دعویٰ کر رہا ہے – اور اپنے حریفوں کو پیغام بھیج رہا ہے۔ صرف چند سال پہلے، بیانیہ یہ تھا کہ گوگل کا اے آئی (ابتدائی بارڈ تکرار کے بارے میں سوچئے) اوپن اے آئی کے چیٹ جی پی ٹی اور مائیکروسافٹ کی جارحانہ چالوں سے پیچھے ہے۔ اب، گوگل ریسرچ اور ڈیپ مائنڈ کے مشترکہ ٹیلنٹ کا مظاہرہ کرتے ہوئے، کمپنی نے ایک ایسا ماڈل پیش کیا ہے جو سیارے پر بہترین AI اسسٹنٹ کے عنوان کے لیے قانونی طور پر مقابلہ کر سکتا ہے۔

یہ گوگل کی طویل مدتی پوزیشننگ کے لیے اچھی بات ہے۔ AI ماڈلز کو تیزی سے بنیادی پلیٹ فارمز کے طور پر دیکھا جاتا ہے (جیسا کہ آپریٹنگ سسٹمز یا کلاؤڈ سروسز)، اور اعلی درجے کا ماڈل رکھنے سے Google کو انٹرپرائز کلاؤڈ پیشکش (Google Cloud/Vertex AI) سے لے کر تلاش، پیداواری ایپس اور Android جیسی صارفی خدمات تک ہر چیز میں کھیلنے کے لیے مضبوط ہاتھ ملتا ہے۔ طویل مدت میں، ہم توقع کر سکتے ہیں جیمنی خاندان بہت سے Google پروڈکٹس میں ضم ہونے کے لیے – ممکنہ طور پر Google کے اسسٹنٹ کو سپرچارج کرنا، بہتر خصوصیات کے ساتھ Google Workspace ایپس کو بہتر بنانا، اور مزید بات چیت اور سیاق و سباق سے آگاہی کی صلاحیتوں کے ساتھ تلاش کو بڑھانا۔

جیمنی 2.5 پرو کا آغاز اس بات پر بھی روشنی ڈالتا ہے کہ AI زمین کی تزئین کی کتنی مسابقتی بن گئی ہے۔ OpenAI، Anthropic، اور دیگر کھلاڑی جیسے Meta اور ابھرتے ہوئے سٹارٹ اپس سب اپنے ماڈلز پر تیزی سے تکرار کر رہے ہیں۔ ایک کمپنی کی طرف سے ہر ایک چھلانگ - چاہے وہ ایک بڑی سیاق و سباق کی ونڈو ہو، ٹولز کو مربوط کرنے کا ایک نیا طریقہ، یا کوئی نئی حفاظتی تکنیک - دوسروں کی طرف سے فوری جواب دیا جاتا ہے۔ Google کا اپنے تمام ماڈلز میں استدلال کو سرایت کرنے کا اقدام ایک اسٹریٹجک اقدام ہے، اس بات کو یقینی بناتے ہوئے کہ یہ اپنے AI کی "سمارٹنس" میں پیچھے نہ رہے۔ دریں اثنا، اینتھروپک کی صارفین کو زیادہ کنٹرول دینے کی حکمت عملی (جیسا کہ کلاڈ 3.7 کی ایڈجسٹ ریجننگ ڈیپتھ کے ساتھ دیکھا گیا ہے) اور OpenAI کی GPT-4.x میں مسلسل اصلاحات دباؤ کو برقرار رکھتی ہیں۔

اختتامی صارفین اور ڈویلپرز کے لیے، یہ مقابلہ بڑی حد تک مثبت ہے: اس کا مطلب ہے کہ بہتر اے آئی سسٹمز تیزی سے پہنچ رہے ہیں اور مارکیٹ میں زیادہ انتخاب۔ ہم ایک AI ماحولیاتی نظام دیکھ رہے ہیں جہاں اختراع پر کسی ایک کمپنی کی اجارہ داری نہیں ہے، اور یہ متحرک ہر ایک کو ایکسل کرنے کی طرف دھکیلتا ہے – بالکل پرسنل کمپیوٹر یا اسمارٹ فون کی جنگوں کے ابتدائی دنوں کی طرح۔

اس تناظر میں، جیمنی 2.5 پرو کی ریلیز گوگل کی طرف سے صرف ایک پروڈکٹ اپ ڈیٹ سے زیادہ ہے - یہ ارادے کا بیان ہے۔ یہ اشارہ کرتا ہے کہ گوگل نہ صرف ایک تیز پیروکار بلکہ AI کے نئے دور میں ایک رہنما بننے کا ارادہ رکھتا ہے۔ کمپنی اپنے بڑے کمپیوٹنگ انفراسٹرکچر کا فائدہ اٹھا رہی ہے (1+ ملین ٹوکن سیاق و سباق کے ساتھ ماڈلز کو تربیت دینے کی ضرورت ہے) اور ان حدود کو آگے بڑھانے کے لیے وسیع ڈیٹا وسائل جو کچھ دوسرے کر سکتے ہیں۔ ایک ہی وقت میں، گوگل کا نقطہ نظر (تجرباتی ماڈلز کو قابل اعتماد صارفین تک پہنچانا، AI کو اس کے ماحولیاتی نظام میں احتیاط سے ضم کرنا) ذمہ داری اور عملییت کے ساتھ عزائم کو متوازن کرنے کی خواہش کو ظاہر کرتا ہے۔

جیسا کہ گوگل ڈیپ مائنڈ کے CTO، Koray Kavukcuoglu نے اعلان میں کہا، مقصد یہ ہے کہ AI کو تیز رفتاری سے بہتر بناتے ہوئے اسے مزید مددگار اور قابل بنایا جائے۔

صنعت کے مبصرین کے لیے، جیمنی 2.5 پرو ایک سنگ میل ہے جو کہ 2025 کے اوائل تک AI کس حد تک پہنچ چکا ہے – اور اس بات کا اشارہ ہے کہ یہ کہاں جا رہا ہے۔ "اسٹیٹ آف دی آرٹ" کا بار بڑھتا ہی جا رہا ہے: آج یہ استدلال اور ملٹی موڈل صلاحیت ہے، کل یہ اس سے بھی زیادہ عام مسئلہ حل کرنے یا خود مختاری جیسی چیز ہو سکتی ہے۔ گوگل کا تازہ ترین ماڈل ظاہر کرتا ہے کہ کمپنی نہ صرف اس دوڑ میں ہے بلکہ اپنے نتائج کو شکل دینے کا ارادہ رکھتی ہے۔ اگر جیمنی 2.5 کچھ بھی ہے تو، AI ماڈلز کی اگلی نسل ہمارے کام اور زندگیوں میں اور بھی زیادہ مربوط ہو جائے گی، جس سے ہمیں ایک بار پھر یہ تصور کرنے پر آمادہ کیا جائے گا کہ ہم مشینی ذہانت کو کس طرح استعمال کرتے ہیں۔

Alex McFarland ایک AI صحافی اور مصنف ہے جو مصنوعی ذہانت میں تازہ ترین پیشرفت کی کھوج لگا رہا ہے۔ اس نے دنیا بھر میں متعدد AI اسٹارٹ اپس اور اشاعتوں کے ساتھ تعاون کیا ہے۔