ہمارے ساتھ رابطہ

چاندی سے سونے تک: ڈیپ مائنڈ کے AI نے ریاضی اولمپیاڈ کو کیسے فتح کیا۔

مصنوعی ذہانت

چاندی سے سونے تک: ڈیپ مائنڈ کے AI نے ریاضی اولمپیاڈ کو کیسے فتح کیا۔

mm

DeepMind's AI نے صرف ایک سال کے عرصے میں ریاضیاتی استدلال میں قابل ذکر پیش رفت کی ہے۔ 2024 میں بین الاقوامی ریاضی اولمپیاڈ (IMO) میں چاندی کا تمغہ حاصل کرنے کے بعد، ان کے AI نظام نے 2025 میں سونے کا تمغہ حاصل کیا۔ یہ تیز رفتار پیش رفت مصنوعی ذہانت کی پیچیدہ، تجریدی مسائل سے نمٹنے میں بڑھتی ہوئی صلاحیتوں کو اجاگر کرتی ہے جن کے لیے انسان جیسی تخلیقی صلاحیتوں اور بصیرت کی ضرورت ہوتی ہے۔ یہ مضمون ڈیپ مائنڈ نے اس تبدیلی کو کیسے حاصل کیا، اس کے پیچھے تکنیکی اور حکمت عملی کے انتخاب، اور ان پیشرفت کے وسیع مضمرات کے بارے میں بتایا جائے گا۔

IMO کی اہمیت

۔ بین الاقوامی ریاضی اولمپیاڈ1959 میں قائم کیا گیا تھا، جسے عالمی سطح پر ہائی اسکول کے طلباء کے لیے ریاضی کے سب سے بڑے مقابلے کے طور پر تسلیم کیا جاتا ہے۔ ہر سال، دنیا بھر سے سرفہرست طلباء کو الجبرا، جیومیٹری، نمبر تھیوری، اور کمبینیٹرکس میں چھ مشکل مسائل کا سامنا کرنا پڑتا ہے۔ ان مسائل کو حل کرنے کے لیے حساب سے کہیں زیادہ ضرورت ہے۔ شرکاء کو حقیقی ریاضیاتی تخلیقی صلاحیت، سخت منطقی سوچ، اور خوبصورت ثبوت بنانے کی صلاحیت کا مظاہرہ کرنا چاہیے۔

مصنوعی ذہانت کے لیے، IMO ایک منفرد چیلنج پیش کرتا ہے۔ جب کہ AI نے پیٹرن کی شناخت، ڈیٹا کے تجزیہ، اور یہاں تک کہ گو اور شطرنج جیسے پیچیدہ کھیلوں میں مہارت حاصل کی ہے، اولمپیاڈ ریاضی تخلیقی، تجریدی استدلال اور نئے خیالات کی ترکیب کا مطالبہ کرتی ہے، مہارتیں روایتی طور پر انسانی ذہانت کی خصوصیات سمجھی جاتی ہیں۔ نتیجے کے طور پر، IMO ایک فطری امتحان بن گیا ہے جس کا اندازہ لگایا جا سکتا ہے کہ AI واقعی انسان نما استدلال کو حاصل کرنے کے کتنا قریب ہے۔

2024 کی سلور میڈل کی پیش رفت

2024 میں، ڈیپ مائنڈ متعارف آئی ایم او سطح کے مسائل سے نمٹنے کے لیے دو اے آئی سسٹمز: الفا پروف اور الفا جیومیٹری 2۔ دونوں سسٹمز "کی مثالیں ہیں۔نیورو علامتیAI، بڑے لینگویج ماڈلز (LLMs) کی طاقتوں کو علامتی منطق کی سختی کے ساتھ جوڑ کر۔

الفا پروف کا استعمال کرتے ہوئے ریاضیاتی بیانات کو ثابت کرنے کے لیے ڈیزائن کیا گیا تھا۔ جاؤ، ایک رسمی ریاضیاتی زبان۔ اس نے جیمنی، ڈیپ مائنڈ کے بڑے لینگویج ماڈل کے ساتھ ملایا الفا زیرو، جو ایک کمک سیکھنے والا انجن ہے جو بورڈ گیمز میں اپنی کامیابی کے لیے جانا جاتا ہے۔ اس ترتیب میں، Gemini کا کردار فطری زبان کے مسائل کو Lean میں ترجمہ کرنا اور منطقی مراحل پیدا کرکے ثبوتوں کی کوشش کرنا تھا۔ الفا پروف کو ریاضی کے مختلف شعبوں اور مشکلات پر محیط لاکھوں نمونے کے مسائل پر تربیت دی گئی۔ سسٹم نے تیزی سے پیچیدہ بیانات کو ثابت کرنے کی کوشش کر کے خود کو بہتر کیا، جیسا کہ AlphaZero نے اپنے خلاف گیمز کھیل کر سیکھا۔

الفا جیومیٹری 2 جیومیٹری کے مسائل کو حل کرنے کے لیے ڈیزائن کیا گیا تھا۔ یہاں، جیمنی کی زبان کی سمجھ نے AI کو مددگار معاون تعمیرات کی پیشین گوئی کرنے کے قابل بنایا، جبکہ ایک علامتی استدلال انجن منطقی کٹوتیوں کا انتظام کرتا ہے۔ اس ہائبرڈ نقطہ نظر کی اجازت ہے الفا جیومیٹری روایتی مشینی استدلال کے دائرہ کار سے باہر ہندسی مسائل سے نمٹنا۔

ان سسٹمز نے مل کر چھ میں سے چار IMO مسائل کو حل کیا: دو الجبرا میں، ایک نمبر تھیوری میں، اور ایک جیومیٹری میں، جس نے 28 میں سے 42 کا اسکور حاصل کیا۔ یہ کارکردگی ایک اہم سنگ میل تھی، کیونکہ یہ پہلی بار تھا جب کسی AI نے پہنچ گئی IMO میں چاندی کے تمغے کی سطح۔ تاہم، اس کامیابی نے مسائل کو رسمی ریاضیاتی زبانوں میں ترجمہ کرنے کے لیے انسانی ماہرین پر بہت زیادہ انحصار کیا۔ انہیں بڑے پیمانے پر کمپیوٹیشنل وسائل کی بھی ضرورت تھی، جس میں ہر مسئلے کے لیے پروسیسنگ میں دن لگے۔

گولڈ میڈل کے پیچھے تکنیکی اختراعات

چاندی سے ڈیپ مائنڈ کی تبدیلی ایک سونے کا تمغہ کارکردگی کئی اہم تکنیکی بہتریوں کے ذریعے کارفرما تھی۔

1. ثبوت کے لیے قدرتی زبان بطور ذریعہ

سب سے اہم تبدیلی ان نظاموں سے منتقل ہو رہی تھی جس کے لیے باضابطہ زبانوں میں ماہر ترجمے کی ضرورت ہوتی تھی تاکہ قدرتی زبان کو ثبوت کے لیے ذریعہ سمجھا جا سکے۔ یہ تبدیلی جیمنی کے بہتر ورژن کے ذریعے حاصل کی گئی ہے۔ لیس گہری سوچنے کی صلاحیتیں۔ مسائل کو دبلی پتلی میں تبدیل کرنے کے بجائے، ماڈل متن کو براہ راست پروسیس کرتا ہے، غیر رسمی خاکے تیار کرتا ہے، اندرونی طور پر اہم مراحل کو باقاعدہ بناتا ہے، اور ایک بہتر انگریزی ثبوت تیار کرتا ہے۔ انسانی آراء سے کمک سیکھنا (آر ایل ایچ ایف) کا استعمال ان حلوں کو انعام دینے کے لیے کیا گیا تھا جو منطقی طور پر ہم آہنگ، مختصر اور پیش کیے گئے تھے۔

Gemini Deep Think دو اہم طریقوں سے Gemini کے عوامی ورژن سے مختلف ہے۔ سب سے پہلے، یہ لمبے سیاق و سباق کی ونڈوز اور فی استفسار زیادہ کمپیوٹنگ ٹوکن مختص کرتا ہے، جو ماڈل کو سوچ کی کثیر صفحاتی زنجیروں کو برقرار رکھنے کے قابل بناتا ہے۔ دوسرا، یہ متوازی استدلال کا استعمال کرتا ہے، جہاں مختلف ممکنہ حلوں کے لیے سینکڑوں قیاس آرائی کے دھاگے تیار کیے جاتے ہیں۔ ایک ہلکا پھلکا سپروائزر پھر درجہ بندی کرتا ہے اور سب سے زیادہ امید افزا راستوں کو فروغ دیتا ہے، جن سے تصورات ادھار لیتے ہیں مونٹی کارلو درخت کی تلاش لیکن متن پر لاگو ہوتا ہے۔ یہ نقطہ نظر نقل کرتا ہے کہ کس طرح انسانی ٹیمیں ذہن سازی کرتی ہیں، غیر پیداواری خیالات کو رد کرتی ہیں، اور خوبصورت حل پر اکٹھے ہوتی ہیں۔

2. تربیت اور کمک سیکھنا

Gemini Deep Think کی تربیت میں حتمی جوابات کی بجائے اگلے مراحل کی پیشین گوئی کرنے کے لیے ماڈل کو ٹھیک کرنا شامل ہے۔ اس مقصد کے لیے، 100,000 اعلیٰ معیار کے اولمپیاڈ اور انڈر گریجویٹ مقابلہ حلوں کا ایک کارپس مرتب کیا گیا۔ کارپس بنیادی طور پر عوامی ریاضی کے فورمز، arXiv پری پرنٹس، اور کالج کے مسائل کے سیٹ سے جمع کیا گیا تھا۔ انسانی سرپرستوں نے غیر منطقی یا نامکمل ثبوتوں کو فلٹر کرنے کے لیے تربیتی مثالوں کا جائزہ لیا۔ کمک سیکھنے نے ماڈل کو بہتر بنانے میں مدد کی، اسے جامع اور درست ثبوت پیش کرنے کی طرف جھکایا۔ ابتدائی ورژن نے ضرورت سے زیادہ لفظی ثبوت پیش کیے، لیکن بے کار فقروں پر جرمانے نے آؤٹ پٹ کو تراشنے میں مدد کی۔

روایتی فائن ٹیوننگ کے برعکس، جو اکثر کم انعامات کے ساتھ جدوجہد کرتا ہے جہاں فیڈ بیک بائنری ہوتا ہے، یا تو ثبوت درست ہے یا نہیں۔ ڈیپ مائنڈ نے مرحلہ وار انعامی نظام نافذ کیا، جہاں ہر تصدیق شدہ ذیلی لیما نے مجموعی اسکور میں حصہ ڈالا۔ یہ انعامی طریقہ کار جیمنی کی رہنمائی کرتا ہے یہاں تک کہ جب مکمل ثبوت نایاب ہو۔ تربیت کا عمل تین ماہ پر محیط تھا اور اس میں تقریباً 25 ملین TPU-گھنٹے استعمال کیے گئے۔

3. بڑے پیمانے پر متوازی

ڈیپ مائنڈ کی چاندی سے سونے تک ترقی میں متوازی عمل نے بھی اہم کردار ادا کیا۔ ہر مسئلہ نے متوازی طور پر متعدد استدلال کی شاخیں پیدا کیں، جب دوسرے رک گئے تو وسائل متحرک طور پر زیادہ امید افزا راستوں کی طرف منتقل ہو گئے۔ یہ متحرک نظام الاوقات خاص طور پر امتزاج کے مسائل کے لیے فائدہ مند تھا، جن میں حل کی بڑی جگہیں ہیں۔ نقطہ نظر اس طرح ہے کہ کس طرح انسان مکمل شمولیت کا ارتکاب کرنے سے پہلے معاون عدم مساوات کو جانچتے ہیں۔ اگرچہ یہ تکنیک کمپیوٹیشنل طور پر مہنگی تھی، لیکن یہ ڈیپ مائنڈ کے TPU v5 کلسٹرز کا استعمال کرتے ہوئے قابل انتظام تھی۔

آئی ایم او 2025 میں ڈیپ مائنڈ

مقابلے کی سالمیت کو برقرار رکھنے کے لیے، DeepMind نے IMO سے تین ہفتے پہلے ماڈل کے وزن کو منجمد کر دیا تاکہ تربیتی سیٹ میں سرکاری مسائل کے رساو کو روکا جا سکے۔ انہوں نے پہلے غیر شائع شدہ اولمپیاڈ سوالات کے حل پر مشتمل ڈیٹا کو بھی فلٹر کیا۔

مقابلے کے دوران، Gemini Deep Think کو انٹرنیٹ تک رسائی دیے بغیر، سادہ متن کی شکل میں چھ سرکاری مسائل فراہم کیے گئے۔ یہ نظام ایک کلسٹر پر کام کرتا ہے جو ایک معیاری لیپ ٹاپ کی کمپیوٹیشنل طاقت کو فی عمل کے مطابق بنانے کے لیے تشکیل دیا گیا ہے۔ مسئلہ حل کرنے کا پورا عمل تین گھنٹے سے بھی کم وقت میں، وقت کی پابندیوں کے اندر مکمل ہوا۔ بنائے گئے ثبوت بغیر کسی ردوبدل کے IMO کوآرڈینیٹرز کو جمع کرائے گئے۔

Gemini Deep Think نے پہلے پانچ مسائل پر بہترین اسکور حاصل کیے ہیں۔ حتمی سوال، جو کہ ایک مشکل امتزاج پہیلی تھی، تاہم، نے AI اور 94% انسانی شرکاء دونوں کو روک دیا۔ اس کے باوجود، اے آئی نے 35/42 کے مجموعی اسکور کے ساتھ گولڈ میڈل حاصل کیا۔ یہ سکور پچھلے سال کی سلور کارکردگی سے سات پوائنٹ زیادہ تھا۔ مبصرین نے بعد میں AI کے ثبوتوں کو 'مستعد' اور 'مکمل' قرار دیا، یہ نوٹ کرتے ہوئے کہ انہوں نے انسانی مدمقابل سے متوقع سخت جوازوں کی پیروی کی۔

AI اور ریاضی کے مضمرات

ڈیپ مائنڈ کی کامیابی AI اور ریاضی دونوں کے لیے ایک اہم سنگ میل ہے۔ AI کے لیے، IMO میں مہارت حاصل کرنا مصنوعی جنرل انٹیلی جنس (AGI) کی طرف ایک قدم ہے، جہاں نظام کوئی بھی دانشورانہ کام انجام دے سکتا ہے جو انسان کر سکتا ہے۔ پیچیدہ ریاضیاتی مسائل کو حل کرنے کے لیے استدلال اور فہم کی ضرورت ہوتی ہے، جو کہ عمومی ذہانت کے بنیادی اجزاء ہیں۔ یہ کامیابی اس بات کی نشاندہی کرتی ہے کہ AI زیادہ انسانی جیسی علمی صلاحیتوں کی طرف پیش قدمی کر رہا ہے۔

ریاضی کے لیے، جیمنی ڈیپ تھنک جیسے AI نظام ریاضی دانوں کے لیے انمول اوزار بن سکتے ہیں۔ وہ نئے شعبوں کی تلاش، قیاس آرائیوں کی تصدیق، اور یہاں تک کہ نئے نظریات کی دریافت میں مدد کر سکتے ہیں۔ ثبوت کی تعمیر کے مزید تھکا دینے والے پہلوؤں کو خودکار بنا کر، AI انسانی ریاضی دانوں کو اعلیٰ سطح کے تصوراتی کام پر توجہ مرکوز کرنے سے آزاد کرتا ہے۔ مزید برآں، ان AI سسٹمز کے لیے تیار کی گئی تکنیک ریاضیاتی تحقیق میں نئے طریقوں کی ترغیب دے سکتی ہے جو کہ صرف انسانی کوششوں سے ممکن نہیں ہے۔

تاہم، ریاضی میں AI کی ترقی تعلیمی ترتیبات اور مقابلوں میں AI کے کردار کے بارے میں بھی سوالات اٹھاتی ہے۔ جیسا کہ AI کی صلاحیتیں بڑھ رہی ہیں، اس بارے میں بحثیں ہوں گی کہ اس کی شمولیت سے ریاضی کی تعلیم اور مقابلے کی نوعیت کو کیسے بدل سکتا ہے۔

منتظر

IMO گولڈ جیتنا ایک اہم سنگ میل ہے، لیکن بہت سے ریاضیاتی چیلنجز ابھی بھی موجودہ AI سسٹمز کی پہنچ سے باہر ہیں۔ تاہم، صرف ایک سال میں چاندی سے سونے تک تیز رفتار ترقی AI اختراعات اور پیشرفت کی تیز رفتار کو نمایاں کرتی ہے۔ اگر یہ رفتار جاری رہتی ہے تو، AI نظام جلد ہی ریاضی کے سب سے مشہور حل نہ ہونے والے مسائل سے نمٹ سکتے ہیں۔ اگرچہ یہ سوال کہ آیا AI انسانی تخلیقی صلاحیتوں کی جگہ لے گا یا اس میں اضافہ کرے گا، حل طلب ہے، 2025 IMO اس بات کا واضح اشارہ ہے کہ مصنوعی ذہانت نے منطقی استدلال میں اہم پیش رفت کی ہے۔

ڈاکٹر تحسین ضیاء COMSATS یونیورسٹی اسلام آباد میں ایک مدت کار ایسوسی ایٹ پروفیسر ہیں، جنہوں نے ویانا یونیورسٹی آف ٹیکنالوجی، آسٹریا سے AI میں پی ایچ ڈی کی ڈگری حاصل کی ہے۔ مصنوعی ذہانت، مشین لرننگ، ڈیٹا سائنس، اور کمپیوٹر ویژن میں مہارت رکھتے ہوئے، انہوں نے معروف سائنسی جرائد میں اشاعتوں کے ساتھ اہم شراکت کی ہے۔ ڈاکٹر تحسین نے پرنسپل انویسٹی گیٹر کے طور پر مختلف صنعتی منصوبوں کی قیادت بھی کی ہے اور اے آئی کنسلٹنٹ کے طور پر بھی خدمات انجام دی ہیں۔