مصنوعی ذہانت
علی بابا نے سرچ انجن سمولیشن AI تیار کیا جو لائیو ڈیٹا استعمال کرتا ہے۔

چین میں تعلیمی محققین کے ساتھ مل کر، علی بابا نے ایک سرچ انجن سمولیشن AI تیار کیا ہے جو ای کامرس کمپنی کے لائیو انفراسٹرکچر سے حقیقی دنیا کے ڈیٹا کا استعمال کرتا ہے تاکہ نئے رینکنگ ماڈل تیار کیے جا سکیں جو 'تاریخی' یا پرانی معلومات سے متاثر نہیں ہوتے ہیں۔
انجن، کہا جاتا ہے AESim، ماڈل کی تربیت کے وقت دستیاب ڈیٹا کو خلاصہ کرنے کے بجائے، AI سسٹمز کو لائیو اور موجودہ ڈیٹا کا جائزہ لینے اور ان کو شامل کرنے کے قابل ہونے کی ضرورت کو تسلیم کرنے کے لیے ایک ہفتے میں دوسرے بڑے اعلان کی نمائندگی کرتا ہے۔ اس سے پہلے کا اعلان فیس بک کی طرف سے تھا، جو گزشتہ ہفتے سامنے آیا تھا۔ بے نقاب BlenderBot 2.0 لینگویج ماڈل، ایک NLP انٹرفیس جو سوالات کے جواب میں انٹرنیٹ تلاش کے نتائج کی لائیو پولنگ کی خصوصیت رکھتا ہے۔
AESim پروجیکٹ کا مقصد نئے لرننگ ٹو رینک کی ترقی کے لیے تجرباتی ماحول فراہم کرنا ہے۔LTRتجارتی معلومات کی بازیافت کے نظام میں حل، الگورتھم اور ماڈل۔ فریم ورک کی جانچ میں، محققین نے پایا کہ یہ مفید اور قابل عمل پیرامیٹرز کے اندر آن لائن کارکردگی کو درست طریقے سے ظاہر کرتا ہے۔
مقالے کے مصنفین، بشمول نانجنگ یونیورسٹی اور علی بابا کے ریسرچ ڈویژن کے چار نمائندے، اس بات پر زور دیتے ہیں کہ LTR تخروپن کے لیے ایک نیا نقطہ نظر دو وجوہات کی بناء پر ضروری تھا: تولیدی تکنیکوں کو تخلیق کرنے کے لیے گہری سیکھنے میں حالیہ اسی طرح کے اقدامات کی ناکامی، توجہ حاصل کرنے والے الگورتھم کے وقفے کے ساتھ۔ ترجمہ کرنے میں ناکام قابل اطلاق حقیقی دنیا کے نظاموں میں؛ اور منتقلی کی کمی، تربیتی ڈیٹا بمقابلہ ناول ڈیٹا کی کارکردگی کے لحاظ سے ایسے معاملات میں جہاں سسٹم ابتدائی طور پر زیادہ موثر تھے۔
لائیو چل رہا ہے
مقالے میں دعویٰ کیا گیا ہے کہ AESim پہلا ای کامرس سمولیشن پلیٹ فارم ہے جس کی پیشین گوئی لائیو اور موجودہ صارفین کے ڈیٹا اور سرگرمی پر کی گئی ہے، اور یہ کہ لائیو ڈیٹا کے یکطرفہ استعمال سے آن لائن کارکردگی کو درست طریقے سے ظاہر کر سکتا ہے، جو بعد کے محققین کے لیے بلیو اسکائی ٹریننگ پلے گراؤنڈ فراہم کرتا ہے۔ LTR طریقوں اور اختراعات کا جائزہ لینے کے لیے۔
ماڈل میں صنعتی سرچ انجنوں کے لیے ایک عام اسکیما پر ایک نیا ٹیک شامل کیا گیا ہے: پہلا مرحلہ صارف کے استفسار سے متعلق آئٹمز کی بازیافت ہے، جو ابتدائی طور پر صارف کو پیش نہیں کی جاتی ہیں، بلکہ پہلے وزن والے LTR ماڈل کے ذریعے ترتیب دی جاتی ہیں۔ پھر ترتیب شدہ نتائج کو ایک فلٹر سے گزارا جاتا ہے جو نتائج کی فراہمی میں کمپنی کے مقاصد پر غور کرتا ہے - جس کے مقاصد میں اشتہارات اور تنوع کے عوامل شامل ہو سکتے ہیں۔
AESim کا فن تعمیر
AESim میں، سوالات کو زمرہ کے اشاریہ سے بدل دیا جاتا ہے، جس سے نظام کو زمرہ کے اشاریہ سے اشیاء کو دوبارہ حاصل کرنے کی اجازت دیتا ہے، اس سے پہلے کہ وہ اپنی مرضی کے مطابق ری رینکرز کو بھیجے جو حتمی فہرست تیار کرتا ہے۔ اگرچہ فریم ورک محققین کو متعدد ماڈلز میں مشترکہ درجہ بندی کے اثرات کا مطالعہ کرنے کی اجازت دیتا ہے، لیکن اس پہلو کو مستقبل کے کام کے لیے چھوڑا جا رہا ہے، اور موجودہ نفاذ خود بخود ایک ماڈل کی بنیاد پر مثالی تشخیص کی کوشش کرتا ہے۔
AESim ایمبیڈنگز (مشین لرننگ فن تعمیر میں ورچوئل نمائندگی) تخلیق کرتا ہے جو 'ورچوئل یوزر' اور ان کے استفسار کو سمیٹتا ہے، اور گریڈیئنٹ پینلٹی (WGAN-GP) نقطہ نظر
فن تعمیر میں زمرہ کے لحاظ سے ترتیب کردہ لاکھوں دستیاب اشیاء کا ڈیٹا بیس، ایک حسب ضرورت درجہ بندی کا نظام، ایک فیڈ بیک ماڈیول، اور GAN پر مبنی اجزاء کے ذریعہ تیار کردہ مصنوعی ڈیٹاسیٹس شامل ہیں۔ فیڈ بیک ماڈیول ورک فلو کا آخری مرحلہ ہے، جو درجہ بندی کے ماڈل کی تازہ ترین تکرار کی کارکردگی کا جائزہ لینے کے قابل ہے۔
جنریٹیو ایڈورسریئل امیٹیشن لرننگ
'ورچوئل یوزر ماڈیول' کے فیصلے کی منطق کو ماڈل کرنے کے لیے، فیڈ بیک ماڈیول (جو حتمی نتائج فراہم کرتا ہے) کو جنریٹیو ایڈورسریئل امیٹیشن لرننگ (گیل)، 2016 میں اسٹینفورڈ کے محققین کی طرف سے سب سے پہلے پیش کردہ ایک نظریہ۔ GAIL ایک ماڈل فری پیراڈائم ہے جو ایک نظام کو ترقی دینے کی اجازت دیتا ہے۔ پالیسی ڈیٹا سے براہ راست تقلید کی تعلیم.
AESim کی طرف سے تیار کردہ تربیتی سیٹ بنیادی طور پر جامد، تاریخی ڈیٹا سیٹس جیسے ہی ہیں جو کہ اسی طرح کے نظاموں کے لیے پہلے زیر نگرانی سیکھنے کے ماڈلز میں استعمال ہوتے ہیں۔ AESim کے ساتھ فرق یہ ہے کہ یہ تاثرات کے لیے ایک جامد ڈیٹاسیٹ پر انحصار نہیں کرتا، اور اس وقت (پرانے) تربیتی ڈیٹا کو مرتب کرنے کے وقت تیار کیے گئے آئٹم آرڈرز سے متاثر نہیں ہوتا ہے۔
AESim کا تخلیقی پہلو WGAN-GP کے ذریعے ایک ورچوئل صارف کی تخلیق پر مرکوز ہے، جو 'جعلی' صارف اور استفسار کی خصوصیات کو ظاہر کرتا ہے، اور پھر اس غلط ڈیٹا کو لائیو نیٹ ورکس کے ذریعے فراہم کردہ حقیقی صارف ڈیٹا سے جاننے کی کوشش کرتا ہے جس تک AESim کو رسائی حاصل ہے۔

ایک عام صنعتی سرچ انجن سمولیشن میں جعلی اور حقیقی صارفین کی کلاؤڈ نمائندگی۔
ٹیسٹنگ
محققین نے AESim کو تعینات کرکے تجربہ کیا۔ جوڑے کے لحاظ سے، نقطہ وار اور لسٹ ایم ایل ای مثال کے طور پر سسٹم میں، جن میں سے ہر ایک کو دوبارہ رینکنگ الگورتھم کے تناظر میں تلاش کے سوالات کا ایک غیر متصل بے ترتیب ٹکڑا پیش کرنا تھا۔
اس وقت AESim کو تیزی سے بدلتے ہوئے اور متنوع لائیو ڈیٹا کے ذریعے چیلنج کیا گیا ہے جس طرح فیس بک کے نئے لینگویج ماڈل کا امکان ہے۔ اس لیے مجموعی کارکردگی کی روشنی میں نتائج پر غور کیا گیا ہے۔
دس دنوں تک ٹیسٹ کیا گیا، AESim نے تین ماڈلز میں قابل ذکر مستقل مزاجی کا مظاہرہ کیا، حالانکہ محققین نے نوٹ کیا کہ دستاویز کے سیاق و سباق کے لینگویج ماڈل کا ایک اضافی ٹیسٹ (ڈی ایل سی ایم) ماڈیول نے آف لائن ماحول میں ناقص کارکردگی کا مظاہرہ کیا، لیکن لائیو ماحول میں بہت اچھی کارکردگی کا مظاہرہ کیا، اور یہ تسلیم کرتے ہیں کہ سسٹم اپنے لائیو ہم منصبوں کے ساتھ خلا کو ظاہر کرے گا، جس کا انحصار کنفیگریشن اور ٹیسٹ کیے جانے والے ماڈلز پر ہوتا ہے۔