اینڈرسن کا زاویہ
بڑی زبان کے ماڈلز میں تشہیر کے لیے تیار ہونا

نئی تحقیق سے پتہ چلتا ہے کہ اشتہارات کیسے جلد ہی ChatGPT طرز کے جوابات کے اندر سرایت کر سکتے ہیں – بینرز یا پاپ اپ کے طور پر نہیں، بلکہ جواب میں خود بُنے ہوئے ہیں۔ ایک نیا بینچ مارک جانچتا ہے کہ اشتہار سے لگائے گئے یہ جوابات کس حد تک مددگار، قابل اعتماد اور منافع بخش رہ سکتے ہیں، اور اس کے لیے قابل قبول صارف کے تجربے اور کلک تھرو کے درمیان تجارت کی ضرورت پڑ سکتی ہے۔
بڑی زبان کے ماڈلز کی وسیع اور بڑھتی ہوئی مقبولیت کے طور پر روایتی اشتہاری طریقوں کو کمزور کرتا ہے۔ جس نے تقریباً اپنے آغاز سے ہی انٹرنیٹ کو طاقت بخشی ہے، وینچر کیپیٹلسٹ کی مارکیٹ کیپچر کی حکمت عملی سے واقف کوئی بھی سوچ رہا ہو گا کہ AI چیٹ بوٹس اپنے جوابات میں اشتہاری مواد کو شامل کرنے سے کتنی دیر روک سکے گا۔
Netflix اور سٹریمنگ سروسز کے بڑھتے ہوئے روسٹر کے طور پر مظاہرہ, ادا شدہ سبسکرپشنز کو ایمبیڈڈ ایڈورٹائزنگ کے ساتھ ملانے کی روایتی کیبل دور کی حکمت عملی (اکثر صارفین کے اخراجات کو کم رکھنے کے طریقے کے طور پر جائز قرار دی جاتی ہے) دوبارہ زور پکڑ رہی ہے۔ اور اشتہارات کو براہ راست LLM آؤٹ پٹ میں شامل کرنے کی طرف تبدیلی شروع ہو رہی ہے۔ کم قیاس آرائیاں لگتی ہیں۔. اور اس ماڈل کے قدرتی اختیار کرنے والے کی طرح۔

پیپر 'ایل ایل ایمز کے ساتھ آن لائن اشتہارات: مواقع اور چیلنجز' سے، منتقلی کی ایک کافی نمائندہ مثال ہے جس کی زیادہ تر لوگ LLMs کے منیٹائز ہونے پر توقع کر رہے ہیں۔ ماخذ: https://www.sigecom.org/exchanges/volume_22/2/FEIZI.pdf
ابھرتے ہوئے میڈیم میں اشتہارات کو شامل کرنے کا امکان جو پہلے ہی قابل ذکر ہے۔ مسائل ساکھ کے ساتھ، تیز لگ سکتا ہے؛ ابھی تک تخلیقی AI میں سرمایہ کاری کا پیمانہ پچھلے بارہ مہینوں سے پتہ چلتا ہے کہ مارکیٹ فی الحال محتاط یا محتاط رویہ سے متعین نہیں ہے۔ اور بڑے کھلاڑیوں کے ساتھ جیسے اوپن اے آئی دلیل سے زیادہ لیوریجڈ اور ضرورت ہے۔ بڑے پیمانے پر سرمایہ کاری پر ابتدائی واپسی۔، تاریخ بتاتی ہے کہ اشتہار سے پاک آؤٹ پٹ کا ہنی مون پیریڈ ختم ہو سکتا ہے۔
جی ای ایم بنچ
اس آب و ہوا کے ساتھ اور ان کاروباری تقاضوں کو ذہن میں رکھتے ہوئے، سنگاپور کا ایک دلچسپ نیا پیپر پہلا بینچ مارک پیش کرتا ہے جس کا مقصد AI چیٹ بوٹ انٹرفیسز کے ساتھ ساتھ نئے کوانٹیفائینگ میٹرکس کے ساتھ ہے جو 100 سالوں میں سب سے زیادہ دھماکہ خیز اشتہاری میدانوں میں سے ایک ثابت ہو سکتا ہے۔
شاید پرامید طور پر، مصنفین 'حقیقی' مواد اور اشتہاری مواد کے درمیان ایک صاف تقسیم فرض کرتے ہیں، جہاں معیاری ردعمل سے مارکیٹنگ کاپی میں 'موڑ' کو تلاش کرنا کافی آسان ہے:

اشتہار کے انضمام کی اس قسم کی مثالیں جو نئے پیپر میں پڑھے گئے دو ماڈلز کے تحت سامنے آسکتی ہیں۔ ماخذ: https://arxiv.org/pdf/2509.14221
یہ دیکھنا باقی ہے کہ آیا مشتہرین خود، جیسا کہ ان کا رجحان رہا ہے، کاغذ میں دی گئی مثالوں کے مقابلے میں اپنے اشتہار کے مواد کو زیادہ نفاست سے آؤٹ پٹ میں شامل کرنے کی کوشش کریں گے۔
تاہم، یہ بعد کے معاملات ہیں؛ اس لمحے کے لیے، میدان اتنا نوزائیدہ ہے کہ بنیادی اصطلاحات بھی غائب ہیں، ورنہ اس پر آباد نہیں ہے۔
اس لیے کاغذ کا تعارف کرایا جاتا ہے۔ جنریٹو انجن مارکیٹنگ (GEM) LLM پر مبنی چیٹ بوٹس کو منیٹائز کرنے کے لیے ایک نئے فریم ورک کے طور پر، متعلقہ اشتہارات کو براہ راست تیار کردہ جوابات میں سرایت کر کے۔
محققین شناخت کرتے ہیں۔ اشتھاراتی انجیکشن جواب (AIR) نسل کو GEM میں مرکزی چیلنج کے طور پر، اور دلیل دی کہ موجودہ معیارات اس کے مطالعہ کے لیے ناقص طور پر موزوں ہیں۔ اس خلا کو پُر کرنے کے لیے، وہ متعارف کراتے ہیں جس کا وہ دعویٰ کرتے ہیں کہ اس مقصد کے لیے خاص طور پر ڈیزائن کیا گیا پہلا بینچ مارک ہے۔
GEM-Bench چیٹ بوٹ اور سرچ انجن کے منظرناموں پر پھیلے ہوئے تین کیوریٹڈ ڈیٹاسیٹس پر مشتمل ہے۔ اس میں ایک میٹرک آنٹولوجی بھی شامل ہے جو صارف کے اطمینان اور مشغولیت کے متعدد پہلوؤں کا جائزہ لینے کے لیے ڈیزائن کیا گیا ہے، اس کے ساتھ ساتھ ایک ماڈیولر ملٹی ایجنٹ فریم ورک کے اندر لاگو کیے جانے والے بیس لائن طریقوں کا مجموعہ ہے۔
مصنفین کا دعویٰ ہے کہ اگرچہ سادہ پرامپٹ پر مبنی طریقے قابل احترام منگنی کی پیمائشیں حاصل کر سکتے ہیں، جیسے کہ ایلیویٹڈ کلک تھرو ریٹ (CTR)، وہ صارف کے اطمینان کو کم کرنے کا رجحان رکھتے ہیں۔ اس کے برعکس، وہ نقطہ نظر جو اشتہارات کو پہلے سے تیار کردہ، اشتہارات سے پاک جوابات میں داخل کرتے ہیں اعتماد اور ردعمل کے معیار میں بہتری کو ظاہر کرتے ہیں - اگرچہ زیادہ کمپیوٹیشنل اوور ہیڈ کی قیمت پر۔
اخبار کا استدلال ہے کہ یہ تجارتی تعلقات اشتہارات کو جنریٹیو آؤٹ پٹس میں ضم کرنے کے لیے زیادہ موثر اور موثر تکنیکوں کی ضرورت کو اجاگر کرتے ہیں۔
۔ نیا کام عنوان ہے GEM-Bench: جنریٹیو انجن مارکیٹنگ کے اندر ایڈ-انجیکٹڈ رسپانس جنریشن کے لیے ایک بینچ مارک، اور سنگاپور کی نیشنل یونیورسٹی کے چار محققین سے آتا ہے۔
طریقہ
جنریٹو انجن مارکیٹنگ (GEM) کا خاکہ سرچ انجن مارکیٹنگ (SEM) کے بنیادی اصولوں سے لیا گیا ہے۔ روایتی SEM ایک ملٹی اسٹیج پائپ لائن کے ذریعے اشتہارات سے سوالات کو ملا کر کام کرتا ہے جس میں مشتہرین کلیدی الفاظ پر بولی لگاتے ہیں۔ سسٹم شناخت کرتا ہے کہ کون سے سوالات اشتہارات کو متحرک کرتے ہیں۔ سسٹم اندازہ لگاتا ہے کہ ہر اشتہار پر کلک کیے جانے کا کتنا امکان ہے۔ اور پھر ایک نیلامی کے ذریعے جگہ کا تعین کرتا ہے جو پیش گوئی کی گئی مصروفیت کے ساتھ بولیوں میں توازن رکھتا ہے۔
اس کے برعکس GEM اپروچ LLMs کے لیے انہی مراحل کو ڈھال لیتا ہے، لیکن ہر قدم پر نئے چیلنجز کا سامنا کرنا پڑتا ہے: اشتہار کے کوئی مقررہ سلاٹ نہیں ہیں، اس لیے سسٹم کو یہ فیصلہ کرنا چاہیے کہ آیا کوئی سوال اشتہار لے سکتا ہے اور اسے فری فارم ٹیکسٹ میں کہاں داخل کرنا ہے۔ کلک کے ذریعے شرحوں کا تخمینہ لگانا ساختی ترتیب کے بغیر مشکل ہو جاتا ہے۔ اور مطابقت کو صارف کے اطمینان کے خلاف متوازن ہونا چاہیے، کیونکہ اشتہارات اسٹینڈ اکیلی کاپی کے طور پر پیش کرنے کے بجائے براہ راست ماڈل کے اپنے آؤٹ پٹ میں بنے ہوئے ہیں۔
کام میں زیر مطالعہ بنیادی خطوط میں سے ایک، اشتہار چیٹ، ایک سادہ طریقہ کی نمائندگی کرتا ہے جہاں ماڈل کی طرف سے ردعمل پیدا کرنے سے پہلے اشتھاراتی مواد کو سسٹم پرامپٹ میں داخل کیا جاتا ہے۔ اس کا مطلب یہ ہے کہ ماڈل پہلے سے ہی ایمبیڈ کردہ اشتہار کے ساتھ ایک جواب تیار کرتا ہے، جس کی رہنمائی پہلے سے لوڈ کردہ ایجنڈے کے ذریعے ہوتی ہے۔
دوسرا نقطہ نظر، Ad-LLM، کو مصنفین نے نئے بینچ مارک پیشکش کے حصے کے طور پر تیار کیا تھا۔ Ad-LLM ایک ماڈیولر راستہ اختیار کرتا ہے، پہلے صاف، اشتہار سے پاک جواب تیار کرتا ہے۔ متعلقہ اشتہار کا انتخاب؛ سیمنٹک بہاؤ کی بنیاد پر بہترین اندراج پوائنٹ کی نشاندہی کرنا؛ اور آخر میں اشتھار کو آسانی سے مربوط کرنے کے لیے آؤٹ پٹ کو دوبارہ لکھنا:

Ad-Chat اور مصنفین کے 'Ad-LLM' طریقہ کے درمیان موازنہ۔ Ad-Chat محدود پلیسمنٹ کنٹرول کے ساتھ، جنریشن سے پہلے سسٹم پرامپٹ کے ذریعے اشتہارات کو انجیکٹ کرتا ہے۔ Ad-LLM رسپانس جنریشن اور اشتہار کے اندراج کو الگ کرتا ہے، سیمنٹک فلو کی بنیاد پر اندراج پوائنٹس کا انتخاب کرتا ہے، اور نتیجہ کو بہتر کرتا ہے۔ دونوں کو اطمینان اور مصروفیت کے لیے GEM-Bench میٹرکس کا استعمال کرتے ہوئے اسکور کیا جاتا ہے۔
اگرچہ Ad-Chat سستا اور بعض اوقات زیادہ قائل ہوتا ہے، لیکن یہ اعتماد اور درستگی کو کم کرتا ہے۔ Ad-LLM صارف کے اطمینان کے میٹرکس پر بہتر کارکردگی کا مظاہرہ کرتا ہے، لیکن زیادہ قیمت پر۔
ڈیٹا
AIR جنریشن کے لیے، ابتدائی طور پر دو قسم کے ڈیٹاسیٹس بنائے گئے تھے: ایک صارف کے سوال کا سیٹ (رکن کا) اور ایک اشتہاری ڈیٹا بیس (ایڈ ڈی بی).
چونکہ صارف کے سوالات LLM کے جوابات میں اشتہاری مواقع کی وضاحت کرتے ہیں، اس لیے کہا جا سکتا ہے کہ 'اشتہار کی فہرست' ان جوابات میں موجود ہے، حالانکہ اس کی وضاحت نہ صرف صارف کے استفسار کے قابل اطلاق ہونے سے ہوتی ہے بلکہ اس حد تک کہ نظام مشتہرین کی ضروریات کے خلاف سالمیت کے توازن کے بارے میں اپنے قوانین کی پابندی کرتا ہے۔
کسی بھی صورت میں، اشتہارات صرف جوابات میں ظاہر ہوں گے، چاہے (اوپر سکیما دیکھیں) صارف کی درخواستوں کو خفیہ طور پر اشتہار دینے کے عمل کو ایڈجسٹ کرنے کے لیے بڑھایا جا سکتا ہے۔
چیٹ بوٹ کے منظر نامے کے لیے، مصنفین نے استفسار کے دو ڈیٹاسیٹ بنائے: MT-انسان اور ایل ایم مارکیٹ.
MT-Human کو ہیومینٹیز کے حصے سے تیار کیا گیا تھا۔ ایم ٹی بنچ, LLMs کے لیے ایک ملٹی ٹرن بینچ مارک، اور اس میں ایسے سوالات شامل ہیں جو اشتھاراتی مواد کو ایڈجسٹ کر سکتے ہیں۔
LM-Market کو نصف ملین سے زیادہ حقیقی ChatGPT سوالات سے بنایا گیا تھا جو جمع کیے گئے تھے۔ LMSYS-Chat-1Mانگریزی زبان کی مارکیٹنگ سے متعلقہ اشارے کے لیے فلٹر کیا گیا، اور عنوان کے لحاظ سے کلسٹر کیا گیا سیمنٹک ایمبیڈنگز.
دونوں صورتوں میں، حتمی سوالات کا انتخاب خود کار طریقے سے ملٹی اسٹیج پائپ لائن کے ذریعے کیا گیا تھا۔ clustering کے، LLM اسکورنگ، اور انسانی تصدیق، اشتھارات کی نشاندہی کرنے کے مقصد کے ساتھ جہاں اشتہار کا اندراج فطری اور قابل فہم ہوگا۔
اشتھاراتی انجیکشن والے جوابات کے معیار کا جائزہ لینے کے لیے، GEM ایک پیمائشی آنٹولوجی کی وضاحت کرتا ہے جس میں صارف کی اطمینان اور مشغولیت دونوں کا احاطہ کیا جاتا ہے۔ یہ مقداری میٹرکس میں لیتا ہے بشمول ردعمل کا بہاؤ, coherence، اور کلک تھری ریٹ، نیز معیار کے معیارات جیسے پر بھروسہ, درستگی، اور فطرت - میٹرکس کا مقصد ان دونوں کی عکاسی کرنا ہے کہ کوئی اشتہار جواب میں کس حد تک فٹ بیٹھتا ہے، اور صارفین کے اس کو سمجھنے اور اس کے ساتھ تعامل کرنے کے کتنے امکانات ہیں۔
'فطرت' کے بارے میں، مقالے میں کہا گیا ہے:
'[فطری پن] اس حد تک پیمائش کرتا ہے کہ کس حد تک اشتہار کا اندراج گفتگو کے بہاؤ اور فطری پن میں خلل ڈالتا ہے، مداخلت اور صداقت کی بنیاد پر۔ مداخلت اس بات کی جانچ کرتی ہے کہ آیا اشتہار پڑھنے کے دوران "جمپ آؤٹ" یا "اچانک" احساس پیدا کرتا ہے، جس سے موضوع پر صارف کی مسلسل توجہ ٹوٹ جاتی ہے۔
'صداقت اس بات کا جائزہ لیتی ہے کہ آیا اشتہار گفتگو کے "انسانی رابطے" یا "قدرتی بہاؤ" کو کمزور کرتا ہے، جس سے جواب سخت، فارمولک اور کم مستند لگتا ہے۔'
جانچ کے مرحلے کے لیے ایک روایتی سرچ انجن کا منظر نامہ تیار کرنے کے لیے، مصنفین نے ایک ڈیٹا سیٹ بنایا جس کا عنوان تھا۔ CA-Prod سے AdsCVLR تجارتی کارپس، جس میں 300,000 استفسار کے اشتہار کے جوڑے ہوتے ہیں، ہر ایک کلیدی لفظ، میٹا ڈیٹا، اور دستی لیبل مارکنگ مطابقت پر مشتمل ہوتا ہے:

اس کے اصل ماخذ کاغذ سے، AdsCVLR ڈیٹاسیٹ کی مثالیں، جس نے مصنفین کے ٹیسٹ کے لیے مواد فراہم کرنے میں مدد کی۔ ماخذ: http://www.jdl.link/doc/2011/20221224_AdsCVLR.pdf
کھوئے ہوئے فیلڈز والے ریکارڈز کو ہٹا دیا گیا تھا، اور صرف مثبت اور منفی دونوں اشتہارات پر مشتمل سوالات رکھے گئے تھے (مثال کے لیے اوپر تصویر دیکھیں)۔
ڈیٹا کو بہتر بنانے کے لیے، اشتہارات کو چھ ٹاپیکل گروپس میں کلسٹر کیا گیا تھا (لان اور باغ کا سامان, پرچی پر جوتے, گھریلو چیزیں, غذائیت کی فراہمی, Android آلات، اور خواتین کے کپڑے) سیمنٹک ایمبیڈنگز اور K- یعنی کلسٹرنگ کا استعمال۔
اس کے بعد سوالات کو ان کے مثبت اشتہارات کے مطابق عنوانات کے لیے تفویض کیا گیا، جس میں حد سے زیادہ ویرل یا گھنے سیٹوں کو خارج کر دیا گیا، اس سے پہلے کہ 120 سوالات اور 2,215 منفرد پروڈکٹس کو آخر کار بینچ مارک کے لیے نمونہ بنایا گیا۔
ٹیسٹ
مختلف اشتھاراتی انجیکشن کی حکمت عملیوں نے کتنی اچھی کارکردگی کا مظاہرہ کیا اس کا اندازہ کرنے کے لیے، بینچ مارک نے تین بنیادی سوالات سے نمٹا: ہر طریقہ متعین اطمینان اور مشغولیت کے میٹرکس میں کتنا موثر تھا۔ Ad-LLM کے اندرونی ڈیزائن کے انتخاب اس کے نتائج کو کیسے متاثر کر سکتے ہیں۔ اور کمپیوٹیشنل لاگت کا تمام سسٹمز میں موازنہ کیسے ہوگا۔
مصنفین نے Ad-Chat اور مصنفین کی Ad-LLM پائپ لائن کی تین قسموں کا جائزہ لیا، جن میں سے ہر ایک میں اس بات میں فرق تھا کہ اشتہارات کیسے حاصل کیے گئے (یا تو فوری طور پر یا پیدا کردہ جواب سے)، اور آیا حتمی آؤٹ پٹ کو روانی کے لیے دوبارہ لکھا گیا تھا۔
تمام طریقے استعمال کرتے ہوئے چلائے گئے۔ doubao-1-5-lite-32k بیس ماڈل کے طور پر اور اس کے ساتھ فیصلہ کیا گیا۔ gpt-4.1-mini.

MT-Human، LM-Market، اور CA-Prod ڈیٹاسیٹس میں Ad-Chat اور Ad-LLM مختلف حالتوں کی تاثیر۔ مقداری میٹرکس میں رسپانس فلو (RF)، رسپانس کوہرنس (RC)، ایڈ فلو (AF)، ایڈ کوہرنس (AC)، انجیکشن ریٹ (IR)، کلک تھرو ریٹ (CTR) اور مجموعی اسکور شامل ہیں۔ کوالٹیٹیو میٹرکس درستگی، فطرت، شخصیت، اعتماد، نوٹس، کلک(-تھرو) اور مجموعی کارکردگی کا احاطہ کرتا ہے۔
تینوں ڈیٹا سیٹس میں، Ad-LLM نے اطمینان اور مشغولیت دونوں اقدامات پر Ad-Chat سے زیادہ مضبوط نتائج پیدا کیے ہیں۔ جیسا کہ اوپر کے نتائج کے جدول میں دکھایا گیا ہے، Ad-Chat پر بہترین Ad-LLM ویرینٹ میں مجموعی مقداری اسکورز میں 8.4، 1.5، اور 3.8 فیصد بہتری آئی ہے۔ اور MT-Human، LM-Market، اور CA-Prod کے معیار کے اسکور میں بالترتیب 10.7، 10.4، اور 8.6 فیصد۔
ان نتائج میں سے، مصنفین بیان کرتے ہیں:
'یہ نتائج ظاہر کرتے ہیں کہ ایک خام ردعمل پیدا کرنے اور بعد میں اشتہارات کو انجیکشن لگانے سے صرف سسٹم پرامپٹ انجیکشن پر انحصار کرنے کے آسان طریقہ کے مقابلے میں بہتر ردعمل کا معیار ملتا ہے۔
'مخصوص صارف کے اطمینان اور مصروفیت کے طول و عرض کے لیے، Ad-Chat مسلسل تینوں ڈیٹا سیٹس میں Ad-LLM حل کے مقابلے میں کارکردگی کا کافی فرق دکھاتا ہے، خاص طور پر درستگی، شخصیت اور اعتماد جیسے جہتوں میں۔'
مزید، Ad-LLM نے درستگی، شخصیت اور اعتماد میں اپنی مضبوط ترین کامیابیاں ظاہر کیں، جس نے Ad-Chat کو بالترتیب 17.6%، 23.3%، اور 17.2% تک پیچھے چھوڑ دیا۔ مقالے کے مطابق، ان اختلافات کے نتیجے میں Ad-Chat ماڈل کو زیادہ ذاتی نوعیت کی اور پروموشنل زبان کی طرف لے جانے کے لیے سسٹم پرامپٹس کا استعمال کرنے کے طریقے سے ہو سکتا ہے - جس کا مصنفین کا کہنا ہے کہ 'سیلز مین جیسا' لہجہ پیدا ہو سکتا ہے جو درستگی اور اعتماد کو کم کرتا ہے۔
Ad-Chat نے کم انجیکشن ریٹ بھی پیدا کیے، یہاں تک کہ جب اشتھاراتی مناسبیت کے لیے منتخب کردہ استفسارات کا جائزہ لیا جائے، اور مصنفین اس کی وجہ پرامپٹ پر مبنی اشاروں پر انحصار کو قرار دیتے ہیں (جسے وہ کنٹرول کرنا مشکل سمجھتے ہیں)۔
تاہم، سرچ انجن کی ترتیب میں، Ad-Chat نے 8.6% زیادہ کلک تھرو ریٹ حاصل کیا، جس کے بارے میں مقالہ تجویز کرتا ہے کہ پروڈکٹ کے امیدواروں کو بازیافت کرنے کے لیے LLM استعمال کرنے کے فائدے کی عکاسی ہو سکتی ہے، بجائے اس کے کہ صرف سیمنٹک ایمبیڈنگز پر انحصار کیا جائے:

Ad-Chat کے لیے چار جج ماڈلز (GPT-4.1-mini، Qwen-max، claude-3-5-haiku، kimi-k2) اور MT-Human، LM-Market، اور datasCA- پر تین Ad-LLM متغیرات (GI-R, GIR-R, GIR-P) کے مجموعی کارکردگی کے اسکورز کا موازنہ۔ جب کہ جج کے لحاظ سے اسکور مختلف ہوتے ہیں، Ad-LLM مسلسل تمام حالات میں Ad-Chat کو پیچھے چھوڑتا ہے۔
نتائج کا دوسرا جدول (اوپر دکھایا گیا ہے) واضح کرتا ہے کہ تینوں ڈیٹا سیٹس پر Ad-LLM سلوشنز مسلسل چار جج ماڈلز میں Ad-Chat کو پیچھے چھوڑتے ہیں۔ GPT-4.1-mini؛ Qwen-max; کلاڈ-3-5-ہائیکو؛ اور Kimi-k2۔
ان ججوں کو بیس ماڈل doubao-1-5-lite-32k سے مختلف کرنے کے لیے منتخب کیا گیا تھا، جو ماڈل-فیملی الائنمنٹ سے تعصب کو کم کرنے میں مدد کرتا ہے۔ GIR-R ہر معاملے میں پہلے یا دوسرے نمبر پر ہے، جو Ad-LLM کی برتری پر ججوں کے درمیان وسیع معاہدے کی تجویز کرتا ہے۔ انفرادی معیار کے طول و عرض میں خرابی فوری طور پر پہلے کے نتائج میں نظر آنے والے پیٹرن کی قریب سے پیروی کرتی ہے (مزید اوپر دکھایا گیا ہے)۔
اختتام پر، کاغذ نوٹ کرتا ہے کہ Ad-Chat اور Ad-LLM دونوں کو زیادہ جدید اور موثر ماڈلز سے زیادہ وسائل کی ضرورت ہوتی ہے، اور یہ کہ اس قسم کے لین دین میں LLM ایجنٹوں کو استعمال کرنے کی ضرورت اہم اوور ہیڈ کی نمائندگی کر سکتی ہے۔ اگرچہ کوئی تصور کرے گا کہ تاخیر کے مسائل (عام طور پر اشتہار پیش کرنے والے منظرناموں میں اہم ہوتے ہیں) اس قسم کے LLM استعمال سے پیدا ہوسکتے ہیں (حالانکہ اس کا خاص طور پر کاغذ میں ذکر نہیں کیا گیا ہے)۔
کسی بھی صورت میں، مصنفین کی ایڈ-چیٹ حکمت عملی کا نفاذ (مضمون کے آغاز میں دکھایا گیا پہلے اسکیما میں اوپری قطار) نے سب سے زیادہ کلک تھرو ریٹ پیش کرنے کا ثبوت دیا، حالانکہ اس کی سب سے زیادہ متعلقہ LLM لاگت تھی۔
نتیجہ
اگرچہ یہ کوئی تعجب کی بات نہیں ہے کہ ادب ان طریقوں پر قیاس کرے گا جن کے ذریعے ایل ایل ایم اشتہارات لے سکتے ہیں، حقیقت میں اس موضوع پر عوامی سطح پر دستیاب تحقیق بہت کم ہے۔ یہ موجودہ کاغذ بناتا ہے، اور جس کی ہم معقول طور پر تشریح کر سکتے ہیں۔ اس کی پیشکش، دلچسپ کرایہ۔
کوئی بھی جس نے ایڈورٹائزنگ سیلز ڈپارٹمنٹ کے ساتھ کام کیا ہے، یا انوینٹری فروخت کر رہا ہے، وہ جان لے گا کہ مشتہرین ہمیشہ زیادہ چاہتے ہیں - مثالی طور پر، اشتہارات کو حقائق پر مبنی مواد کے طور پر پیش کیا جائے، جو میزبان مواد کے سلسلے سے بالکل الگ ہو۔ اور وہ اس کے لیے ایک اہم پریمیم ادا کریں گے (میزبان کے ساتھ، جو اس طرح اپنی ساکھ اور قارئین اور دیگر قسم کے اسٹیک ہولڈر کے ساتھ کھڑے ہونے کو خطرے میں ڈالتا ہے)۔
لہٰذا یہ دیکھنا دلچسپ ہوگا کہ کس حد تک، اگر کوئی ہے، جس تک اشتہار سے بھرے کوڈیسلز کا تصور دونوں پرچوں میں کیا گیا ہے کہ وہ ایل ایل ایم کے ردعمل کو مزید تیز کرنے کے لیے حوصلہ افزائی کریں، اور 'پے لوڈ' کے قریب۔
پہلی بار جمعرات 18 ستمبر 2025 کو شائع ہوا۔