رپورٹیں
AI پڑھنا کیا ہے؟ تخلیقی حوالہ جات کے پوشیدہ میکانکس کے اندر

جیسا کہ تخلیقی AI ڈیجیٹل لینڈ اسکیپ کو نئی شکل دیتا ہے، مواد کی تخلیق اور دریافت کے مرکز میں ایک نیا سوال ابھر رہا ہے: AI اصل میں کیا پڑھ رہا ہے؟ ایک اہم مطالعہ جس کا عنوان ہے۔ AI ریڈنگ کیا ہے؟ سے پیدا کرنے والی نبض مک ریک کے ذریعے تجزیہ کیا گیا۔ 1 ملین حوالہ جات بڑے AI سسٹمز سے — بشمول OpenAI کا ChatGPT (4o اور 4o-mini)، Google کا Gemini (Flash and Pro)، اور Anthropic's Claude (Sonnet and Haiku) — ان لنکس کے پیچھے چھپی حرکیات سے پردہ اٹھانے کے لیے جو یہ ماڈل ردعمل پیدا کرتے وقت استعمال کرتے ہیں۔
نتائج نہ صرف افشا کرنے والے ہیں بلکہ صحافت، کارپوریٹ کمیونیکیشنز، SEO، یا برانڈ حکمت عملی میں ہر کسی کے لیے تبدیلی کا باعث ہیں۔
اقتباسات صرف ایڈ آنز نہیں ہیں — وہ AI رویے کو نئی شکل دیتے ہیں۔
جیسا کہ AI کی دنیا میں غرق ہر شخص کے لیے واضح ہے، صرف حوالہ کی فعالیت کو فعال یا غیر فعال کرنا جوابات خود بدلتے ہیں۔. جب حوالہ جات بند ہوتے ہیں، تو AIs جامد تربیتی ڈیٹا پر زیادہ انحصار کرتے ہیں۔ لیکن جب اقتباسات کو آن کیا جاتا ہے، تو ماڈلز مادی طور پر مختلف آؤٹ پٹ پیدا کرتے ہیں، جو کہ وہ اصل وقت کے ذرائع سے براہ راست شکل اختیار کرتے ہیں۔
کلیدی مثال: بدترین میجر لیگ بیس بال ٹیم کے بارے میں پوچھے جانے پر، ایک حوالہ سے معذور AI نے 1962 میٹس کا ذکر کیا۔ لیکن حوالہ جات کے ساتھ، اس نے جواب کو شامل کرنے کے لیے اپ ڈیٹ کیا۔ 2024 شکاگو وائٹ سوکس 41-121 سیزن کے ریکارڈ توڑنے کے ساتھ — واضح طور پر حوالہ دیتے ہوئے۔ سی بی ایس کھیل
کمائی میڈیا کا غلبہ
سے زیادہ تمام حوالہ کردہ ذرائع کا 95٪ سے آو غیر ادا شدہ میڈیا اس میں شامل ہیں:
- 27٪ صحافتی مواد (مثلاً رائٹرز، اے پی، فنانشل ٹائمز)
- 18٪ سرکاری/این جی او سائٹس
- 13٪ علمی یا تحقیقی ذرائع
- 10٪ ایگریگیٹر/انسائیکلوپیڈک پلیٹ فارمز جیسے ویکیپیڈیا یا بصری سرمایہ دار
اس کے برعکس کی طرف سے، بامعاوضہ یا اشتہاری مواد 5% سے کم ہے حوالہ جات، یہ واضح کرتے ہوئے کہ AI ماڈلز منظم طور پر متعصب ہیں۔ کے خلاف مارکیٹنگ پر مبنی مواد.
Recency تعصب: نیا مواد کیوں جیتتا ہے۔
تازگی اہمیت رکھتی ہے—خاص طور پر OpenAI کے ماڈلز کے لیے۔ صحافتی مواد میں، ChatGPT کی طرف سے 56% حوالہ جات گزشتہ 12 مہینوں میں شائع کیے گئے تھے۔، اس کے مقابلے کلاڈ کے لیے 36%. یہ رجحان، جسے Recency bias کہا جاتا ہے، پرانے کے مقابلے نئے، حال ہی میں شائع شدہ ذرائع کی ترجیح کا حوالہ دیتا ہے، یہاں تک کہ جب پرانے ذرائع اب بھی درست یا متعلقہ ہوں۔
جنریٹیو AI کے تناظر میں، recency تعصب کا مطلب یہ ہے کہ زبان کے ماڈلز—خاص طور پر وہ ChatGPT جو ریئل ٹائم ڈیٹا سے جڑے ہوئے ہیں — نئے شائع شدہ مواد کا حوالہ دینے اور ان پر بھروسہ کرنے کا زیادہ امکان ہے، خاص طور پر جب موجودہ واقعات، ابھرتی ہوئی ٹیکنالوجیز، یا پالیسی کی تبدیلیوں سے متعلق سوالات کا جواب دینا۔ وقت کے لحاظ سے حساس اشارے جیسے "آؤٹ پیشنٹ علاج میں تازہ ترین پیشرفت" یا "حالیہ ساؤنڈ ریکارڈنگ کی اختراعات" کے لیے، ماڈل پچھلے چند مہینوں میں شائع ہونے والے مواد کو بہت زیادہ وزن دیتا ہے، یہ فرض کرتے ہوئے کہ اس میں زیادہ متعلقہ یا اپ ڈیٹ کردہ بصیرتیں ہیں۔
یہ مواد کے تخلیق کاروں اور برانڈ کے حکمت عملی سازوں کے لیے ایک اہم بصیرت ہے: اگر آپ کا مواد پرانا ہے — یہاں تک کہ ایک سال تک — اس کے AI سے تیار کردہ جوابات کے سامنے آنے کا امکان بہت کم ہے۔ اپنے مواد کو تازہ رکھنا ہی اچھا نہیں ہے۔ SEOAI کی عمر میں مرئیت کے لیے یہ ضروری ہے۔
مختلف اشارے مختلف ذرائع کو متحرک کرتے ہیں۔
AI ماڈلز تصادفی طور پر ذرائع کا حوالہ نہیں دیتے ہیں - وہ پوچھے جانے والے سوال کی قسم کی بنیاد پر انتخاب کرتے ہیں۔ مختلف پرامپٹ انداز مختلف قسم کے ذرائع کا حوالہ دیتے ہیں:
- حقائق کی تلاش اور انسائیکلوپیڈک سوالات جامد حوالہ سائٹس سے اپنی طرف متوجہ کرتے ہیں جیسے وکیپیڈیا اور برٹینیکااچھی طرح سے قائم لیکن اکثر پرانی معلومات پر انحصار کرنا۔
- حالیہ واقعہ کے سوالات عام طور پر بڑے نیوز رومز جیسے اقتباسات کو متحرک کرتے ہیں۔ AP, رائٹرز، یا Axios، جہاں رفتار اور تازہ کاری کلید ہیں۔
- مشورہ یا رائے طلب کرنے کا اشارہ ماڈل کو مزید متحرک اور بات چیت کے ذرائع جیسے بلاگز، فورمز، یا پلیٹ فارمز کی طرف منتقل کریں جیسے اٹ or درمیانہ.
- تعلیمی یا تحقیقی کام AI کو جرائد سے حوالہ دینے کے لیے لیڈ کریں، جیسے پری پرنٹ سرورز arxiv، یا حکومت کی حمایت یافتہ ذخیرے جیسے PubMed or NCBI.
- تخلیقی درخواستیں یا مرحلہ وار ہدایات پلیٹ فارمز سے اکثر صارف کا تیار کردہ مواد، غیر رسمی طریقہ کار، یا کمیونٹی ڈسکشن تھریڈز Quora یا طاق ٹیک فورمز۔
اس تغیر کا مطلب ہے کہ جس طرح سے کسی سوال کو بیان کیا گیا ہے اس کا براہ راست اثر اس بات پر پڑ سکتا ہے کہ کن ڈومینز کو بلند کیا گیا ہے — اور کون پیچھے رہ گئے ہیں۔
کلاڈ، مثال کے طور پر، رائٹرز کا حوالہ دیتے ہوئے، چیٹ جی پی ٹی یا جیمنی کے مقابلے رائٹرز جیسے بڑے آؤٹ لیٹس کا حوالہ دینے کا امکان بہت کم ہے۔ ChatGPT سے 50x کم کثرت سے۔
اتھارٹی اور ڈومین معاملہ — لیکن یکساں نہیں۔
اگرچہ اعلیٰ اتھارٹی کے آؤٹ لیٹس کا غلبہ ہے، لیکن وہ واحد کھلاڑی نہیں ہیں۔ صرف 15% سرفہرست حوالہ کردہ ذرائع متعدد صنعتوں میں سب سے اوپر 10 میں ظاہر ہوتا ہے۔ اس کا مطلب یہ ہے۔ مخصوص مخصوص مواد کو انعام دیا جاتا ہے۔. مثال کے طور پر:
- In خزانہ، ذرائع جیسے بینکریٹ اور بیوکوف پسندیدہ ہیں.
- In صحت کی دیکھ بھالحکومتی ذرائع جیسے CDC.gov اور NIH.gov غلبہ.
- In ٹیکنالوجی، سیکھنے کے پلیٹ فارم جیسے Udemy, Coursera، اور درمیانہ اوپر اٹھنا.
On صفحے 15، ایک بصری ہیٹ میپ یہ ظاہر کرتا ہے۔ کلاڈ سب سے زیادہ ڈومین مخصوص تنوع کو ظاہر کرتا ہے، اکثر صنعت کے منفرد ذرائع کا انتخاب کرتا ہے، جب کہ ChatGPT اور Gemini عام میڈیا پر زیادہ انحصار کرتے ہیں۔
صنعت سے متعلق مخصوص بصیرتیں: سیکٹر کے لحاظ سے AI کیا حوالہ دیتا ہے۔
فنانس اور انشورنس
- صحافت کا 37 فیصد حصہ حوالہ جات، کسی بھی دوسری صنعت سے زیادہ۔
- کلاڈ کے سب سے اوپر 10 ذرائع ہیں 90% منفرد, گہری طاق کی تلاش کا اشارہ.
صحت کی دیکھ بھال
- حکومت اور این جی او کی سائٹس کا حوالہ 18% وقت دیا جاتا ہے۔، کراس انڈسٹری کی اوسط سے دوگنا سے زیادہ۔
- جیمنی اس شعبے کے ذرائع کے تنوع میں سرفہرست ہے۔
سفر/ایئر لائن
- حیرت انگیز طور پر، تعلیمی حوالہ جات تقریباً غائب ہیں۔ (صرف 0.7٪)۔
- ذرائع جیسے FAA.gov اور IATA.org نیوز آؤٹ لیٹس پر کم انحصار کے ساتھ غلبہ حاصل کریں۔
ریٹیل اور ای کامرس
- ویکیپیڈیا جیسے ایگریگیٹرز کا کم حوالہ دیا جاتا ہے۔ یہاں دوسری صنعتوں کی نسبت (36% بمقابلہ 28%)۔
- کلاڈ نے سب سے بہترین مواد کا حوالہ دیا۔
میڈیا / تفریح
-
صحافت ایک بار پھر 37 فیصد پر آگےجیسے طاق پلیٹ فارمز کے ساتھ ٹی وی ٹیکنالوجی اور ریڈیونگ کلاؤڈ کے ذریعہ اکثر حوالہ دیا جاتا ہے۔
ٹیکنالوجی
- عملی طور پر کوئی انسائیکلوپیڈیک یا علمی ذرائع استعمال نہیں ہوتے ہیں۔
- پلیٹ فارم جیسے درمیانہ, Coursera، اور اسپرٹسوشل نمایاں طور پر ظاہر ہوتا ہے، جس کی طرف جھکاؤ ظاہر ہوتا ہے۔ پریکٹیشنر پر مبنی علم۔
کمیونیکیشنز اور SEO ٹیموں کے لیے مضمرات
اس رپورٹ کے نتائج سے یہ بات سامنے آئی ہے۔ جنریٹو انجن آپٹیمائزیشن (GEO) روایتی SEO کی طرح اہم ہوتا جا رہا ہے۔ AI صرف جامد ڈیٹا بیس کا خلاصہ نہیں کر رہا ہے۔ فعال طور پر حقیقی وقت میں ذرائع سے منسلک. اور وہ روابط اس سے متاثر ہوتے ہیں:
- حال: اپنے مواد کو باقاعدگی سے اپ ڈیٹ کریں۔
- ڈومین اتھارٹی: بیک لنکس اور اعتماد بنائیں۔
- طاق مطابقت: اپنی صنعت کے مطابق مواد بنائیں، نہ کہ صرف عام عنوانات۔
- مواد کی قسم: خالص مارکیٹنگ کے صفحات کی بجائے کمائے ہوئے میڈیا اور معلوماتی مواد پر توجہ دیں۔
یہ مواد مارکیٹرز، PR پیشہ ور افراد، اور پبلشرز کے حساب کتاب کو تبدیل کرتا ہے۔ اگر آپ کا مقصد AI سے تیار کردہ نتائج میں ظاہر کرنا ہے، تو آپ کو ایسا مواد بنانا چاہیے جو AI کو قیمتی لگے — نہ صرف صارفین یا Google۔
نتیجہ: AI کے ذریعہ پڑھے جانے (یا نظر انداز کیے جانے) کے نتائج
یہ رپورٹ ایک بنیادی تبدیلی پر روشنی ڈالتی ہے کہ کس طرح معلومات آن لائن منظر عام پر آتی ہیں: AI ماڈل صرف مواد کو بازیافت نہیں کرتے ہیں - وہ اسے منتخب طور پر درست کرتے ہیں۔ اور وہ کیوریشن ڈیجیٹل دور میں مرئیت کی نئی تعریف کر رہا ہے۔
پبلشرز، محققین اور برانڈز کے لیے، AI کے ذریعے حوالہ دینے کا مطلب تلاش کی اگلی نسل کا حصہ بننا ہے۔ یہ آپ کا مواد ان صارفین کے سامنے رکھتا ہے جو شاید آپ کی سائٹ پر کبھی نہیں جاتے لیکن اس کا حوالہ دینے والے ماڈل پر بھروسہ کرتے ہیں۔ جن ذرائع کا حوالہ دیا جاتا ہے ان میں اضافہ کیا جاتا ہے۔ وہ جو کہ معیار سے قطع نظر نہیں ہیں، انہیں بات چیت سے مکمل طور پر خارج ہونے کا خطرہ ہے۔
یہ تبدیلی نئے فاتح اور ہارنے والے پیدا کرتی ہے۔ اعلیٰ اتھارٹی کے آؤٹ لیٹس اور بروقت، کمایا ہوا میڈیا پسند کیا جاتا ہے۔ دریں اثنا، بامعاوضہ مواد، ہلکے سے اپ ڈیٹ شدہ بلاگز، یا کم قائم شدہ آوازیں اکثر پڑھی نہیں جاتی ہیں — نہ صرف لوگوں کے ذریعے، بلکہ اس نظام کے ذریعے جو لوگ دیکھتے ہیں۔
As پیدا کرنے والا AI علم کیسے پہنچایا جاتا ہے اس میں مرکزی کردار ادا کرتا رہتا ہے، کلیدی سوال اس بارے میں کم ہو جاتا ہے کہ تلاش میں درجہ بندی کیسے کی جائے اور اس کے بارے میں زیادہ: آپ اس کا حصہ کیسے بنتے ہیں جسے AI حوالہ دینے کے قابل سمجھتا ہے؟