اتصل بنا للحصول على مزيد من المعلومات

ما الذي يقرأه الذكاء الاصطناعي؟ خبايا آليات توليد الاستشهادات

التقارير

ما الذي يقرأه الذكاء الاصطناعي؟ خبايا آليات توليد الاستشهادات

mm

مع إعادة تشكيل الذكاء الاصطناعي المُولِّد للمشهد الرقمي، يبرز سؤال جديد في صميم إنشاء المحتوى واكتشافه: ما الذي يقرأه الذكاء الاصطناعي تحديدًا؟ دراسة رائدة بعنوان ما هي القراءة بالذكاء الاصطناعي تبدأ من نبض توليدي من خلال تحليل Muck Rack مليون استشهاد من أنظمة الذكاء الاصطناعي الرئيسية - بما في ذلك ChatGPT من OpenAI (4o و4o-mini)، وGemini من Google (Flash وPro)، وClaude من Anthropic (Sonnet وHaiku) - لكشف الديناميكيات المخفية وراء الروابط التي تستخدمها هذه النماذج عند إنشاء الاستجابات.

إن النتائج ليست كاشفة فحسب، بل إنها تحويلية لأي شخص يعمل في مجال الصحافة، أو الاتصالات المؤسسية، أو تحسين محركات البحث، أو استراتيجية العلامة التجارية.

الاستشهادات ليست مجرد إضافات، بل إنها تُعيد تشكيل سلوك الذكاء الاصطناعي

كما هو واضح لأي شخص منغمس في عالم الذكاء الاصطناعي، فإن مجرد تمكين أو تعطيل وظيفة الاستشهاد يغير الإجابات نفسهاعند إيقاف تشغيل الاستشهادات، تعتمد أنظمة الذكاء الاصطناعي بشكل أكبر على بيانات التدريب الثابتة. أما عند تفعيلها، فتُنتج النماذج مخرجات مختلفة تمامًا، وتتأثر مباشرةً بالمصادر اللحظية التي تستقي منها.

مثال رئيسيعند سؤاله عن أسوأ فريق في دوري البيسبول الرئيسي، ذكر الذكاء الاصطناعي، الذي لا يدعم الاستشهادات، فريق ميتس عام ١٩٦٢. ولكن مع تفعيل الاستشهادات، قام بتحديث الإجابة لتشمل 2024 شيكاغو وايت سوكس مع موسم قياسي 41-121 - مستشهدًا صراحةً سي بي اس الرياضية.

هيمنة وسائل الإعلام المكتسبة

على مدى 95% من جميع المصادر المذكورة تأتي من غير مدفوع الأجر وسائل الإعلام. وهذا يشمل:

  • 27% المحتوى الصحفي (على سبيل المثال رويترز، أسوشيتد برس، فاينانشال تايمز)
  • 18% مواقع حكومية/منظمات غير حكومية
  • 13% المصادر الأكاديمية أو البحثية
  • 10% منصات التجميع/الموسوعات مثل ويكيبيديا أو فيجوال كابيتاليست

على النقيض من ذلك، تمثل المحتوى المدفوع أو الإعلاني أقل من 5% من الاستشهادات، مما يوضح أن نماذج الذكاء الاصطناعي متحيزة بشكل منهجي ضد المحتوى الموجه بالتسويق.

تحيز الحداثة: لماذا يتفوق المحتوى الجديد؟

الحداثة مهمة، خاصةً في نماذج OpenAI. في المحتوى الصحفي، 56% من الاستشهادات التي قدمها ChatGPT تم نشرها خلال الأشهر الـ 12 الماضية، مقارنة ب 36% لكلوديشير هذا الاتجاه، المعروف باسم تحيز الحداثة، إلى تفضيل المصادر الأحدث والأكثر نشرًا على المصادر الأقدم، حتى عندما تكون المصادر الأقدم لا تزال دقيقة أو ذات صلة.

في سياق الذكاء الاصطناعي التوليدي، يعني انحياز الحداثة أن نماذج اللغة - وخاصةً تلك المرتبطة ببيانات آنية مثل ChatGPT - تميل أكثر إلى الرجوع إلى المواد المنشورة حديثًا والثقة بها، لا سيما عند الرد على استفسارات تتعلق بالأحداث الجارية، أو التقنيات الناشئة، أو تغييرات السياسات. بالنسبة للمطالبات الحساسة للوقت، مثل "أحدث التطورات في علاج المرضى الخارجيين" أو "أحدث ابتكارات التسجيل الصوتي"، يُعطي النموذج أهمية كبيرة للمحتوى المنشور خلال الأشهر القليلة الماضية، بافتراض أنه يحمل رؤىً أكثر صلة أو تحديثًا.

هذه فكرة بالغة الأهمية لمنشئي المحتوى وواضعي استراتيجيات العلامات التجارية: إذا كانت موادك قديمة - حتى بعام - فمن غير المرجح أن تظهر في الإجابات المُولّدة بالذكاء الاصطناعي. إن الحفاظ على حداثة محتواك ليس أمرًا جيدًا فحسب، بل تحسين محركات البحث- إنه أمر ضروري لتحقيق الرؤية في عصر الذكاء الاصطناعي.

المحفزات المختلفة تؤدي إلى مصادر مختلفة

لا تستشهد نماذج الذكاء الاصطناعي بالمصادر عشوائيًا، بل تختار بناءً على نوع السؤال المطروح. وتؤدي أنماط الأسئلة المختلفة إلى أنواع مختلفة من المصادر المُشار إليها:

  • البحث عن الحقائق والاستعلامات الموسوعية يميل إلى السحب من مواقع مرجعية ثابتة مثل ويكيبيديا و الموسوعة البريطانية "بريتانيكا"، بالاعتماد على معلومات راسخة ولكنها في كثير من الأحيان قديمة.
  • أسئلة حول الأحداث الأخيرة عادة ما يؤدي ذلك إلى استشهادات من غرف الأخبار الكبرى مثل AP, رويترز أو أكسيوسحيث السرعة والحداثة هما المفتاح.
  • نصائح أو مطالبات طلب الرأي تحويل النموذج نحو مصادر أكثر ديناميكية وتفاعلية مثل المدونات أو المنتديات أو المنصات مثل رديت or 
متوسط.
  • المهام الأكاديمية أو البحثية قيادة الذكاء الاصطناعي للاستشهاد بالمجلات وخوادم ما قبل الطباعة مثل arXivأو مستودعات مدعومة من الحكومة مثل مجلات or NCBI.
  • طلبات إبداعية أو تعليمات خطوة بخطوة غالبًا ما تظهر محتويات من إنشاء المستخدم، أو إرشادات غير رسمية، أو مواضيع مناقشة مجتمعية من منصات مثل قرة أو منتديات التكنولوجيا المتخصصة.

يعني هذا التنوع أن طريقة صياغة السؤال يمكن أن يكون لها تأثير مباشر على المجالات التي يتم رفعها - وتلك التي يتم تركها خلف الركب.

على سبيل المثال، من غير المرجح أن يستشهد كلود بمصادر رئيسية مثل رويترز مقارنة بـ ChatGPT أو Gemini، حيث يستشهد برويترز 50 مرة أقل من ChatGPT.

السلطة والمجال مهمان - ولكن ليس بشكل موحد

في حين تهيمن المنافذ ذات السلطة العالية، إلا أنها ليست اللاعب الوحيد. 15% من المصادر الأكثر استشهادا تظهر ضمن المراكز العشرة الأولى في العديد من الصناعات. وهذا يعني أن يتم مكافأة المحتوى المخصص لمجال معين. على سبيل المثال:

  • In تمويل، مصادر مثل Bankrate و NerdWallet مفضل.
  • In قطاع الرعاية الصحية، مصادر حكومية مثل CDC.gov و المعاهد الوطنية للصحة.gov تسيطر.
  • In التكنولوجيا، منصات التعلم مثل Udemy, كورسيراو 
متوسط الصعود إلى القمة.

On الصفحة 15، تُظهر الخريطة الحرارية المرئية أن كلود يُظهر التنوع الأكبر في المجال المحدد، ويختار بشكل متكرر مصادر فريدة خاصة بالصناعة، بينما يميل ChatGPT وGemini إلى الاعتماد بشكل أكبر على الوسائط العامة.

رؤى خاصة بالصناعة: ما تشير إليه الذكاء الاصطناعي حسب القطاع

التمويل والتأمين

  • الصحافة تشكل 37% من الاستشهادات، أكثر من أي صناعة أخرى.
  • أهم 10 مصادر لكلود هي 90٪ فريد، مما يشير إلى استكشاف مكانة أعمق.

قطاع الرعاية الصحية

  • يتم الاستشهاد بمواقع الحكومة والمنظمات غير الحكومية بنسبة 18% من الوقت، أكثر من ضعف المتوسط عبر الصناعة.
  • تُعد شركة جيميني رائدة في تنوع المصادر لهذا القطاع.

السفر/الخطوط الجوية

  • والمثير للدهشة، الاستشهادات الأكاديمية غائبة تقريبًا (فقط 0.7%).
  • مصادر مثل FAA.gov و IATA.org الهيمنة، مع الاعتماد بشكل أقل على منافذ الأخبار.

البيع بالتجزئة والتجارة الإلكترونية

  • المجمعات مثل ويكيبيديا أقل استشهادا هنا أكثر من الصناعات الأخرى (36% مقابل 28%).
  • يستشهد كلود بالمحتوى الأكثر تخصصًا.

وسائل الإعلام / الترفيه

  • الصحافة تتصدر مرة أخرى بنسبة 37٪، مع منصات متخصصة مثل تكنولوجيا التلفزيون و راديوكينغ يستشهد بها كلود بشكل متكرر.

التكنولوجيا

  • لا يتم استخدام أي مصادر موسوعية أو أكاديمية تقريبًا.
  • منصات مثل 
متوسط, كورسيراو SproutSocial تظهر بشكل بارز، مما يعكس ميلًا نحو المعرفة المبنية على الممارس.

التأثيرات على فرق الاتصالات وتحسين محركات البحث

وتكشف نتائج هذا التقرير أن تحسين المحرك التوليدي (GEO) أصبحت بنفس أهمية تحسين محركات البحث التقليدية. لا يقتصر دور الذكاء الاصطناعي على تلخيص قواعد البيانات الثابتة فحسب، بل الربط النشط بالمصادر في الوقت الفعليوتتأثر هذه الروابط بـ:

  • حداثة:قم بتحديث المحتوى الخاص بك بانتظام.
  • سلطة النطاق:بناء الروابط الخلفية والثقة.
  • الصلة المتخصصة:قم بإنشاء محتوى مصمم خصيصًا لصناعتك، وليس فقط مواضيع عامة.
  • نوع المحتوى:التركيز على وسائل الإعلام المكتسبة والمحتوى المعلوماتي بدلاً من صفحات التسويق البحتة.

هذا يُغيّر حسابات مُسوّقي المحتوى، وخبراء العلاقات العامة، والناشرين. إذا كان هدفك هو الظهور في نتائج البحث المُولّدة بواسطة الذكاء الاصطناعي، فعليك إنشاء محتوى يجده الذكاء الاصطناعي قيّمًا، وليس فقط للمستخدمين أو جوجل.

الخلاصة: عواقب قراءة الذكاء الاصطناعي لك (أو تجاهله لك)

يُسلّط هذا التقرير الضوء على تحوّل جذري في كيفية عرض المعلومات على الإنترنت: فنماذج الذكاء الاصطناعي لا تكتفي باسترجاع المحتوى فحسب، بل تُنظّمه انتقائيًا. وهذا التنظيم يُعيد تعريف مفهوم الرؤية في العصر الرقمي.

بالنسبة للناشرين والباحثين والعلامات التجارية، فإن الاستشهاد بالذكاء الاصطناعي يعني الانضمام إلى الجيل الجديد من محركات البحث. فهو يضع محتواك أمام المستخدمين الذين قد لا يزورون موقعك أبدًا، لكنهم يثقون بالنموذج المرجعي. ويتم تعزيز المصادر التي يتم الاستشهاد بها، أما تلك التي لا يتم الاستشهاد بها - بغض النظر عن جودتها - فتُستبعد من النقاش تمامًا.

يُنتج هذا التحول رابحين وخاسرين جدد. تُفضّل المنافذ الإعلامية رفيعة المستوى والإعلام المُجدي والحديث. في الوقت نفسه، غالبًا ما يُهمل المحتوى المدفوع، أو المدونات قليلة التحديث، أو الأصوات الأقل شهرة - ليس فقط من قِبل الناس، بل من قِبل الأنظمة التي تُشكّل ما يراه الناس.

As الذكاء الاصطناعي التوليدي في حين تستمر الذكاء الاصطناعي في لعب دور محوري في كيفية تقديم المعرفة، فإن السؤال الرئيسي يصبح أقل حول كيفية الترتيب في البحث وأكثر حول: كيف تصبح جزءًا مما تعتبره الذكاء الاصطناعي يستحق الاستشهاد؟

أنطوان هو قائد صاحب رؤية وشريك مؤسس لشركة Unite.AI، مدفوعًا بشغف لا يتزعزع لتشكيل وتعزيز مستقبل الذكاء الاصطناعي والروبوتات. وهو رجل أعمال متسلسل، ويعتقد أن الذكاء الاصطناعي سيكون له نفس التأثير على المجتمع مثل الكهرباء، وغالبًا ما يتم ضبطه وهو يهذي عن إمكانات التقنيات المبتكرة والذكاء الاصطناعي العام.

ك المستقبليوهو مكرس لاستكشاف كيف ستشكل هذه الابتكارات عالمنا. بالإضافة إلى ذلك، فهو مؤسس Securities.io، وهي منصة تركز على الاستثمار في التقنيات المتطورة التي تعمل على إعادة تعريف المستقبل وإعادة تشكيل قطاعات بأكملها.