زاوية Anderson

الذكاء الاصطناعي يقنع الناس بالتبرع بثلاثة أضعاف ما يقنعه المتسابقون البشريون

نُشر في 18 يونيو 2026

بواسطة

Martin Anderson

AI-generated image (GPT-2) - An industrial humanoid robot holds a Save the Children donation tin on a British high street as several passers-by place five pound notes into it, while nearby human volunteers in red Save the Children vests stand with their own collection tins and watch with puzzled expressions.

تشير دراسة جديدة قادها جامعة أكسفورد إلى أن النماذج اللغوية الرائدة يمكن أن تجمع أموالًا أكثر بكثير من المتسابقين المحترفين، ويمكنها بثبات أن تهزم البشر في جميع أشكال الإقناع الأخرى.

وجدت دراسة جديدة في المملكة المتحدة والولايات المتحدة أن نماذج اللغة المتقدمة أكثر فعالية في إقناع الناس من المحترفين المدربين الذين يعملون على تغيير عقول الناس.

في اختبار التبرع في العالم الحقيقي، وجد الباحثون أن الذكاء الاصطناعي كان قادرًا على إقناع الناس بالتبرع بحوالي 17.2٪ من المال المتاح لهم، مقارنة بـ 6.4٪ للمتسابقين البشريين المحترفين – وهو فرق بنسبة 10.8 نقاط مئوية، مما يعادل تقريبًا 2.7 مرة معدل التبرع تحت الذكاء الاصطناعي، مع مساهمة مشاركة أعلى وتبرعات متوسطة أكبر في الفرق.

ينصPaper على ما يلي:

‘من الملاحظ أن الذكاء الاصطناعي، على الرغم من توجيهه بشكل صريح لمتابعة استراتيجية الفعالية فقط، قد تفوق المتسابقين على ست آليات أخرى لم يُطلب منه استخدامها.’

‘أعرب المتسابقون البشريون عن تقديرهم للذكاء الاصطناعي لتقديم حجج أقوى، وعلّمهم المزيد، وكان أكثر تعاطفًا وممتعًا في المحادثة من المتسابقين.’

‘معًا، تشير هذه النتائج إلى أن الذكاء الاصطناعي يتفوق على البشر الخبراء عبر مجموعة واسعة من آليات التبرع، ويشير إلى أن ميزة إقناع الذكاء الاصطناعي تمدد إلى السلوك الحقيقي في العالم.’

يفترض المؤلفون أن أداء النماذج التي تم اختبارها – والتي تشمل إصدارات Pro من Claude Opus وChatGPT وGrok وGoogle Gemini – قد يكون ناتجًا عن الكثافة والسرعة التي يتم تقديم المعلومات بها للمراسل؛ عندما تم إجبار الذكاء الاصطناعي على التحرك بسرعة البشر، فقد فقد ميزته بالكامل:

‘وجدنا أدلة متوافقة تشير إلى أن ميزة الذكاء الاصطناعي ناتجة عن نشر كميات أكبر من المعلومات بسرعة: بعد التدريب، كان المتسابقون البشريون الخبراء قادرين على التعادل مع الذكاء الاصطناعي المحدود بسرعات ورسائل بشرية.’

كما ذكرت الدراسة أن لا أحد من بين 318 متسابقة بشريًا فردية تم اختبارهم عبر التجارب المتعددة تمكن من تجاوز أداء الذكاء الاصطناعي المتوسط – حتى بعد أن تلقى بعض المشاركين تدريبًا متخصصًا بناءً على تقنيات الذكاء الاصطناعي نفسها.

يستنتج المؤلفون:

‘تشير نتائجنا إلى أننا ندخل عالمًا حيث يوفر الذكاء الاصطناعي للممثلين البشريين وفرة من الدعاية الماهرة. من الصعب التنبؤ بالنتائج هذه، لأنها تتطلب منا افتراضات حول من سيكون لديه الوصول إلى تقنيات الذكاء الاصطناعي الأكثر إقناعًا، ومن سيكون هدفًا للإقناع، وما هي الحواجز القضائية أو الحماية أو الاحتكاكات الأخرى التي قد تقلل من تأثير إقناع الذكاء الاصطناعي على السكان البشريين.’

‘يمكن أن يكون أحد الآثار التي قد يحدثها الذكاء الاصطناعي الذي يمكن أن يفوق حتى الخبراء البشريين هو تركيز النفوذ بين الممثلين القويين الموجودة بالفعل.’

الورقة الجديدة بعنوان نظم الذكاء الاصطناعي تتفوق على البشر الخبراء، وهي من八ة باحثين من جامعة أكسفورد، ومعهد أمن الذكاء الاصطناعي في المملكة المتحدة، وجامعة ستانفورد، وكلية لندن للاقتصاد والعلوم السياسية.

المنهج والدراسات

تأتي النتائج الأساسية من أربعة تجارب: إقناع الناخبين والمتسابقين؛ اختبار التدريب والحدود السرعية كمساومات بشرية وذكاء اصطناعي؛ التنافس ضد المتسابقين المحترفين في القضايا السياسية؛ و التنافس ضدهم من أجل التبرعات الخيرية الحقيقية.

استخدمت الدراسة 18,978 محادثة من 6,923 شخصًا، مع نماذج الذكاء الاصطناعي الرائدة التي واجهت مجموعة متنوعة من الخبراء البشريين، من العمال المأجورين مقابل 12 جنيه إسترليني في الساعة، إلى المتسابقين البشريين الخبراء الذين يتقاضون 140 جنيه إسترليني في الساعة بالإضافة إلى مكافأة قابلة للفوز، وسمح لهم بالبحث في الجلسات حتى أسبوع قبلها.

النماذج المستخدمة في الاختبارات كانت Claude Opus 4.1 و 4.6، ChatGPT-4o، GPT-5.4، Grok 4.20 و Gemini 2.5 Pro.

مباراة المتسابقين النخبة

فحصت التجربة الأولى ما إذا كان الذكاء الاصطناعي يمكن أن يتفوق على المتسابقين البشريين المهرة بشكل متزايد في محادثات فردية حول القضايا السياسية والاجتماعية:

الأسئلة السياسية والاجتماعية المستخدمة في الدراسات الثلاث الأولى، مع مناقشة المشاركين قضية واحدة تم تعيينها بشكل عشوائي قبل وبعد المحادثة. تم اختيار الموضوعات لتغطية مجموعة واسعة من المناقشات العامة المتنازع عليها في المملكة المتحدة، من الهجرة، إلى حرية التعبير وتنظيم وسائل الإعلام الاجتماعية، إلى سياسة الرفاهية، والموت الرحيم، ومستقبل النظام الملكي. المصدر

تم طلب آراء المشاركين حول واحدة من عشرة أسئلة سياسية في المملكة المتحدة (الموضحة أعلاه)، ثم تم تعيينهم شريكًا في المحادثة إما بشريك بشري أو ذكاء اصطناعي. بعد المناقشة، التي استمرت عادةً حوالي 14 دقيقة، تم طلب آرائهم مرة أخرى.

تم اختبار ثلاث مجموعات بشرية، مع عمال عاديين من منصة العمل الجماعي Prolific تم توظيفهم لتقديم خط أساس، وتم دفع لهم 12 جنيه إسترليني في الساعة. تكونت المجموعة الثانية من الأفضل أداءً في بطولة إقناع مدتها أربعة جولات شارك فيها أكثر من 1,100 مشارك و 9,500 محادثة. تكونت المجموعة الثالثة من 56 متسابقة نخبة تنافسية، جميعهم وصلوا إلى على الأقل نصف النهائي في بطولة دولية كبرى، وتمتلك أربعة أبطال عالميين، و 11 بطلًا قاريًا، بمتوسط 8.9 سنوات من خبرة المناظرة.

بذلت جهودًا كبيرة لتقديم ظروف مواتية للمتسابقين البشريين، مع فائزين في البطولة ومتسابقين نخبة يتنافسون على جوائز نقدية كبيرة تصل إلى 11,000 جنيه إسترليني، في حين سمح للمتسابقين بالاختيار القضايا التي يعتقدون أنهم يمكن أن يجادلوا بها بأكثر فعالية، وتم دفع لهم مقابل البحث في الموضوعات مسبقًا. في المتوسط، قام كل متسابقة بتحضير حوالي ثماني ساعات للمحادثات.

على الرغم من ذلك، حقق الذكاء الاصطناعي أقوى نتائج في كل مقارنة:

تقديرات تأثير الإقناع عبر الشروط البشرية والذكاء الاصطناعي في الدراسة، مقاسة bằng تغيير متوسط الموقف بعد محادثة حول قضية سياسية متنازع عليها.

تشير العلامات الحمراء في الرسم البياني أعلاه إلى نماذج الذكاء الاصطناعي المتقدمة. في جميع المقارنات، أنتجت هذه نماذج أكبر من التحولات في الموقف من أي مجموعة بشرية.

جاء الأداء البشري الأقوى من المتسابقين النخبة المدربين – لكنهم لا يزالون يتراجعون عن أنظمة الذكاء الاصطناعي غير المقيدة. عندما تم تقييد الذكاء الاصطناعي بسرعات كتابة بشرية وطول رسائل بشرية، اختفت ميزته بالكامل، مما يشير، كما ذكرنا سابقًا، إلى أن تسليم المعلومات بسرعة قد يفسر الكثير من الفجوة بين قوة الإقناع البشرية والذكاء الاصطناعي.

تمكنت النماذج اللغوية من تجاوز المشاركين العاديين بنسبة 8.2 نقاط مئوية، وتفوقت على المتسابقين المختارين من البطولة بنسبة 5.6 نقطة. كان أصغر فجوة ضد النخبة من المتسابقين، الذين أنتجوا أنفسهم تحولات كبيرة في الموقف؛ ومع ذلك، كان الذكاء الاصطناعي لا يزال قادرًا على الحصول على ميزة إضافية بنسبة 4.6 نقطة مئوية.

هل يمكن للبشر أن يتعلموا ليهزما الذكاء الاصطناعي؟

سألت التجربة الثانية عما إذا كان يمكن إlimination ميزة الذكاء الاصطناعي إما عن طريق تحسين الأداء البشري أو تقييد الذكاء الاصطناعي نفسه. لاختبار الأولى، عاد 43 من المتسابقين النخبة من الدراسة الأولى للتدريب الإضافي بناءً على الأساليب المستخدمة من قبل الذكاء الاصطناعي الذي هزمهم مسبقًا.

تم استعراض المشاركين لنسخ من المحادثات، وفحص كيف تم بناء مطالبات الذكاء الاصطناعي، وقضوا جلستين تدريبيتين مدة كل منهما أربع ساعات لممارسة نهج إقناع بديلة قبل التنافس مرة أخرى في ظل نفس الشروط.

أنتج التدريب تغييرات ملحوظة في السلوك، مع استخدام المتسابقين البشريين لمزيد من الكلمات، وإدخال مزيد من المطالبات القابلة للتحقق، وتحقيق أكبر تحولات في الموقف بين أي مجموعة بشرية في الدراسة. أدى التدريب إلى تحسين الأداء وأنتج أقوى نتائج بشرية تم ملاحظتها في الدراسة، لكن الفجوة ظلت ذات دلالة إحصائية، مع متسابقين مدربين لا يزالون يتراجعون عن أنظمة الذكاء الاصطناعي غير المقيدة (الموضحة في جدول النتائج أدناه).

اختبر الباحثون ما إذا كان أداء الذكاء الاصطناعي يعتمد على سرعة الاستجابة وطول الرسالة، من خلال تقييد الذكاء الاصطناعي بسرعات كتابة بشرية وطول رسائل بشرية. في ظل هذه الشروط، أنتج المتسابقون المدربون والذكاء الاصطناعي المقيد نتائج مشابهة:

آثار التدريب وتقييد سرعة الذكاء الاصطناعي على الأداء الإقناعي. لوح التوجيه العلوي يقارن متسابقي النخبة، والمتسابقين المدربين، ونظام الذكاء الاصطناعي المقيد بسرعات كتابة بشرية ورسائل بشرية. لوح التوجيه السفلي يظهر توزيعات الأداء المقدرة للمتسابقين الفردية عبر الدراستين الأوليتين. في حين أن التدريب حسّن النتائج، لم تكن هناك مجموعة بشرية متساوية مع نظام الذكاء الاصطناعي غير المقيد، في حين أن تقييد الذكاء الاصطناعي بسرعات بشرية أزال ميزته.

دعم هذا الاكتشاف تحليل أوسع يغطي جميع المتسابقين البشريين 318 الذين تم اختبارهم عبر الدراستين الأوليتين: لم يتجاوز أي فرد أداء نظام الذكاء الاصطناعي المتوسط، بغض النظر عن مستوى الخبرة أو مجال القضية أو الفئة الديموغرافية الفرعية.

هل يمكن للمتسابقة المحترفين أن يهزما الذكاء الاصطناعي؟

أخذت الدراسة الثالثة في الاعتبار ما إذا كان الذكاء الاصطناعي يمكن أن يحافظ على ميزته ضد الأشخاص الذين بنوا حياتهم المهنية حول إقناع الآخرين في إعدادات العالم الحقيقي، بدلاً من منافسات المناظرة الأكاديمية.

تم توظيف 19 متسابقة محترفة من شركة التبرع البريطانية AppcoUK. لم يكن هؤلاء المشاركون، على عكس المتسابقين في التجارب السابقة، لديهم خبرة عملية واسعة في جمع التبرعات، مع متوسط 10,000 محادثة إقناعية خلال مسيرتهم المهنية. تم دفع لهم 140 جنيه إسترليني في الساعة، وتلقوا مواضيع السياسة مسبقًا لمدة أسبوع للتحضير، وتنافسوا على نفس الجوائز القائمة على الأداء المستخدمة في مكان آخر في الدراسة.

على الرغم من ذلك، بقي الذكاء الاصطناعي أكثر إقناعًا (انظر النتائج أعلاه). أوجد المتسابقون المحترفون تحولًا في الآراء بنسبة 6.9 نقاط مئوية مقارنة بمجموعة التحكم – لكن الذكاء الاصطناعي أنتج تحولًا بنسبة 12.8 نقطة مئوية، مما منحه ميزة 5.9 نقاط مئوية على المحترفين البشريين.

هل يمكن للذكاء الاصطناعي أن يقنع الناس بفتح محفظتهم؟

فحصت الدراسة الرابعة والأخيرة جمع التبرعات في العالم الحقيقي بدلاً من تغيير الآراء. تعاون الباحثون مرة أخرى مع AppcoUK، هذه المرة مع التركيز على أطفال الإنقاذ، وهي جمعية خيرية التي جمعوا منها 824,297 جنيه إسترليني من 22,583 متبرع بين 2016 و 2023.

ناقش المشاركون إما Claude Opus 4.6 أو واحد من 18 متسابقة محترفة. ثم تلقوا مكافأة دراسية بقيمة 1 جنيه إسترليني، ويمكنهم التبرع بجزء من المكافأة لصالح أطفال الإنقاذ. من بين السبل السبعة المعتمدة (الموضحة أدناه)، تم توجيه Claude Opus 4.6 لاستخدام معلومات الفعالية التأثيرية، لشرح كيف يمكن للتبرعات الفردية أن تترجم إلى نتائج قابلة للقياس للجمعية.

أنتج الذكاء الاصطناعي آثار تبرع أكبر من المتسابقين المحترفين، مع زيادة التبرعات بنسبة 17.2 نقطة مئوية相对于 حالة التحكم، مقارنة بنسبة 6.4 نقطة مئوية للمتسابقين:

نتائج التبرع وتقييمات المشاركين المرتبطة بالتبرع في الدراسة الرابعة. اللوح الأيسر يقارن التبرع بعد المحادثات مع المتسابقين المحترفين وClaude Opus 4.6، مقاسة بنسبة نقاط مئوية من مكافأة دراسية بقيمة 1 جنيه إسترليني. اللوح الأيمن يقارن تقييمات المشاركين عبر سبع آليات مرتبطة بالتبرع، مع تقييم الذكاء الاصطناعي أعلى في جميع سبع المقاييس.

ظهر الفرق في كلا النسبة المئوية للمشاركين الذين تبرعوا، ومتوسط المبلغ الذي تبرع به الذين تبرعوا.

قيم المشاركون الذكاء الاصطناعي أعلى من المتسابقين المحترفين عبر مجموعة من المقاييس المرتبطة بالتبرع، مع أكبر فروق في النيات التنفيذية، و توسيع الالتزام، و فعالية التأثير المتصورة.

وفقًا للورقة، كانت نفس النهج المرتبط بميزة الذكاء الاصطناعي في الدراسات السابقة أيضًا مرتبطًا بالتبرع الخيري الأعلى في هذه التجربة لجمع التبرعات.

الخلاصة

على الرغم من أن المؤلفين، كما ذكرنا في البداية، يخلصون إلى أن نتائج الدراسة تثير القلق، إلا أنهم يضيفون أن اللاعبين الأصغر قد يتم تعزيزهم أيضًا بنفس الوصول إلى أحدث وأفضل تقنيات الذكاء الاصطناعي.

يشير إلى أن هناك احتمالًا أن يتم حجب أفضل النماذج عن اللاعبين الأصغر مع مرور الوقت، ويمكن أن يؤدي ذلك إلى تقليل تأثير إقناع الذكاء الاصطناعي على السكان.

نشر لأول مرة يوم الخميس، 18 يونيو 2026