زاوية Anderson
نماذج الذكاء الاصطناعي تفضل الكتابة البشرية على الكتابة التي تم إنشاؤها بواسطة الذكاء الاصطناعي

وفقًا لأبحاث جديدة، أصبحت نماذج مثل ChatGPT وأشباهها تظهر الآن انحيازًا واضحًا نحو النصوص التي يعتقدون أنها كتبت بواسطة البشر، حتى عندما يكون هذا الاعتقاد خاطئًا. مجرد وصف النص بأنه “من صنع الإنسان” يجعله يفضلونه – ومن المفارقات أنهم قد يتعلمون هذا التحيز منا.
قد تلعب مفاهيم الصحة، والأصل، والخبرة المشتركة دورًا أكبر في هجوم الذكاء الاصطناعي على قطاع الكتابة الإبداعية مما كان واضحًا حتى الآن: وجدت الاختبارات التي أجريت لدراسة جديدة في جامعة برينستون أن مجموعة من نماذج اللغة الكبيرة المفتوحة والمغلقة، بما في ذلك ChatGPT، تفضل ما يعتقدون أنه نصوص “من صنع بشري”.
حتى عندما تم عكس تسميات عينات الكتابة، استمرت نماذج الذكاء الاصطناعي والمشاركين البشر على حد سواء في العثور على عيوب في النص المكتوب بواسطة الذكاء الاصطناعي، متوافقين مع نفس الانتقادات التي قدموها عندما تم تصنيفه بشكل صحيح.
يعتقد الباحثون أن جزءًا من السبب قد يكون بسبب العداء المتزايد من البشر تجاه الذكاء الاصطناعي التوليدي، الذي يبدو أنه يظهر أحداثًا جديدة ومثيرة للاهتمام كل يوم، ويمكن أن يؤثر في أنظمة الذكاء الاصطناعي نفسها. مشيرين إلى مدى كره الذكاء الاصطناعي للكتابة بواسطة الذكاء الاصطناعي أكثر من كره البشر لها، يقولون:
أظهرت النماذج الثلاثة عشر التي قمنا بتحديدها انحيازًا بنسبة 34.3 نقطة مئوية مقارنة بنقاط البشر البالغة 13.7 نقطة، مما يجعلها 2.5 مرة أكثر حساسية للإشارات الإسنادية من تقييماتنا البشرية.
يبدو هذا التضخيم معقولًا بمجرد أن ندرك أن النماذج المعاصرة هي مقيّمات مدربة على التفضيل. يُعلّم التدريب من خلال التعزيز من التغذية الراجعة البشرية (RLHF) النماذج بشكل صريح معاملة أحكام البشر كمعيارهم الذهبي، مما يثبت بهم موثوقية متعلمة [سابقة].
يتعلم النماذج أن التخلف عن تفضيلات البشر يحصل على مكافأة، مما يخلق سيكوفانسي حيث يصدرون مواقف مستخدمين متوقعة بدلاً من تقديم تقييم مستقل.’
تطبق النتائج على مجال الكتابة الإبداعية، حيث استخدم الباحثون قصصًا من مؤلف فرنسي متميز كعينات بيانات؛ ويشيرون إلى أن التحيز البشري ضد الذكاء الاصطناعي قد يفوق في الميزان أي تحسين كمي في بناء اللغة التي يمكن أن تنتجها نماذج اللغة الكبيرة (LLMs) مع تطورها – وأن تسمية “الذكاء الاصطناعي” قد تأتي إلى معنى “غير اصطناعي”، “مزيّف”، و “درجة ثانية” في هذا المجال.
تتمثل العديد من الأسباب في الممارسة الثقافية والاستخدام: يشير البحث إلى أن الإبداع غالبًا ما يُوصف بالجديد، والقيمة، والنمطية، أي كيف يبدو شيء جديد؛ كيف يتم تقديره من قبل الخبراء؛ وكيف يلائم فئته. عندما يتم وسم مقطع كونه “مكتوبًا بواسطة إنسان”، يتم مكافأة السمات المألوفة للنوع كقيمة؛ عندما يتم وسمه كونه “مكتوبًا بواسطة الذكاء الاصطناعي”، يتم رفض نفس السمات كغير أصلية.
بصورة فعالة، يؤدي الكشف عن المصدر إلى إعادة تقييم قيمة العمل، مشكّلًا افتراضات حول كيفية صنعه. بمجرد أن يتم الكشف عن авторية الذكاء الاصطناعي، يرفض القراء بشكل غريزي احتمال اكتشاف فردي أو نية وراء الإخراج.
يشير البحث إلى:
في معظم الفنون، لا يوجد معيار ذهبي للكفاية “الإبداعية”، مما يجعل إشارات الأصل قوية يمكن أن تhift معايير التي تشعر أنها الأكثر وضوحًا: الحرف الملتزم أو الجدة الواضحة، سهولة الوصول أو الصعوبة.
نظرًا لأن المراقبين غالبًا ما يفترضون العملية من المنتج، فإن إشارات الأصل تؤثر على الأحكام حول كيفية صنع شيء وكذلك ما هو: يمكن أن يُعتبر التحركات المحافظة كحرف من إنسان، ولكن يرفضها ك “توليد مجرد” من نموذج.
شاركت ثلاثة عشر نموذجًا، بما في ذلك متغيرات من ChatGPT، و Claude، و Gemini، و Mistral، إلى جانب قراء بشريين، وجميعهم قيموا القصص بشكل أكثر إيجابية عندما أخبروا أنها من صنع بشري، مع ظهور انحياز أكبر في نماذج LLMs أكثر من البشر.
فكرة أن نماذج الذكاء الاصطناعي قد امتصت تحيزًا ضد إخراجها الخاصة تثير أسئلة حول منشأ ذلك التحيز. منذ أن لا يُسهل دائمًا تحديد الكتابة بواسطة الذكاء الاصطناعي، فإن أي ارتباطات سلبية متشكلة خلال التدريب من المحتمل أن تنشأ من أمثلة تم وسمها بشكل صريح، سواء من خلال تغطية الأخبار لمحتوى الذكاء الاصطناعي، أو مقالات الذكاء الاصطناعي المعلن عنها ذاتيًا في المنشورات الرئيسية.
الورقة الجديدة بعنوان يفضل الجميع الكتاب البشر، بما في ذلك الذكاء الاصطناعي، وهي من تأليف两个 كاتبين في مركز برينستون للعلوم الرقمية. يرافق العمل إصدار بيانات متعلق به في Zenodo (مع إصدار GitHub مذكور في الورقة، ولكن المستودع لا يزال غير نشط في وقت الكتابة).
المنهج
للكشف عن كيفية تأثير الإسناد وتشكيله لآراء حول الأسلوب والإبداع، استخدم المؤلفون تمارين الأسلوب، وهو عمل غريب من عام 1947 لRAYMOND QUENEAU الذي يعيد كتابة قصة بسيطة في 99 أسلوبًا مختلفًا. تتبع القصة رجلًا يصعد إلى حافلة، ويجادل مع راكب آخر، ويتلقى فيما بعد نصائح حول الموضة من صديق.
على الرغم من أن المنشأ الأدبي، فإن هذا الهيكل يتنبأ بالتحويلات القائمة على البرومت في نماذج اللغة الحديثة، حيث يطلب المستخدمون إعادة كتابة النصوص بنفسية أو أسلوب معين.
الرؤية المزدوجة
استخدمت الدراسة الأولى التي أجريها المؤلفون GPT-4o لإنشاء جميع متغيرات الأسلوب الثلاثين، لأنها كانت النموذج الأكثر تقدمًا في ذلك الوقت. ضمان استخدام نموذج واحد ساعد على عزل تأثير تسميات الإسناد، التي سعت الدراسة لاختبارها.
لم يتم تحرير الإخراج لSTYLE أو النبرة، باستثناء أشياء مثل هنا الإصدار المُكتب.
في الدراسة الثانية، تم تكرار عملية التوليد عبر ثلاثة عشر نموذجًا للغة كبيرة: Qwen 2.5 72B Instruct، Mistral Nemo، Mistral Medium 3، Llama 4 Maverick، Llama 3.3 70B Instruct، Gemini 2.5 Flash، GPT-4o Mini، GPT-4o، GPT-3.5 Turbo Instruct، DeepSeek RI (0528)، DeepSeek Chat v3 (0324)، Cohere Command R (08-2024)، Claude Sonnet 4، و Claude 3.5 Haiku.
البيانات والاختبارات
أظهر الباحثون نفس الأزواج من القصص لمجموعات مختلفة من الناس، ولكن غيروا التسميات لمعرفة مدى تأثير اسم المؤلف على الآراء: مجموعة لم تظهر أسماء المؤلفين على الإطلاق، فقط تسميات “A” و “B”. مجموعة أخرى رأت الأسماء الصحيحة، مع نسخة واحدة تم وضع علامة عليها على أنها مكتوبة بواسطة إنسان، والآخر تم وضع علامة عليه على أنه مكتوب بواسطة GPT-4o.
مجموعة ثالثة رأت الأسماء متبدلة، مع قصة “الذكاء الاصطناعي” تم وضع علامة عليها على أنها “بشرية”، والنسخة “البشرية” تم وضع علامة عليها على أنها “الذكاء الاصطناعي”:

نظرة عامة على الدراسة 1. قارن الحكام البشريون والذكاء الاصطناعي 30 زوجًا من القصص، كل منها يحتوي على نسخة مكتوبة بواسطة Queneau، وواحدة بواسطة GPT-4. تم تقسيم الحكام إلى ثلاث مجموعات: واحدة لم تظهر تسميات المؤلف؛ واحدة رأت التسميات الصحيحة؛ وواحدة رأت التسميات المتبدلة – وهي ترتيب مصمم لاختبار مدى تأثير أسماء المؤلفين على آراء حول أسلوب الكتابة.
الدراسة 1
قسم الباحثون 30 أسلوبًا تم إنشاؤها إلى مجموعات صغيرة، مع رؤية كل مشارك دراسي فقط خمس أساليب، وكل أسلوب تم اختباره في جميع ثلاثة إعدادات التسمية.
رأى كل مشارك فقط إعداد تسمية واحد: مجموعة عمياء رأت لا ذكر للذكاء الاصطناعي، في حين رأت المجموعات الأخرى إما تسميات صحيحة أو معكوسة. تم تخصيص مجموعة، وترتيب القصة، ووضع اليسار واليمين بشكل عشوائي.
مرت نماذج الذكاء الاصطناعي بنفس العملية، وتم استلام نفس مزيج من الأساليب و同じ عشوائية. تم تشغيل كل اختبار ثلاث مرات لكل نموذج لضمان ثبات النتائج، مما يجعل من الممكن مقارنة ردود فعل البشر والذكاء الاصطناعي للتسميات.
الدراسة 2
وجدت الدراسة الثانية نفس الانحياز المحبب للبشر عبر جميع نماذج الذكاء الاصطناعي الثلاثة عشر، بغض النظر عن الهيكل أو المزود:

انحياز الإسناد لكل من النماذج الثلاثة عشر للذكاء الاصطناعي: تظهر الأعمدة أحجام التأثير مع فترات ثقة بنسبة 95٪، ويشير الخط الأحمر إلى خط أساس البشر. أظهرت جميع النماذج انحيازًا أقوى من البشر، مع اختلافات صغيرة بينهم.
أفضل كل نموذج القصص الموصومة على أنها مكتوبة بواسطة إنسان، مع تأثيرات أقوى مما لوحظ في الناس. حتى بعد إزالة الحالة الأكثر تطرفًا، بقي الانحياز المتوسط أكثر من ضعف حجم النسخة البشرية، مما يشير إلى أن التأثير ليس خللًا في نموذج واحد، بل سمة مشتركة لنماذج LLMs بشكل عام.
الاستنتاج
على الرغم من أن الدراسات السابقة أظهرت أن الذكاء الاصطناعي يمكن أن ينتج كتابة متساوية أو حتى أفضل من العمل البشري، يؤكد المؤلفون أن القيمة الموضوعة على المؤلفية والصحة في الأدب هي اتفاقية قديمة ومتأصلة:
عندما يرفض GPT-4o Mini نهج “Queneau الإبداعي والممتع” على أنه “مبالغ فيه” تحت علامة الإسناد بالذكاء الاصطناعي، بينما يمدح السمات المتطابقة تحت علامة الإسناد البشرية، يكشف بشكل ضمني عن كيفية تشغيل هذه العلامات افتراضات حول عدم حدوث عملية نفسية حقيقية.
تخفي إشارات الأصل العملية مرة أخرى في ما يمكن أن يكون حكمًا فقط للنتاج: يعتبر “التوليد البسيط” مقبولًا من حرفي بشري (يُحكم عليه على أنه حرف مهارة)، ولكن مشبوهًا من نموذج (يُحكم عليه على أنه إعادة تركيبية خوارزمية).
نماذج LLMs ليست مؤهلة بعد للبحث القائم على الحقائق بدون إشراف، على الرغم من أن الإشراف الجيد يمكن أن يجعلها منتجة – ولكن الكتابة الإبداعية القائمة على LLMs قد تواجه مستقبلًا أكثر تحديًا، إذا أصبحت الأعمال الإبداعية التي تم إنشاؤها بواسطة الذكاء الاصطناعي معرضة للوصم من خلال رفض عام أكبر للذكاء الاصطناعي على التوسع في المجالات البشرية، بدلاً من القيمة الأدبية.
تتأثر الآثار من نتائج دراسات هذا النوع بشكل كبير بميل الشركات والمستخدمين الفرديين إلى الصدق فيما إذا كانوا استخدموا الذكاء الاصطناعي في إخراجهم. في بعض الحالات، قد يكون عدم الرغبة في الإعتراف بذلك الاستخدام أكثر صلة بـ سرقة حقوق التأليف والنشر أكثر من القلق بشأن ما إذا كان الجمهور سيقبل الأعمال الإبداعية التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
ومع ذلك، يمكن أن تكون هناك حلول قانونية ومالية وسياسية (إذا كانت صعبة للغاية) بشأن حقوق التأليف والنشر. لكن ما إذا كان يمكن لأي شخص أن يستمتع بالأعمال الإبداعية للذكاء الاصطناعي التي لا يوجد لها عقل بشري واحد يمكن ربطه بها – قد تكون هذه فرصة أكثر تحديًا.
* يرجى الرجوع إلى الورقة الأصلية للمصادر المحذوفة. عند الضرورة، سيتم تضمينها في المقال.
نشر لأول مرة يوم الإثنين، 13 أكتوبر 2025












