زاوية أندرسون
الذكاء الاصطناعي لا يقدم بالضرورة إجابات أفضل إذا كنت مهذبًا

يتغير الرأي العام حول جدوى التحلي باللباقة تجاه الذكاء الاصطناعي تقريبًا بنفس وتيرة أحدث حكم بشأن القهوة أو النبيذ الأحمر - يُحتفى به شهرًا، ويُطعن فيه في الشهر التالي. ومع ذلك، يُضيف عدد متزايد من المستخدمين الآن 'لو سمحت' or 'شكرًا لك' بناءً على مطالباتهم، وليس فقط من باب العادة، أو القلق من أن التبادلات الوقحة قد تؤدي إلى تنتقل إلى الحياة الواقعية، ولكن من الاعتقاد بأن المجاملة يؤدي إلى نتائج أفضل وأكثر إنتاجية من الذكاء الاصطناعي.
وقد انتشر هذا الافتراض بين المستخدمين والباحثين، حيث تمت دراسة صياغة العبارات السريعة في دوائر البحث كأداة لـ اكتساب, سلامةو التحكم في النغمة، حتى مع قيام عادات المستخدم بتعزيز وإعادة تشكيل تلك التوقعات.
على سبيل المثال ، 2024 الدراسة من اليابان وجد الباحثون أن اللباقة السريعة يمكن أن تُغير سلوك نماذج اللغة الكبيرة، وذلك باختبار GPT-3.5 وGPT-4 وPaLM-2 وClaude-2 على مهام باللغات الإنجليزية والصينية واليابانية، وإعادة صياغة كل مُطالبة على ثلاثة مستويات من اللباقة. لاحظ مؤلفو هذا العمل أن الصياغة "الصارمة" أو "الوقحة" أدت إلى انخفاض دقة الحقائق وإجابات أقصر، بينما أدت الطلبات متوسطة اللباقة إلى تفسيرات أوضح ورفض أقل.
بالإضافة إلى ذلك، مايكروسوفت يوصي بنبرة مهذبة مع Co-Pilot، من وجهة نظر الأداء وليس من وجهة نظر ثقافية.
ومع ذلك، ورقة بحثية جديدة يتحدى هذا المفهوم الشائع بشكل متزايد من جامعة جورج واشنطن، مقدمًا إطارًا رياضيًا يتنبأ بموعد "انهيار" مخرجات نموذج لغوي كبير، متحولًا من محتوى متماسك إلى محتوى مضلل أو حتى خطير. في هذا السياق، يؤكد المؤلفون أن التحلي بالأدب لا يؤخر بشكل هادف أو منع هذا "الانهيار".
انطلاق المباراة
يجادل الباحثون بأن استخدام اللغة المهذبة لا يرتبط عادةً بالموضوع الرئيسي للمطالبة، وبالتالي لا يؤثر بشكل ملموس على محور النموذج. ولدعم ذلك، يقدمون صياغة مفصلة لكيفية تأثير... رأس الانتباه يقوم بتحديث اتجاهه الداخلي أثناء معالجته لكل جديد رمز، مما يدل ظاهريًا على أن سلوك النموذج يتشكل من خلال التأثير التراكمي من الرموز التي تحمل المحتوى.
نتيجةً لذلك، يُفترض أن اللغة المهذبة لا تؤثر كثيرًا على توقيت تدهور إنتاج النموذج. ما الذي يحدد... نقطة اللاعودةوبحسب ما جاء في الورقة البحثية، فإن العامل الحاسم هو التوافق الشامل للرموز ذات المعنى مع مسارات الإخراج الجيدة أو السيئة - وليس وجود لغة مهذبة اجتماعيًا.

رسم توضيحي لرأس انتباه مُبسَّط يُولِّد تسلسلًا من مُوجِّه مستخدم. يبدأ النموذج بالرموز الجيدة (G)، ثم يصل إلى نقطة تحول (n*) حيث ينقلب الناتج إلى رموز سيئة (B). لا تلعب المصطلحات المُهذَّبة في المُوجِّه (P₁، P₂، إلخ) أي دور في هذا التَّغيير، مما يدعم ادعاء البحث بأنَّ المجاملة ليس لها تأثير يُذكر على سلوك النموذج. المصدر: https://arxiv.org/pdf/2504.20980
إذا كانت هذه النتيجة صحيحة، فإنها تتناقض مع الاعتقاد السائد وربما حتى مع الاعتقاد الضمني. منطق ضبط التعليمات، والذي يفترض أن صياغة المطالبة تؤثر على تفسير النموذج لنية المستخدم.
ضخم خارج
تبحث الورقة في كيفية تأثير النموذج الداخلي على متجه السياق (بوصلتها المتطورة لاختيار الرموز) التحولات أثناء التوليد. مع كل رمز، يُحدَّث هذا المتجه اتجاهيًا، ويُختار الرمز التالي بناءً على المرشح الأقرب إليه.
عندما يتجه الموجه نحو محتوى جيد التكوين، تظل استجابات النموذج مستقرة ودقيقة؛ ولكن بمرور الوقت، يمكن أن يؤدي هذا السحب الاتجاهي إلى: عكس, توجيه النموذج نحو مخرجات خارج الموضوع بشكل متزايد، أو غير صحيحة، أو غير متسقة داخليًا.
نقطة التحول لهذا التحول (التي يحددها المؤلفون رياضيا بالتكرار) n*يحدث هذا عندما يصبح متجه السياق أكثر توافقًا مع متجه إخراج "سيء" منه مع متجه إخراج "جيد". في هذه المرحلة، يدفع كل رمز جديد النموذج إلى مسار خاطئ، مما يعزز نمطًا من المخرجات الخاطئة أو المضللة بشكل متزايد.
نقطة التحول n* يتم حسابه من خلال إيجاد اللحظة التي يتوافق فيها الاتجاه الداخلي للنموذج بالتساوي مع أنواع المخرجات الجيدة والسيئة. هندسة مساحة التضمين، التي تم تشكيلها من خلال كل من مجموعة التدريب ومطالبة المستخدم، تحدد مدى سرعة حدوث هذا التقاطع:

رسم توضيحي يوضح كيفية ظهور نقطة التحول n* ضمن نموذج المؤلفين المُبسّط. يُحدد الشكل الهندسي (أ) المتجهات الرئيسية المُستخدمة في التنبؤ بتحول المُخرجات من جيد إلى سيء. في (ب)، رسم المؤلفون تلك المتجهات باستخدام مُعاملات الاختبار، بينما (ج) قارنوا نقطة التحول المُتوقعة بالنتيجة المُحاكاة. التطابق دقيق، مما يدعم ادعاء الباحثين بأن الانهيار حتمي رياضيًا بمجرد تجاوز الديناميكيات الداخلية حدًا معينًا.
لا تؤثر المصطلحات المهذبة على اختيار النموذج للمخرجات الجيدة والسيئة، لأنها، وفقًا للمؤلفين، لا ترتبط ارتباطًا وثيقًا بالموضوع الرئيسي للمطالبة. بل إنها تتدخل في أجزاء من الفضاء الداخلي للنموذج لا علاقة لها بما يقرره النموذج فعليًا.
عند إضافة مثل هذه المصطلحات إلى موجه، فإنها تزيد من عدد المتجهات التي يأخذها النموذج في الاعتبار، ولكن ليس بطريقة تُغيّر مسار الانتباه. ونتيجةً لذلك، تعمل مصطلحات اللباقة مثل الضوضاء الإحصائية: موجودة، لكنها خاملة، وتترك نقطة التحول n* دون تغيير.
يذكر المؤلفون:
"إن ما إذا كانت استجابة الذكاء الاصطناعي لدينا ستصبح غير قانونية يعتمد على تدريب LLM الخاص بنا الذي يوفر تضمينات الرموز، والرموز الجوهرية في موجهنا - وليس ما إذا كنا مهذبين تجاهها أم لا."
النموذج المستخدم في العمل الجديد ضيق بشكل مقصود، مع التركيز على رأس انتباه واحد مع ديناميكيات رمزية خطية - إعداد مبسط حيث يقوم كل رمز جديد بتحديث الحالة الداخلية من خلال إضافة متجه مباشرة، دون تحويلات غير خطية أو النابضة.
يتيح هذا الإعداد المُبسَّط للمؤلفين استخلاص نتائج دقيقة، ويمنحهم صورةً هندسيةً واضحةً لكيفية وتوقيت تحوّل مخرجات النموذج فجأةً من جيد إلى سيء. في اختباراتهم، تتطابق الصيغة التي استنبطوها للتنبؤ بهذا التحوّل مع نتائج النموذج الفعلية.
الدردشة..؟
ومع ذلك، لا يُجدي هذا المستوى من الدقة نفعًا إلا بفضل بساطة النموذج عمدًا. وبينما يُقرّ المؤلفون بضرورة اختبار استنتاجاتهم لاحقًا على نماذج متعددة الرؤوس أكثر تعقيدًا، مثل سلسلة كلود وتشات جي بي تي، إلا أنهم يعتقدون أيضًا أن النظرية تظل قابلة للتكرار مع زيادة عدد رؤوس الانتباه، قائلين*:
"السؤال حول الظواهر الإضافية التي تنشأ مع زيادة عدد رؤوس وطبقات الانتباه المرتبطة، هو: a ساحر صورة واحدة؟. ولكن أي انتقالات داخل رأس انتباه واحد ستظل تحدث، ويمكن تضخيمها و/أو مزامنتها بواسطة وصلات - مثل سلسلة من الأشخاص المتصلين الذين يتم جرهم إلى حافة الهاوية عندما يسقط أحدهم.

رسم توضيحي لكيفية تغير نقطة التحول المتوقعة n* تبعًا لمدى ميل المُطالبة نحو محتوى جيد أو سيء. يُستمد هذا الرسم من صيغة المؤلفين التقريبية، ويُظهر أن المصطلحات المُهذبة، التي لا تدعم أيًا من الجانبين بوضوح، ليس لها تأثير يُذكر على توقيت حدوث الانهيار. تتطابق القيمة المُحددة (n* = 10) مع عمليات المحاكاة السابقة، مما يدعم المنطق الداخلي للنموذج.
ما يظل غير واضح هو ما إذا كانت نفس الآلية تنجو من القفزة إلى العصر الحديث بنيات المحولاتيؤدي الاهتمام متعدد الرؤوس إلى تفاعلات عبر رؤوس متخصصة، والتي قد تعمل على حماية أو إخفاء نوع سلوك الانقلاب الموصوف.
يعترف المؤلفون بهذا التعقيد، لكنهم يزعمون أن رؤوس الانتباه غالبًا ما تكون مرتبطة بشكل فضفاض، وأن نوع الانهيار الداخلي الذي يقومون بنمذجته يمكن أن يكون عززت بدلاً من قمعها في الأنظمة ذات النطاق الكامل.
في غياب توسيع للنموذج أو اختبار تجريبي يشمل برامج ماجستير القانون الإنتاجية، يبقى هذا الادعاء غير مؤكد. مع ذلك، تبدو الآلية دقيقة بما يكفي لدعم مبادرات بحثية لاحقة، ويوفر المؤلفون فرصة واضحة لتحدي النظرية أو تأكيدها على نطاق واسع.
يسجل الخروج
في الوقت الحالي، يبدو أن موضوع الأدب تجاه طلاب الماجستير في القانون الذين يتعاملون مع المستهلكين يتم تناوله إما من وجهة نظر (عملية) مفادها أن الأنظمة المدربة قد تستجيب بشكل أكثر فائدة للاستفسارات المهذبة؛ أو أن أسلوب التواصل غير الدبلوماسي والصريح مع مثل هذه الأنظمة ينطوي على مخاطر انتشار في العلاقات الاجتماعية الحقيقية للمستخدم، من خلال قوة العادة.
من الممكن القول إن برامج الماجستير في القانون لم تُستخدم على نطاق واسع بما يكفي في السياقات الاجتماعية في العالم الحقيقي حتى تتمكن الأدبيات البحثية من تأكيد الحالة الأخيرة؛ ولكن الورقة البحثية الجديدة تلقي بعض الشكوك المثيرة للاهتمام حول فوائد تشبيه أنظمة الذكاء الاصطناعي من هذا النوع بالبشر.
دراسة أجريت في أكتوبر الماضي من جامعة ستانفورد اقترح (على النقيض من 2020 الدراسة) أن معاملة طلاب الماجستير في القانون كما لو كانوا بشرًا ينطوي أيضًا على مخاطرة تدهور معنى اللغة، وخلص إلى أن الأدب "الروتيني" يفقد في النهاية معناه الاجتماعي الأصلي:
"إن العبارة التي تبدو ودية أو حقيقية من متحدث بشري يمكن أن تكون غير مرغوب فيها إذا كانت صادرة عن نظام الذكاء الاصطناعي لأن هذا الأخير يفتقر إلى الالتزام أو القصد الهادف وراء العبارة، وبالتالي يجعل العبارة جوفاء ومضللة.
ومع ذلك، يقول حوالي 67 بالمائة من الأميركيين إنهم مهذبون مع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي، وفقًا لدراسة 2025 المسح من دار نشر فيوتشر. قال معظمهم إنه ببساطة "التصرف الصحيح"، بينما أقرّ ١٢٪ منهم بأنهم يتوخون الحذر - تحسبًا لأي طارئ.
* تحويلي لاقتباسات المؤلفين المضمنة إلى روابط تشعبية. إلى حد ما، تكون هذه الروابط عشوائية/مثالية، إذ يربط المؤلفون في بعض الأحيان بمجموعة واسعة من الاستشهادات في الحواشي السفلية، بدلاً من ربطها بمنشور محدد.
نُشرت لأول مرة يوم الأربعاء، 30 أبريل 2025. وتم تعديلها يوم الأربعاء، 30 أبريل 2025 الساعة 15:29:00، للتنسيق.












