هندسة المحفزات
التعامل مع الوهم في النماذج اللغوية الكبيرة: مسح تقنيات متقدمة

النماذج اللغوية الكبيرة (LLMs) مثل GPT-4 و PaLM و Llama قد أطلقت تقدمات ملحوظة في قدرات توليد اللغة الطبيعية. ومع ذلك، فإن تحديًا مستمرًا يحد من موثوقيةها وتنفيذها الآمن هو倾هم إلى الوهم – توليد محتوى يبدو متسقًا ولكن غير دقيق من الناحية الفعلية أو غير مبرر من السياق المدخلات.
随着 نمو النماذج اللغوية الكبيرة وأصبحت أكثر قوة وتأثيرًا في التطبيقات الحقيقية، أصبح من الضروري معالجة الأوهام. هذا المقال يقدم نظرة شاملة على أحدث التقنيات التي قدمها الباحثون لاكتشاف وقياس وتخفيف الأوهام في النماذج اللغوية الكبيرة.
فهم الوهم في النماذج اللغوية الكبيرة
الوهم يشير إلى عدم دقة الحقائق أو الخيال الذي تولده النماذج اللغوية الكبيرة والتي لا تتمتع بأي أساس في الواقع أو السياق المحدد.
- اختراع تفاصيل سيرة ذاتية أو أحداث غير مدعومة بالدليل عندما يتعلق الأمر بتوليد نص حول شخص.
- تقديم نصائح طبية خاطئة من خلال الخيال حول الآثار الجانبية للأدوية أو إجراءات العلاج.
- اختراع بيانات أو دراسات أو مصادر غير موجودة لدعم ادعاء.
ينشأ هذا الظاهرة لأن النماذج اللغوية الكبيرة يتم تدريبها على كميات هائلة من البيانات النصية عبر الإنترنت. في حين أن هذا يسمح لها بالحصول على قدرات قوية في النمذجة اللغوية، إلا أنه يعني أيضًا أنها تتعلم لاستخراج المعلومات وتحديد الأنماط وتملأ الفجوات بطريقة تبدو مقنعة ولكن قد تكون خادعة أو غير دقيقة.
بعض العوامل الرئيسية المسؤولة عن الأوهام تشمل:
- التعميم النمطي – تعلم النماذج اللغوية الكبيرة الأنماط في بيانات التدريب التي قد لا تتمتع بالعمومية الجيدة.
- معرفة قديمة – يمنع التدريب المسبق على دمج المعلومات الجديدة.
- الغموض – يسمح الإشارات الغامضة بفرص لافتراضات خاطئة.
- الانحياز – تعزز النماذج الانحيازات وتضخمها.
- نقص التأسيس – عدم فهم النماذج وتحليل المحتوى الذي تولده.
معالجة الأوهام أمر بالغ الأهمية لضمان ثقة وتنفيذ آمن في المجالات الحساسة مثل الطب والقانون والتمويل والتعليم حيث يمكن توليد معلومات خاطئة أن يؤدي إلى ضرر.
تصنيف تقنيات تخفيف الوهم
قدم الباحثون تقنيات متنوعة لمكافحة الأوهام في النماذج اللغوية الكبيرة، والتي يمكن تصنيفها إلى:
1. هندسة الإشارات
هذا يشمل تصميم الإشارات بعناية لتوفير السياق وتوجيه النموذج اللغوي الكبير نحو استجابات واقعية ومبررة.
- تعزيز الاسترجاع – استرجاع الأدلة الخارجية لتأسيس المحتوى.
- التغذية الراجعة – توفير التغذية الراجعة لتحسين الاستجابات.
- ضبط الإشارات – تعديل الإشارات خلال التنقيح لتحقيق السلوك المطلوب.
2. تطوير النموذج
إنشاء نماذج أقل عرضة للوهم من خلال التغييرات المعمارية.
- استراتيجيات الفك – توليد النص بطريقة تزيد من الإخلاص.
- تأسيس المعرفة – دمج قواعد المعرفة الخارجية.
- دالات الخسارة الجديدة – تحسين الإخلاص خلال التدريب.
- التنقيح الموجه – استخدام بيانات مُصنفة من قبل الإنسان لتعزيز الدقة.
بعد ذلك، سنستعرض التقنيات البارزة في كل نهج.
تقنيات تخفيف الوهم البارزة
توليد مقترن بالاسترجاع
توليد مقترن بالاسترجاع يعزز النماذج اللغوية الكبيرة من خلال استرجاع وثائق الأدلة الخارجية وتكييف توليد النص عليها، بدلاً من الاعتماد فقط على المعرفة الضمنية للنموذج. هذا يؤسس المحتوى على معلومات موثوقة ومحدثة، ويقلل من الأوهام.
التقنيات البارزة تشمل:
- RAG – يستخدم وحدة استرجاع لتوفير مقاطع ذات صلة لنموذج seq2seq لتوليد منها. يتم تدريب كلا المكونين بشكل متزامن.
- RARR – يستخدم النماذج اللغوية الكبيرة لاستقصاء المطالبات غير المنسوبة في النص المتولد وتصحيحها لتوافقها مع الأدلة المسترجعة.
- استرجاع المعرفة – يؤكد التوليدات غير المؤكدة باستخدام المعرفة المسترجعة قبل إنتاج النص.
- LLM-Augmenter – يبحث بشكل متكرر في المعرفة لإنشاء سلاسل الأدلة لإشارات النماذج اللغوية الكبيرة.
التغذية الراجعة والاستدلال
استخدام التغذية الراجعة اللغوية المتكررة أو الاستدلال الذاتي يسمح للنماذج اللغوية الكبيرة بتحسين وتحسين إخراجها الأولي، مما يقلل من الأوهام.
CoVe يستخدم تقنية سلسلة التحقق. يُنشئ النموذج اللغوي الكبير أولاً مسودة استجابة لاستفسار المستخدم. ثم يولد أسئلة التحقق المحتملة لتحقق من استجابته الخاصة، بناءً على ثقته في العبارات المختلفة المذكورة. على سبيل المثال، لاستجابة تصف علاجًا طبيًا جديدًا، قد يولد CoVe أسئلة مثل “ما هو معدل الفعالية للعلاج؟”، “هل حصل على موافقة تنظيمية؟”، “ما هي الآثار الجانبية المحتملة؟”. وبشكل حاسم، يحاول النموذج اللغوي الكبير بعد ذلك الإجابة على أسئلة التحقق هذه بشكل مستقل دون أن يُؤثر إخراجه الأولي عليه. إذا كانت إجابات أسئلة التحقق تتعارض مع أو لا يمكن دعم العبارات المذكورة في الاستجابة الأصلية، يحدد النظام تلك كأوهام محتملة ويعيد صياغة الاستجابة قبل تقديمها للمستخدم.
DRESS يركز على ضبط النماذج اللغوية الكبيرة لتوافقها بشكل أفضل مع تفضيلات الإنسان من خلال التغذية الراجعة اللغوية. يسمح النهج للمستخدمين غير الخبراء بتقديم انتقادات حرة على توليدات النموذج، مثل “تظهر الآثار الجانبية المذكورة مبالغًا فيها” أو تعليمات التحسين مثل “يرجى مناقشة الفعالية من حيث التكلفة أيضًا”. يستخدم DRESS التعلم التعزيزي لتدريب النماذج على توليد استجابات مشروطة على مثل هذه التغذية الراجعة التي تتوافق بشكل أفضل مع تفضيلات الإنسان. هذا يعزز التفاعل ويقلل من العبارات غير الواقعية أو غير المدعومة.
MixAlign يتعامل مع الحالات التي يطرح فيها المستخدمون أسئلة لا تتوافق مباشرة مع مقاطع الأدلة المسترجعة من قبل النظام. على سبيل المثال، قد يطرح المستخدم سؤالًا “هل سيتدهور التلوث في الصين؟” في حين تناقش المقاطع المسترجعة اتجاهات التلوث على الصعيد العالمي. لتجنب الوهم مع السياق غير الكافي، يُضيف MixAlign توضيحًا صريحًا مع المستخدم عندما لا يُؤكد كيفية ربط سؤاله بالمعلومات المسترجعة. يسمح هذا الآلية الموجودة في حلقة التغذية الراجعة للمستخدمين بتقديم التغذية الراجعة لتحديد وتوضيح السياق بشكل صحيح، مما يمنع الاستجابات غير المبررة.
تقنية المراجعة الذاتية تُدرب النماذج اللغوية الكبيرة على تقييم وتقديم التغذية الراجعة وتصحيح استجاباتها الخاصة باستخدام نهج متعدد المهام. على سبيل المثال، بالنسبة لاستجابة تولدها لاستفسار طبي، يتعلم النموذج تقييم دقة الحقائق، وتحديد العبارات المتناقضة أو غير المدعومة، وتصحيحها من خلال استرجاع المعرفة ذات الصلة. من خلال تعليم النماذج اللغوية الكبيرة هذه الدورة التغذية الراجعة من التحقق والانتقاد والتحسين المتكرر لاستجاباتها الخاصة، يقلل النهج من الأوهام غير المبررة.
ضبط الإشارات
ضبط الإشارات يسمح بتعديل الإشارات التوجيهية المقدمة للنماذج اللغوية الكبيرة خلال التنقيح من أجل السلوك المطلوب.
طريقة SynTra تستخدم مهمة تلخيص اصطناعي لتقليل الوهم قبل نقل النموذج إلى مجموعات بيانات تلخيص حقيقية. تُقدم المهمة الاصطناعية مقاطع مدخلة وتنشئ النماذج تلخيصها من خلال الاسترجاع فقط، دون إضافة. هذا يُدرب النماذج على الاعتماد完全 على المحتوى المُستمد بدلاً من اختراع معلومات جديدة خلال التلخيص. أظهر SynTra تقليل قضايا الوهم عند تنفيذ النماذج المُعدلة على المهام المستهدفة.
UPRISE يُدرب مسترجع إشارات عالمي يُقدم الإشارة المثلى للتعلم القليل على مهام غير موضحة. من خلال استرجاع إشارات فعالة مُعدة على مجموعة متنوعة من المهام، يتعلم النموذج التعميم والتكيف مع مهام جديدة يفتقر إلى أمثلة تدريبية عليها. هذا يعزز الأداء دون الحاجة إلى ضبط مهام محدد.
هياكل نموذجية جديدة
FLEEK هو نظام يركز على مساعدة محققين التحقق والمدققين. يحدد تلقائيًا المطالبات القابلة للتحقق المذكورة في نص معين. يُحول FLEEK هذه العبارات إلى استفسارات، ويسترجع الأدلة ذات الصلة من قواعد المعرفة، ويُقدم هذه المعلومات السياقية إلى المدققين لتحقق فعال من دقة الوثائق ومتطلبات المراجعة.
نهج CAD يقلل من الوهم في توليد اللغة من خلال فك التشفير المعتمد على السياق. على وجه التحديد، يزيد CAD من الفروقات بين توزيع إخراج النموذج اللغوي الكبير عندما يتم شرطه على سياق مقابل توليده بدون شرط. هذا يمنع تحديد أدلة سياقية متعارضة، ويتجه النموذج نحو توليد مُبرر.
DoLA يخفف من الأوهام الفعلية عن طريق تحديد الخلاف بين اللوجيت من طبقات مختلفة من شبكات التランスفورمر. منذ أن تميل المعرفة الفعلية إلى أن تكون محلية في طبقات متوسطة معينة، يزيد DoLA من الإشارات من تلك الطبقات الفعلية من خلال التباين اللوجيتي، ويقلل من التوليد غير الصحيح للمعلومات الفعلية.
إطار THAM يُضيف مصطلح تنظيم خلال التدريب لتحديد الحد الأقصى للمعلومات المتبادلة بين المدخلات ومخرجات الوهم. هذا يساعد على زيادة اعتماد النموذج على السياق المدخل بدلاً من الخيال غير المربوط، ويقلل من الأوهام غير المبررة.
تأسيس المعرفة
تأسيس توليدات النماذج اللغوية الكبيرة في معرفة منظمة يمنع التخيل غير المبرر والاختراع.
نموذج RHO يحدد الكيانات في سياق محادثة ويربطها بقاعدة معرفة. يتم استرجاع الحقائق والrelations ذات الصلة عن هذه الكيانات من قاعدة المعرفة ودمجها في تمثيل السياق المقدم للنموذج اللغوي الكبير. هذا التوجيه السياقي القائم على المعرفة يقلل من الأوهام في الحوار من خلال الحفاظ على الاستجابات مرتبطة بالحقائق المبررة حول الكيانات والأحداث المذكورة.
HAR يُنشئ مجموعات بيانات تدريبية مضادة تحتوي على أوهام تولدها النماذج لتعليم التأسيس بشكل أفضل. بالنسبة لمقاطع فعلية، يُطلب من النماذج إدخال أوهام أو تشويه توليد نسخة مضادة. يُجبر التنقيح على هذه البيانات النماذج على تأسيس المحتوى بشكل أفضل في المصادر الفعلية الأصلية، ويقلل من Improvisation.
التنقيح الموجه
- المدرب – إطار تفاعلي يُجيب على استفسارات المستخدم ويطلب تصحيحات لتحسين الأداء.
- التنقيح المُدرك للرفض – يُرفض التنقيح المُدرك للاستفسارات غير المدعومة التي يتم تحديدها من خلال فجوات المعرفة في بيانات التدريب.
- TWEAK – طريقة فك التشفير ترتيب التوليدات بناءً على مدى دعم الفرضيات للمعلومات المدخلة.
التحديات والقيود
على الرغم من التقدم الواعد، لا يزال هناك بعض التحديات الرئيسية في تخفيف الأوهام:
- الغالبًا ما تتاجر التقنيات بين الجودة والاتساق والإبداع من أجل الصحة.
- صعوبة التقييم الشامل بعد مجالات محدودة. لا تلتقط المقاييس جميع النُّعُط.
- كثير من الأساليب مكلفة حسابيًا، وتتطلب استرجاعًا أو استدلالًا ذاتيًا مكثفًا.
- يعتمد بشكل كبير على جودة بيانات التدريب ومصادر المعرفة الخارجية.
- من الصعب ضمان القابلية للتعميم عبر المجالات والوسائط.
- جذور الوهم الأساسية مثل التعميم المفرط لا تزال غير محلولة.
من المرجح أن يتطلب معالجة هذه التحديات نهجًا متعددة الطبقات يجمع بين تحسينات بيانات التدريب وتحسينات هيكل النموذج وضبط الخسارة و تقنيات وقت الاستدلال.
الطريق أمامنا
تخفيف الوهم في النماذج اللغوية الكبيرة لا يزال مشكلة بحث مفتوحة مع تقدم نشط. بعض الاتجاهات الواعدة في المستقبل تشمل:
- الأساليب الهجينة: دمج نهجات متكملة مثل الاسترجاع وتأسيس المعرفة والتغذية الراجعة.
- نمذجة السببية: تعزيز الفهم والاستدلال.
- تكامل المعرفة عبر الإنترنت: الحفاظ على معارف العالم محدثة.
- التحقق الرسمي: تقديم ضمانات رياضية على سلوك النموذج.
- الوضوح: بناء الشفافية في تقنيات التخفيف.
随着 استمرار النماذج اللغوية الكبيرة في الانتشار عبر المجالات الحساسة، سيكون تطوير حلول قوية لتقليص الأوهام هو المفتاح لضمان تنفيذها الآمن والموثوق.












