اتصل بنا للحصول على مزيد من المعلومات

معالجة الهلوسة في النماذج اللغوية الكبيرة: دراسة استقصائية للتقنيات المتطورة

موجه الهندسة

معالجة الهلوسة في النماذج اللغوية الكبيرة: دراسة استقصائية للتقنيات المتطورة

mm

لقد فتحت نماذج اللغات الكبيرة (LLMs) مثل GPT-4 وPaLM وLlama تقدمًا ملحوظًا في قدرات توليد اللغة الطبيعية. ومع ذلك، فإن التحدي المستمر الذي يحد من موثوقيتها ونشرها الآمن هو ميلها إلى الهلوسة - أي إنشاء محتوى يبدو متماسكًا ولكنه في الواقع غير صحيح أو لا أساس له من سياق الإدخال.

مع استمرار نمو LLMs بشكل أكثر قوة وانتشارًا عبر تطبيقات العالم الحقيقي، يصبح التعامل مع الهلوسة أمرًا ضروريًا. تقدم هذه المقالة نظرة شاملة لأحدث التقنيات التي قدمها الباحثون لاكتشاف الهلوسة وقياسها وتخفيفها في LLMs.

فهم الهلوسة في LLMs

تشير الهلوسة إلى عدم الدقة في الحقائق أو الافتراءات الناتجة عن LLMs والتي لا ترتكز على الواقع أو السياق المقدم. بعض الأمثلة تشمل:

  • اختراع تفاصيل أو أحداث السيرة الذاتية غير الموضحة في المادة المصدرية عند إنشاء نص عن شخص ما.
  • تقديم نصيحة طبية خاطئة من خلال الخلط بين الآثار الجانبية للأدوية أو إجراءات العلاج.
  • - اختلاق بيانات أو دراسات أو مصادر غير موجودة لدعم المطالبة.

تنشأ هذه الظاهرة بسبب تدريب LLMs على كميات هائلة من البيانات النصية عبر الإنترنت. وفي حين أن هذا يسمح لهم بالحصول على قدرات قوية في نمذجة اللغة، فإنه يعني أيضًا أنهم يتعلمون استقراء المعلومات، والقيام بقفزات منطقية، وملء الفجوات بطريقة تبدو مقنعة ولكنها قد تكون مضللة أو خاطئة.

بعض العوامل الرئيسية المسؤولة عن الهلوسة تشمل:

  • تعميم النمط - تحدد LLMs وتوسع الأنماط في بيانات التدريب التي قد لا يتم تعميمها بشكل جيد.
  • معرفة عفا عليها الزمن - التدريب المسبق الثابت يمنع دمج المعلومات الجديدة.
  • غموض - المطالبات الغامضة تتيح المجال للافتراضات غير الصحيحة.
  • التحيزات - تعمل النماذج على إدامة وتضخم وجهات النظر المنحرفة.
  • التأريض غير كاف - إن الافتقار إلى الفهم والتفكير يعني أن النماذج تنتج محتوى لا تفهمه بشكل كامل.

تعد معالجة الهلوسة أمرًا بالغ الأهمية للنشر الجدير بالثقة في المجالات الحساسة مثل الطب والقانون والمالية والتعليم حيث يمكن أن يؤدي توليد معلومات مضللة إلى ضرر.

تصنيف تقنيات تخفيف الهلوسة

أدخل الباحثون تقنيات متنوعة لمكافحة الهلوسة في ماجستير إدارة الأعمال، والتي يمكن تصنيفها إلى:

1. الهندسة السريعة

يتضمن ذلك صياغة المطالبات بعناية لتوفير السياق وتوجيه LLM نحو استجابات واقعية وراسخة.

  • زيادة الاسترجاع – استرجاع الأدلة الخارجية للمحتوى الأرضي.
  • ردود الفعل الحلقات - تقديم الملاحظات بشكل متكرر لتحسين الاستجابات.
  • ضبط سريع – ضبط المطالبات أثناء الضبط الدقيق للسلوكيات المرغوبة.

2. تطوير النموذج

إنشاء نماذج أقل عرضة للهلوسة بطبيعتها من خلال التغييرات المعمارية.

  • استراتيجيات فك التشفير - توليد النص بطرق تزيد من الإخلاص.
  • التأريض المعرفي – دمج قواعد المعرفة الخارجية.
  • وظائف فقدان الرواية – تحسين الإخلاص أثناء التدريب.
  • ضبط دقيق تحت الإشراف – استخدام البيانات التي يحملها الإنسان لتعزيز الواقعية.

بعد ذلك، نقوم بمسح التقنيات البارزة تحت كل نهج.

تقنيات تخفيف الهلوسة البارزة

الجيل المعزز الاسترداد

يُعزز التوليد المُعزَّز بالاسترجاع نماذج ماجستير القانون من خلال استرجاع وتكييف توليد النصوص بناءً على وثائق أدلة خارجية، بدلاً من الاعتماد كليًا على المعرفة الضمنية للنموذج. هذا يُرسِّخ المحتوى في معلومات مُحدَّثة وقابلة للتحقق، مما يُقلِّل من الهلوسة.

تشمل التقنيات البارزة ما يلي:

  • RAG - يستخدم وحدة المسترد التي توفر المقاطع ذات الصلة لنموذج seq2seq للتوليد منها. يتم تدريب كلا المكونين من البداية إلى النهاية.
  • رار - يستخدم LLMs للبحث في المطالبات غير المنسوبة في النص الذي تم إنشاؤه ومراجعتها لتتماشى مع الأدلة المستردة.
  • استرجاع المعرفة - التحقق من صحة الأجيال غير المؤكدة باستخدام المعرفة المسترجعة قبل إنتاج النص.
  • ماجستير في القانون-المعزز – يبحث بشكل متكرر عن المعرفة لبناء سلاسل الأدلة لمطالبات LLM.

ردود الفعل والتفكير

إن الاستفادة من ردود الفعل اللغوية الطبيعية التكرارية أو التفكير الذاتي يسمح لطلاب LLM بتحسين مخرجاتهم الأولية وتحسينها، مما يقلل من الهلوسة.

كوف يستخدم نظام التحقق التسلسلي (LLM) تقنية التحقق التسلسلي. يُصوغ نظام LLM أولاً ردًا على استفسار المستخدم. ثم يُولّد أسئلة تحقق محتملة للتحقق من صحة رده، بناءً على ثقته في البيانات المُقدمة. على سبيل المثال، بالنسبة لرد يصف علاجًا طبيًا جديدًا، قد يُولّد نظام CoVe أسئلة مثل "ما مدى فعالية العلاج؟"، "هل حصل على موافقة الجهات التنظيمية؟"، "ما هي الآثار الجانبية المحتملة؟". والأهم من ذلك، يحاول نظام LLM بعد ذلك الإجابة على أسئلة التحقق هذه بشكل مستقل دون أن يكون متحيزًا من رده الأولي. إذا تعارضت إجابات أسئلة التحقق مع البيانات الواردة في الرد الأصلي أو لم تدعمها، يُحدد النظام تلك البيانات على أنها هلوسات مُحتملة ويُحسّن الرد قبل عرضه على المستخدم.

فستان يركز على ضبط LLMs لتتماشى بشكل أفضل مع التفضيلات البشرية من خلال ردود الفعل على اللغة الطبيعية. يسمح هذا النهج للمستخدمين غير الخبراء بتقديم انتقادات حرة لأجيال النماذج، مثل "الآثار الجانبية المذكورة تبدو مبالغ فيها" أو تعليمات التحسين مثل "يرجى أيضًا مناقشة فعالية التكلفة". يستخدم DRESS التعلم المعزز لتدريب النماذج لتوليد استجابات مشروطة بمثل هذه التعليقات التي تتوافق بشكل أفضل مع التفضيلات البشرية. يؤدي ذلك إلى تحسين إمكانية التفاعل مع تقليل البيانات غير الواقعية أو غير المدعومة.

ميكسالين يتعامل مع المواقف التي يطرح فيها المستخدمون أسئلة لا تتوافق بشكل مباشر مع فقرات الأدلة التي يسترجعها النظام. على سبيل المثال، قد يسأل المستخدم "هل سيتفاقم التلوث في الصين؟" بينما تناقش المقاطع المستردة اتجاهات التلوث على مستوى العالم. لتجنب الهلوسة بالسياق غير الكافي، يوضح MixAlign بشكل صريح للمستخدم عندما لا يكون متأكدًا من كيفية ربط سؤاله بالمعلومات المستردة. تتيح آلية التفاعل البشري هذه الحصول على تعليقات لتوضيح الأدلة ووضعها في سياقها بشكل صحيح، مما يمنع الاستجابات التي لا أساس لها.

استخدم التأمل الذاتي تقوم التقنية بتدريب LLMs على التقييم وتقديم التعليقات وتحسين استجاباتهم بشكل متكرر باستخدام نهج متعدد المهام. على سبيل المثال، في ضوء الاستجابة التي تم إنشاؤها لاستعلام طبي، يتعلم النموذج تسجيل دقته الواقعية، وتحديد أي بيانات متناقضة أو غير مدعومة، وتحريرها من خلال استرداد المعرفة ذات الصلة. من خلال تعليم طلاب ماجستير إدارة الأعمال حلقة التغذية الراجعة هذه المتمثلة في التحقق والنقد والتحسين المتكرر لمخرجاتهم، فإن هذا النهج يقلل من الهلوسة العمياء.

ضبط سريع

يتيح الضبط الفوري ضبط المطالبات التعليمية المقدمة إلى LLMs أثناء الضبط الدقيق للسلوكيات المرغوبة.

استخدم سينترا تستخدم الطريقة مهمة تلخيص تركيبية لتقليل الهلوسة قبل نقل النموذج إلى مجموعات بيانات التلخيص الحقيقية. توفر المهمة التركيبية مقاطع إدخال وتطلب من النماذج تلخيصها من خلال الاسترجاع فقط، دون التجريد. يؤدي هذا إلى تدريب النماذج على الاعتماد بشكل كامل على المحتوى المصدر بدلاً من الهلوسة بالمعلومات الجديدة أثناء التلخيص. يظهر أن SynTra يقلل من مشكلات الهلوسة عند نشر النماذج المضبوطة بدقة في المهام المستهدفة.

انتفاضة يقوم بتدريب المسترد السريع العالمي الذي يوفر الموجه الناعم الأمثل للتعلم القليل من اللقطات في المهام النهائية غير المرئية. من خلال استرجاع المطالبات الفعالة التي تم ضبطها على مجموعة متنوعة من المهام، يتعلم النموذج التعميم والتكيف مع المهام الجديدة حيث يفتقر إلى أمثلة التدريب. يؤدي ذلك إلى تحسين الأداء دون الحاجة إلى ضبط مهام محددة.

البنى النموذجية الجديدة

الاقرب الى الكمال هو نظام يركز على مساعدة مدققي الحقائق والمدققين البشريين. فهو يحدد تلقائيًا الادعاءات الواقعية التي يمكن التحقق منها والمقدمة في نص معين. يقوم FLEEK بتحويل هذه البيانات الجديرة بالفحص إلى استعلامات، واسترجاع الأدلة ذات الصلة من قواعد المعرفة، وتوفير هذه المعلومات السياقية للمدققين البشريين للتحقق بشكل فعال من دقة المستندات واحتياجات المراجعة.

استخدم CAD يُقلل نهج فك التشفير من الهلوسة في توليد اللغة من خلال فك التشفير الواعي للسياق. وتحديدًا، يُضخّم التصميم بمساعدة الحاسوب الفروق بين توزيع مخرجات برنامج ماجستير القانون عند اشتراطه سياقًا مُحددًا وبين إنتاجه دون قيد أو شرط. هذا يُثبّط الأدلة السياقية المُتناقضة، ويُوجّه النموذج نحو الأجيال المُتجذّرة.

قانون المساعدة القانونية يُخفف من الهلوسة الواقعية عن طريق مقارنة لوجيتات من طبقات مختلفة من شبكات المحولات. ولأن المعرفة الواقعية تميل إلى التواجد في طبقات متوسطة معينة، فإن تضخيم الإشارات من تلك الطبقات الواقعية من خلال مقارنة لوجيتات DoLA يُقلل من توليد الحقائق غير الصحيح.

استخدم ثام يُدخل الإطار مصطلح تنظيم أثناء التدريب لتقليل المعلومات المتبادلة بين المدخلات والمخرجات الوهمية. يُساعد هذا على زيادة اعتماد النموذج على سياق المدخلات المُعطى بدلاً من الخيال الجامح، مما يُقلل من الهلوسة العمياء.

أسس المعرفة

إن ترسيخ أجيال LLM في المعرفة المنظمة يمنع المضاربة والتلفيق الجامح.

استخدم رو يحدد النموذج الكيانات في سياق المحادثة ويربطها بالرسم البياني المعرفي (KG). يتم استرداد الحقائق والعلاقات ذات الصلة حول تلك الكيانات من رياض الأطفال ودمجها في تمثيل السياق المقدم إلى LLM. هذا التوجيه السياقي الغني بالمعرفة يقلل من الهلوسة في الحوار من خلال إبقاء الاستجابات مرتبطة بالحقائق الأساسية حول الكيانات / الأحداث المذكورة.

تقرير العمل الإنساني ينشئ مجموعات بيانات تدريبية معاكسة للواقع تحتوي على هلاوس تم إنشاؤها بواسطة النماذج لتعليم التأريض بشكل أفضل. نظرًا لمقطع واقعي، يتم مطالبة النماذج بإدخال الهلوسة أو التشوهات التي تولد نسخة معدلة من الواقع. إن الضبط الدقيق لهذه البيانات يجبر النماذج على تحسين المحتوى الأساسي في المصادر الواقعية الأصلية، مما يقلل من الارتجال.

الضبط الدقيق تحت الإشراف

  • Coach – إطار تفاعلي يجيب على استفسارات المستخدم ولكنه يطلب أيضًا تحسين التصحيحات.
  • R- ضبط - الضبط المدرك للرفض يرفض الأسئلة غير المدعومة التي تم تحديدها من خلال فجوات المعرفة في بيانات التدريب.
  • قرص - طريقة فك التشفير التي تصنف الأجيال على أساس مدى دعم الفرضيات للحقائق المدخلة.

التحديات والقيود

على الرغم من التقدم الواعد، لا تزال هناك بعض التحديات الرئيسية في تخفيف الهلوسة:

  • غالبًا ما تستبدل التقنيات الجودة والتماسك والإبداع بالصدق.
  • صعوبة في التقييم الدقيق خارج نطاق المجالات المحدودة. المقاييس لا تلتقط جميع الفروق الدقيقة.
  • العديد من الأساليب مكلفة من الناحية الحسابية، وتتطلب استرجاعًا واسع النطاق أو تفكيرًا ذاتيًا.
  • تعتمد بشكل كبير على جودة بيانات التدريب ومصادر المعرفة الخارجية.
  • من الصعب ضمان إمكانية التعميم عبر المجالات والطرائق.
  • تبقى الجذور الأساسية للهلوسة مثل الإفراط في الاستقراء دون حل.

من المحتمل أن تتطلب معالجة هذه التحديات اتباع نهج متعدد الطبقات يجمع بين تحسينات بيانات التدريب، وتحسينات بنية النموذج، وخسائر تعزيز الإخلاص، وتقنيات وقت الاستدلال.

الطريق إلى الأمام

يظل التخفيف من الهلوسة بالنسبة إلى LLMs مشكلة بحثية مفتوحة مع تقدم نشط. وتشمل بعض الاتجاهات المستقبلية الواعدة ما يلي:

  • تقنيات هجينة: الجمع بين الأساليب التكميلية مثل الاسترجاع وتأسيس المعرفة والتغذية الراجعة.
  • النمذجة السببية: تعزيز الفهم والتفكير.
  • تكامل المعرفة عبر الإنترنت: حافظ على تحديث المعرفة العالمية.
  • التحقق الرسمي: تقديم ضمانات رياضية على السلوكيات النموذجية.
  • التفسير: بناء الشفافية في تقنيات التخفيف.

ومع استمرار انتشار برامج LLM عبر المجالات عالية المخاطر، فإن تطوير حلول قوية للحد من الهلوسة سيكون أمرًا أساسيًا لضمان نشرها الآمن والأخلاقي والموثوق. توفر التقنيات التي تم تناولها في هذه المقالة نظرة عامة على التقنيات المقترحة حتى الآن، حيث لا تزال هناك تحديات بحثية أكثر انفتاحًا. بشكل عام، هناك اتجاه إيجابي نحو تعزيز واقعية النموذج، ولكن التقدم المستمر يستلزم معالجة القيود واستكشاف اتجاهات جديدة مثل السببية والتحقق والأساليب المختلطة. ومن خلال الجهود الحثيثة التي يبذلها الباحثون في مختلف التخصصات، يمكن ترجمة حلم حاملي ماجستير إدارة الأعمال الأقوياء والجديرين بالثقة إلى واقع ملموس.

لقد أمضيت السنوات الخمس الماضية منغمسًا في عالم رائع من التعلم الآلي والتعلم العميق. قادني شغفي وخبرتي إلى المساهمة في أكثر من 50 مشروعًا متنوعًا لهندسة البرمجيات ، مع التركيز بشكل خاص على الذكاء الاصطناعي / التعلم الآلي. جذبني فضولي المستمر أيضًا نحو معالجة اللغة الطبيعية ، وهو مجال أتوق لاستكشافه بشكل أكبر.