الذكاء الاصطناعي

الأضرار الناجمة عن تعديل نموذج الذكاء الاصطناعي يمكن استردادها بسهولة، وفقًا للاكتشافات البحثية

Published October 1, 2024

Updated April 27, 2026

Martin Anderson

AI-generated image from ChatGPT. Prompt: ' a photorealistic panoramic image of a scientist in a white coat, wearing protective soldering goggles, who is soldering circuitry in an open panel of the underside of a massive and high-tech computer system. Photorealistic, gorgeous, UHQ'

تشير الأبحاث الجديدة من الولايات المتحدة إلى أن تعديل نموذج الذكاء الاصطناعي على بياناتك الخاصة لا يلزم أن يخفض أو يضر بالوظائف الأصلية للنموذج – وأن إصلاحًا بسيطًا نسبيًا يمكن أن يستعد ليس فقط القدرات الأصلية للنموذج، ولكن أيضًا تحسين جودة الإخراج الذي تحاول الحصول عليه من النموذج (المدرّب مسبقًا).

مكاسب الأداء على نماذج متنوعة مع تعديل ما بعد التدريب الجديد للمؤلفين. مزيد من التفاصيل لاحقًا في المقال. مصدر: http://export.arxiv.org/pdf/2409.16223

الآثار المترتبة على هذا هي كبيرة، ليس فقط للشركات التقنية الكبيرة التي تتركز اهتماماتها على المكافآت المالية لاستئجار أنظمة مولدة “كخدمة”، ولكن أيضًا على عدد متزايد من هواة “قطع الكابل” الذين يحملون وتعديل نماذج مفتوحة المصدر، حتى يتمكنوا من الوصول إلى أنظمة كتابة وتصوير/فيديو ذكية مخصصة بأقل تكلفة – وأقل قيودًا.

يصر مؤلفو الورقة على عدم خوفهم من إظهار حماسهم لإمكانيات طريقةهم، التي تشكل تقدمًا كبيرًا على الورقة المقدمة في عام 2023 نقل هولستي: نحو تعديل دقيق غير مدمر مع بيانات الهدف الجزئية (المشاركة مع العديد من المساهمين في الورقة الجديدة).

ويقولون:

‘الاكتشافات مشجعة وتملك آثارًا عميقة! إنها تشير إلى أن تعديلًا بسيطًا بعد المعالجة يمكن أن يعالج بشكل потенسيال دقة النموذج المعدلة على الطبقات الغائبة، وإعادة القدرات الأصلية للنموذج المُدرَّب مسبقًا، مع الكشف عن تحسين جودة الميزة على جميع الطبقات.’

سننظر إلى العمل الجديد قريباً. أولاً، دعونا نرى ما هو المشكلة التي يهدف إلى حلها.

لماذا يهم الأمر

حدثت أول موجة من تعديل دقيق على نطاق واسع في أعقاب إصدار Stable Diffusion نموذج نص-صورة في أغسطس 2002. تم إتاحة النماذج الأولى، التي تم تدريبها على جزء من مجموعة LAION الهائلة، لأي شخص يمكنه تحميلها.

然而، كان المستخدمون الذين يريدون إدراج محتوى محدد (مثل هوياتهم أو أساليب الفن أو تمثيل المشاهير) في الخصائص المولدة غير العادية ل Stable Diffusion يتعين عليهم اللجوء إلى تقنيات مثل DreamBooth – وهو استقراء لطريقة تخصيص Google Research، التي تسمح للمستخدم بتدريب بيانات جديدة إلى النموذج المتاح بحرية، من خلال تعديل دقيق.

<img class=" wp-image-206845" src="https://www.unite.ai/wp-content/uploads/2024/10/dreambooth-examples.jpg" alt="أمثلة على عملية المستخدم لتنفيذ DreamBooth الرسمي من Google في عام 2022. يقوم المستخدم بتحديد مجموعة صغيرة من الصور واختيار اسم فريد (الذي لا يتوفر في بيانات التدريب على Stable Diffusion) في نص-دفعات من النموذج المعدل دقيقًا. مصدر: https://dreambooth.github.io/” width=”968″ height=”305″ /> أمثلة على عملية المستخدم لتنفيذ DreamBooth الرسمي من Google في عام 2022. يقوم المستخدم بتحديد مجموعة صغيرة من الصور واختيار اسم فريد (الذي لا يتوفر في بيانات التدريب على Stable Diffusion) في نص-دفعات من النموذج المعدل دقيقًا. مصدر: https://dreambooth.github.io/

بهذه الطريقة، كان من الممكن الحصول على نسخة من النموذج التي كانت جيدة جدًا في إنشاء شخص معين، أو أسلوب فني مخصص، ولكن التي كانت الآن ‘مُتضررة’ للاستخدام العام.

هذا يعني أنك إذا كنت تريد تعديل Stable Diffusion حتى يتمكن من تصوير ثلاثة أشخاص مختلفين بدقة، كنت بحاجة إلى إنشاء ثلاثة نماذج مختلفة، كل منها حوالي 2-4 جيجابايت، أو أكثر.

أي محاولة لتعديل هذه النماذج مرة ثانية لن تؤدي فقط إلى تدهور الأداء العام للنموذج بشكل أكبر، ولكن سوف تؤثر سلبًا على الإخراج من الجلسة السابقة لتعديل دقيق.

في أي حال، سوف تنتشر نماذج DreamBooth للشخصيات المشهورة قريباً على الإنترنت، وتجتمع في الغالب في مجال civit.ai. في النهاية، سوف تتجاوز طرق أقل تعقيدًا مثل التكيف منخفض الرتبة (LoRA) تعديل دقيق في الشعبية (على الرغم من أن إخراج LoRA قد يكون فعالًا مثل تعديل دقيق كامل، يبقى مثيرًا للجدل، وقد قام NVIDIA بمشاركة نهج يبدو أكثر فعالية يسمى DoRA).

يصنف LoRA تحت فئة تعديل دقيق فعال للparameters (PEFT)، الذي يؤثر فقط على جزء من معاملات النموذج المُدرَّب.

أراد بعض المستخدمين تغيير الطبيعة الأساسية لنقاط التأكد من Stable Diffusion المفتوحة المصدر، من خلال تعديل دقيق عليها على آلاف الصور.

هذا، بشكل فعال، أنتج نموذجًا أساسيًا بديلًا، مخصصًا لما كان المستخدم يحاول تدريبه (مثل أسلوب فني معين). لهذا الغرض، كانت الطرق “الخفيفة” مثل LoRA أقل فعالية، لأن معاملات النموذج احتاجت إلى انحياز شديد نحو بيانات التدريب الجديدة.

محادثة محلية

مع الارتفاع الأخير في الاهتمام بنماذج اللغة الكبيرة (LLM)، بدأ المستخدمون الذين يرغبون في تجنب المخارج المتزايدة (والتي ترتبط بالتكاليف) لخدمات مثل ChatGPT، ي开始ون تحميل وتعديل نماذج مفتوحة المصدر فعالة مثل Llama 3، من بين أخرى.

هنا أيضاً، يمكن استخدام LoRAs بدلاً من تعديل دقيق للنقاط الثابتة الكاملة. لقد ادعينا من قبل أن تعديل دقيق هو طريقة أفضل لإنتاج نماذج LLM مُعدلة لاحتياجات المستخدم الخاصة. على الرغم من أن تعديل دقيق قد يحتاج إلى متطلبات أجهزة أكبر وربما يستغرق وقتًا أطول، إلا أنه يقدم تعميمًا أعمق للبيانات الجديدة التي يريد المستخدم أن يدمجها النموذج.

المشكلة في تعديل دقيق هو أنه عملية تدميرية لا يمكن تدريبها بشكل متزايد على بيانات إضافية في وقت لاحق، كما لاحظنا أعلاه.

الميزات والانحيازات التي يتم حقنها في النموذج يبدو أنها تُزعج التوازن الأصلي لمعاملات البيانات، مما يعني أن النموذج إما أكثر احتمالاً لتعكس بيانات المستخدم المُساهمة، أو سوف يؤدي أسوأ بشكل عام من النموذج الأساسي (في المهام غير المرتبطة بالبيانات الجديدة).

يمكن علاج ذلك، إلى حد ما، من خلال تجميد أجزاء معينة من النموذج أثناء التدريب؛ لكن هذا يمكن أن يؤدي إلى تدهور الوظائف العامة، لأن الجزء المجمد من الهيكل قد لا يُعمم جيدًا للبيانات المُعدلة دقيقًا الجديدة داخل مساحة النموذج الكامنة.

سيكون من الرائع إذا كان هناك طريقة أسهل للحفاظ على القدرات الأصلية لنموذج معدل دقيق، مع الحفاظ على قدرة النموذج على إنتاج إخراج يستند إلى بيانات تعديل دقيق.

takové التطور سيكون مفيدًا عبر نطاق المستخدمين المحتملين، من الهواة والمبتدئين الذين يستخدمون نماذج LLM محلية وأشكال أخرى من النماذج المولدة، حتى مستوى FAANG (حيث يمكن تحسين نموذج الذكاء الاصطناعي المكلف جدًا بشكل متكرر وعدم تدميره، دون تكلفة بدء التدريب مرة أخرى مع البيانات الإضافية).

تعديل ما بعد المعالجة

هذا يأتي بنا إلى الورقة الجديدة، التي تسمى تعديل دقيق هو جيد، إذا تم تعديله، ويأتي من 11 باحثًا عبر جامعة ولاية أوهايو، وجامعة ويسكونسن ماديسون، ومعهد رينسيلار للفنون والعلوم.

كان الباحثون يحاولون معرفة ما يتم تدميره في نموذج أساسي عند تعديله دقيقًا. وقد أستنتجوا أن الفرق الرئيسي بين نموذج “قبل وبعد” هو أن مقاييس اللوجيت عبر فئات تعديل دقيق والفئات الأصلية في النموذج تظهر اختلافًا كبيرًا.

تربط الروابط اللوجيت احتمالية النجاح في عملية الانحدار اللوجستي، وتحول القيم المقدرة (التي قد تكون دقيقة جدًا) إلى صفر أو واحد.

وجد المؤلفون ليس فقط أن هذا العجز يمكن عكسه بشكل تقريبي بواسطة تقنية تعديل، ولكن أن هذا الإصلاح بعد الحادث يحسن بشكل فعلي جودة الإخراج لبيانات تعديل دقيق. وبالتالي، مع هذه التقنية، لا تحصل فقط على القدرات الأصلية للنموذج الأساسي، ولكن تحصل على دمج أفضل لبيانات تعديل دقيق الخاصة بك.

(على الرغم من أن الورقة لا تدرس احتمال ذلك، فإن هذه التقنية تشير إلى أن النموذج يمكن تعديله دقيقًا عدة مرات، ويظل فعالًا)

يناقشون اكتشافاتهم في تحقيق الأضرار التي لحقت بالنموذج بعد تعديل دقيق:

‘لدينا مفاجأة، نجد أن النموذج المعدل دقيقًا لا ينسى العلاقة بين الطبقات الأخرى ولا يُدهور الميزات لت 認ITION هذه الطبقات. ‘

‘بدلاً من ذلك، غالبًا ما ينتج النموذج المعدل دقيقًا ميزات تمييزية أكثر لطبقات أخرى، حتى لو كانت غائبة أثناء تعديل دقيق! ‘

‘ما يضر حقًا بالدقة هو مقاييس اللوجيت غير المتسقة بين فئات تعديل دقيق والفئات الأخرى، مما يشير إلى أن تعديلًا بسيطًا بعد المعالجة يمكن أن يستعيد القدرة الأصلية للنموذج المُدرَّب مسبقًا، وفي الوقت نفسه يكشف عن تحسين الميزة على جميع الطبقات.’

لقد جعل المؤلفون نتائج اختباراتهم لهذه النظرية قابلة للتكرار في مستودع GitHub.

وجدوا أن الجزء الوحيد من هيكل نموذج الأساس الذي يتم تدميره في تعديل دقيق هو المنصف الثنائي، الذي يصنف الخاطئ الطبقات التي تكون غائبة في النموذج الأصلي كفئات تعديل دقيق.

تُذكر الورقة:

‘من خلال إضافة عامل تحيز للتكيف إلى جميع لوجيتات الطبقات الغائبة [4, 40 ]، يمكن للنموذج المعدل دقيقًا استعادة بنجاح دقة الطبقات الغائبة وتحقيق تحسين جيد في المجال التالي.’

‘الأداء الناتج يفوق حتى خط قاعدة قوي [نقل هولستي – الورقة التي تبني عليها هذه الورقة] في العديد من البنود، بما في ذلك ImageNet ومتغيراتها [ImageNet، ImageNet-R(endition )، ImageNet-S(ketch) ]، Office-Home، و VTAB، بدون تدريب معقد وإعداد معاملات超.’

النتائج من الورقة: نموذج معدل دقيق الذي تم إجراء تعديل ما بعد المعالجة عليه يمكن، حسب قول المؤلفين، أن يتفوق على نهج الدولة الفنية في المشكلة.

يصنف المؤلفون الأداء المحسن لنموذج معدل دقيق مع تعديل ما بعد المعالجة على أنه “سلوك غير ضار غير متوقع”، ويشير إلى أنه عند استخدام محسّن الانحدار اللوجستي العشوائي (SGD) الأساسي، يتم الحصول على نتيجة أفضل من المحسّنات الشائعة الحالية، مثل Adam.

‘مع ذلك،’ يشيرون إلى ‘مع معدلات学习 وweight decay صغيرة بدرجة كافية، يظهر السلوك غير الضار ويستمر.’

إصلاحات طفيفة

为了 إصلاح التناقضات في اللوجيت الناتجة عن تعديل دقيق، استخدم المؤلفون تقنية من التعلم من الصفر، بإضافة عامل ثابت إلى لوجيتات جميع الطبقات الغائبة. هذا يؤدي إلى قاعدة تصنيف جديدة.

يشير المؤلفون إلى أن هذه العملية “تُشجع” الطبقات الغائبة المهملة إلى نفس جودة التنبؤ للفئات المعدلة دقيقًا، مما يستعيد الأداء الأصلي ويفهم الأداء لبيانات “المضافة” في وقت الاستدلال.

في الاختبارات، استعاد تقنية ما بعد التعديل الأداء لنماذج معدلة دقيقًا متنوعة. يشير ‘Oracle’ المذكور في الجدول إلى تصنيف معدل دقيق يأخذ في الاعتبار أيضًا بيانات الطبقات الغائبة.

يلاحظون أيضًا أن تعديل ما بعد المعالجة “يمكن تطبيقه بشكل محتمل على أي نموذج”، وأن الأساليب التي تسعى إلى الحفاظ على سلامة نموذج الأساس من خلال تجميد الطبقات (مثل التصنيف والهيكل) تُحصل على نتائج سيئة بالمقارنة مع نهجهم المقترح.

الختام

الاكتشافات من هذا التعاون تبدو مهمة. تدريب نموذج الذكاء الاصطناعي على مجموعة بيانات هائلة هو التزام巨م، مشابه لانطلاق طائرة ركاب. على الرغم من أن التدريب يمكن انقطاعه، ويمكن تخفيف الأضرار عن طريق حفظ معاملات النموذج بشكل دوري (بكلفة تخزين كبيرة)، لتمكين الانقطاعات في التدريب، هناك القليل الذي يمكن فعله لتعديل النتيجة بعد الإطلاق.

ما يثير الإعجاب في العمل هو أن الباحثين يبدو أنهم اكتشفوا مبدأ أساسي في تدريب نموذج الذكاء الاصطناعي العام، وأن حلولهم بسيط جدًا.

الآثار الاقتصادية لاستعادة دقة نموذج الأساس بعد تعديل دقيق هي أيضًا كبيرة. حتى الآن، كان الأسلوب الأكثر شيوعًا لمعالجة عيوب النماذج التي تبلغ قيمتها مليارات الدولارات هو تصفية الإخراج في وقت الاستدلال، أو التحكم في الاستدلال لتفادي أي عيوب واضحة في النموذج.

بالإضافة إلى ذلك، يمكن أن يُحسن هذا الأسلوب من قدرات نماذج مولدة معدلة دقيقًا على مستوى المستهلك، مع مكافأة لتحسين جودة الإخراج.

* تحويلي لمراجع المؤلفين الداخلية إلى روابط.

نُشر لأول مرة يوم الثلاثاء، 1 أكتوبر 2024

Martin Anderson

كاتب في تعلم الآلة، متخصص في مجال 합성 الصور البشرية. السابق رئيس محتوى البحث في Metaphysic.ai.
الsite الشخصي: martinanderson.ai
التواصل: [email protected]
تويتر: @manders_ai