الذكاء الاصطناعي 101

نماذج الانتشار في الذكاء الاصطناعي – كل ما تحتاج إلى معرفته

mm
A collage of human faces created using AI image generator

في نظام الذكاء الاصطناعي، تعتبر نماذج الانتشار مسؤولة عن تحديد اتجاه وتيرة التقدم التكنولوجي. إنها ثورة في الطريقة التي ننظر بها إلى المهام المعقدة لإنشاء الذكاء الاصطناعي. تعتمد هذه النماذج على الرياضيات المبنية على مبادئ غاوسية، والتباين، والمعادلات التفاضلية، والتركيبات التوليدية. (سوف ن объясن المصطلحات الفنية أدناه)

المنتجات والحلول الحديثة التي طورتها شركات مثل Nvidia و Google و Adobe و OpenAI، قد وضعت نماذج الانتشار في قلب الضوء. DALL.E 2 و Stable Diffusion و Midjourney هي أمثلة بارزة على نماذج الانتشار التي تجعل الجولة على الإنترنت في الآونة الأخيرة. يمكن للمستخدمين تقديم نص بسيط كمدخل، ويمكن لهذه النماذج تحويله إلى صور واقعية، مثل الصورة الموضحة أدناه.

صورة تم إنشاؤها باستخدام Midjourney v5 باستخدام مدخل نصي: زهور الكاليفورنيا المتوهجة.

صورة تم إنشاؤها باستخدام Midjourney v5 باستخدام مدخل نصي: زهور الكاليفورنيا المتوهجة. مصدر: Midjourney

دعونا نستكشف المبادئ الأساسية لعمل نماذج الانتشار وكيف أنها تغير الاتجاهات والقواعد في العالم كما نراه اليوم.

ما هي نماذج الانتشار؟

وفقًا للنشر البحثي “نماذج الانتشار الاحتمالية للتخفيض،” تعرف نماذج الانتشار على أنها:

“نموذج انتشار أو نموذج انتشار احتمالي هو سلسلة ماركوف المعلمة التي يتم تدريبها باستخدام الاستدلال المتغير لإنشاء عينات مطابقة للبيانات بعد وقت محدد”

ببساطة، يمكن لنماذج الانتشار إنشاء بيانات مشابهة لتلك التي يتم تدريبها عليها. إذا تم تدريب النموذج على صور القطط، فيمكنه إنشاء صور واقعية مشابهة للقطط.

الآن دعونا نحاول كسر التعريف الفني المذكور أعلاه. تأخذ نماذج الانتشار الإلهام من مبدأ العمل والأساس الرياضي لنماذج احتمالية يمكن تحليلها وتوقع سلوك نظام يتغير مع الوقت، مثل توقع عائد السوق المالي أو انتشار الوباء.

التعريف يذكر أنهم سلسلة ماركوف المعلمة التي يتم تدريبها باستخدام الاستدلال المتغير. سلسلة ماركوف هي نماذج رياضية تحدد نظامًا يمكن أن ينتقل بين حالات مختلفة مع مرور الوقت. الحالة الحالية للنظام فقط يمكن أن تحدد احتمال الانتقال إلى حالة معينة. بعبارة أخرى، الحالة الحالية للنظام تحتوي على الحالات الممكنة التي يمكن للنظام اتباعها أو الحصول عليها في أي وقت معين.

تدريب النموذج باستخدام الاستدلال المتغير يتضمن حسابات معقدة لتقدير التوزيعات الاحتمالية. يهدف إلى العثور على المعلمات الدقيقة لسلسلة ماركوف التي تطابق البيانات الملاحظة (المعروفة أو الفعلية) بعد وقت معين. هذا يعمل على تقليل قيمة دالة الخسارة للنموذج، والتي هي الفرق بين الحالة المتوقعة (المجهولة) والبيانات الملاحظة (المعروفة).

بعد التدريب، يمكن للنموذج إنشاء عينات مطابقة للبيانات الملاحظة. هذه العينات تمثل مسارات أو حالات يمكن للنظام اتباعها أو الحصول عليها مع مرور الوقت، وكل مسار له احتمال مختلف لحدوثه. وبالتالي، يمكن للنموذج توقع سلوك النظام في المستقبل من خلال إنشاء مجموعة من العينات وإيجاد احتمالاتها tương ứng.

كيف تفسر نماذج الانتشار في الذكاء الاصطناعي؟

نماذج الانتشار هي نماذج توليدية sâuة تعمل عن طريق إضافة الضوضاء (الضوضاء الغاوسية) إلى البيانات المتاحة للتدريب (المعروفة باسم عملية الانتشار الأمامية) ثم عكس العملية (المعروفة باسم عملية التخفيض أو الانتشار العكسي) لاستعادة البيانات. يتعلم النموذج تدريجياً إزالة الضوضاء. عملية التخفيض هذه المكتسبة تولد صورًا جديدة عالية الجودة من بذور عشوائية (صور ضوئية ملوثة بالضوضاء)، كما هو موضح في الرسم التوضيحي أدناه.

عملية الانتشار العكسي: صورة ملوثة بالضوضاء يتم تنظيفها لاستعادة الصورة الأصلية (أو إنشاء متغيراتها) من خلال نموذج انتشار مدرب.

عملية الانتشار العكسي: صورة ملوثة بالضوضاء يتم تنظيفها لاستعادة الصورة الأصلية (أو إنشاء متغيراتها) من خلال نموذج انتشار مدرب. مصدر: نماذج الانتشار الاحتمالية للتخفيض

3 فئات من نماذج الانتشار

هناك ثلاثة إطارات رياضية أساسية تؤسس العلوم وراء نماذج الانتشار. تعمل جميعها على نفس المبادئ لإضافة الضوضاء ثم إزالتها لإنشاء عينات جديدة. دعونا نناقشها أدناه.

نموذج انتشار يضيف ويزيل الضوضاء من صورة.

نموذج انتشار يضيف ويزيل الضوضاء من صورة. مصدر: نماذج الانتشار في الرؤية: مسح

1. نماذج الانتشار الاحتمالية للتخفيض (DDPMs)

كما هو موضح أعلاه، DDPMs هي نماذج توليدية تستخدم في الغالب لإزالة الضوضاء من البيانات البصرية أو الصوتية. أظهرت نتائج مثيرة على مختلف مهام إزالة الضوضاء للصور والصوت. على سبيل المثال، تستخدم صناعة صناعة الأفلام أدوات معالجة الصور والفيديو الحديثة لتحسين جودة الإنتاج.

2. نماذج التوليد القائمة على التقييم المُشروط بالضوضاء (SGMs)

SGMs يمكنها توليد عينات جديدة من توزيع معين. تعمل عن طريق تعلم دالة تقييم تساعد على تقدير كثافة اللوغاريتم للتوزيع الهدف. يفترض تقدير الكثافة اللوغاريتمية وجود نقاط بيانات متاحة التي هي جزء من مجموعة اختبار غير معروفة. يمكن لهذه دالة التقييم بعد ذلك توليد نقاط بيانات جديدة من التوزيع.

على سبيل المثال، الصور المزيفة مشهورة بإنشاء فيديوهات وأudios مزيفة لأشخاص مشهورين. ومع ذلك، فإن معظمها يُعزى إلى الشبكات التوليدية المعادية. ومع ذلك، أظهرت SGMs قابليات مماثلة – في بعض الأحيان تفوق – في توليد وجوه مشهورة عالية الجودة. بالإضافة إلى ذلك، يمكن أن تساعد SGMs في توسيع مجموعات البيانات الصحية، والتي لا تكون متاحة بكميات كبيرة بسبب اللوائح والقواعد الصارمة.

3. المعادلات التفاضلية العشوائية (SDEs)

SDEs تصف التغيرات في العمليات العشوائية المتعلقة بالزمن. وهي تستخدم على نطاق واسع في الفيزياء والأسواق المالية التي تتضمن عوامل عشوائية تؤثر بشكل كبير على النتائج السوقية.

على سبيل المثال، أسعار السلع متحركة للغاية وتتأثر بعوامل عشوائية مختلفة. SDEs يمكنها حساب المشتقات المالية مثل عقود المستقبل (مثل عقود النفط). يمكنها نمذجة التقلبات وحساب الأسعار بدقة لتوفير شعور بالأمان.

التطبيقات الرئيسية لنماذج الانتشار في الذكاء الاصطناعي

دعونا نلقي نظرة على بعض الممارسات والتطبيقات الشائعة لنماذج الانتشار في الذكاء الاصطناعي.

توليد الفيديوهات عالية الجودة

إنشاء فيديوهات عالية الجودة باستخدام الذكاء الاصطناعي العميق هو تحدي بسبب الحاجة إلى استمرارية عالية للفيديو. यह هو المكان الذي يأتي فيه نماذج الانتشار مفيدة لأنها يمكن أن تولد مجموعة فرعية من إطارات الفيديو لملء الإطارات المفقودة، مما يؤدي إلى فيديوهات عالية الجودة وأمooth بدون تأخير.

طور الباحثون نموذج الانتشار المرن ونموذج الانتشار المتبقي للفيديو لخدمة هذا الغرض. يمكن لهذه النماذج أيضًا إنتاج فيديوهات واقعية عن طريق إضافة إطارات توليدت بواسطة الذكاء الاصطناعي بين الإطارات الفعلية بسلاسة.

يمكن لهذه النماذج ببساطة توسيع معدل الإطارات في الثانية (FPS) لفيلم فيديو منخفض الإطارات عن طريق إضافة إطارات وهمية بعد تعلم الأنماط من الإطارات المتاحة. بدون فقدان الإطارات تقريبًا، يمكن لهذه الإطارات مساعدة نماذج الذكاء الاصطناعي القائمة على التعلم العميق لتوليد فيديوهات توليدت بواسطة الذكاء الاصطناعي من الصفر والتي تبدو مثل لقطات طبيعية من كاميرات عالية الجودة.

هناك مجموعة واسعة من مولدات الفيديو الذكية المذهلة المتاحة في عام 2023 لجعل إنتاج ومونتاج المحتوى السينمائي سريعًا وبسيطًا.

توليد الصور من النص

نماذج الصور من النص تستخدم مدخلات النص لإنشاء صور عالية الجودة. على سبيل المثال، عند تقديم مدخل “تفسير تفاح أحمر على طبق” وإنشاء صورة واقعية لتفاح على طبق. الانتشار المخلوط و unCLIP هما مثالين بارزين على نماذج يمكنها إنشاء صور ذات صلة و دقة عالية بناءً على مدخلات المستخدم.

كما أن GLIDE بواسطة OpenAI هو حل آخر مشهور تم إصداره في عام 2021 ويمكنه إنتاج صور واقعية باستخدام مدخلات المستخدم. بعد ذلك، أصدرت OpenAI DALL.E-2، نموذجها الأكثر تقدمًا لتوليد الصور حتى الآن.

كما طوّرت Google نموذجًا لإنشاء الصور يُعرف باسم Imagen، والذي يستخدم نموذج لغة كبير لتحقيق فهم عميق للنص المدخل ثم توليد صور واقعية.

لقد ذكرنا أدوات توليد الصور الشهيرة الأخرى مثل Midjourney و Stable Diffusion (DreamStudio) أعلاه. انظر إلى صورة تم إنشاؤها باستخدام Stable Diffusion أدناه.

صورة تم إنشاؤها باستخدام Stable Diffusion 1.5 باستخدام مدخل نصي: لوحات من واجهات ثوم يورك القديمة.

صورة تم إنشاؤها باستخدام Stable Diffusion 1.5 باستخدام مدخل نصي: لوحات من واجهات ثوم يورك القديمة.

نماذج الانتشار في الذكاء الاصطناعي – ماذا يمكننا توقعَه في المستقبل؟

أظهرت نماذج الانتشار إمكانات واعدة كنهج قوي لإنشاء عينات عالية الجودة من مجموعات بيانات الصور والفيديو المعقدة. من خلال تحسين القدرة البشرية على استخدام وتنقيح البيانات، يمكن لنماذج الانتشار أن تغير العالم كما نراه اليوم. يمكننا توقع رؤية المزيد من التطبيقات لنماذج الانتشار التي تصبح جزءًا لا يتجزأ من حياتنا اليومية.

مع ذلك، نماذج الانتشار ليست التقنية الوحيدة لتوليد الذكاء الاصطناعي. يستخدم الباحثون أيضًا الشبكات التوليدية المعادية، والمتغيرات التوليدية، والنماذج التوليدية القائمة على التدفق لإنشاء محتوى الذكاء الاصطناعي. يمكن فهم الخصائص الأساسية التي تميز نماذج الانتشار عن النماذج التوليدية الأخرى أن يساعد في إنتاج حلول أكثر فعالية في الأيام القادمة.

للمزيد من المعلومات حول التكنولوجيا القائمة على الذكاء الاصطناعي، قم بزيارة Unite.ai. انظر إلى مواردنا المحددة حول أدوات الذكاء الاصطناعي التوليدية أدناه.

Haziqa هي عالمة بيانات ذات خبرة واسعة في كتابة المحتوى الفني لشركات الذكاء الاصطناعي والبرمجيات كخدمة.