الذكاء الاصطناعي

التعلم العميق مقابل التعلم المعزز

تحديث on ٣ فبراير ٢٠٢٤

التعلم العميق والتعلم المعزز هما من أكثر مجموعات الذكاء الاصطناعي شيوعًا. الذكاء الاصطناعي السوق كان حوالي 120 مليار دولار في عام 2022 ويزداد بمعدل نمو سنوي مركب محير للعقل فوق 38 ٪. مع تطور الذكاء الاصطناعي ، تم استخدام هذين النهجين (RL و DL) لحل العديد من المشكلات ، بما في ذلك التعرف على الصور والترجمة الآلية واتخاذ القرار للأنظمة المعقدة. سوف نستكشف كيف يعملون جنبًا إلى جنب مع تطبيقاتهم وقيودهم واختلافاتهم بطريقة سهلة الفهم.

ما هو التعلم العميق (DL)؟

التعلم العميق هو مجموعة فرعية من التعلم الآلي الذي نستخدم فيه الشبكات العصبية للتعرف على الأنماط في البيانات المقدمة للنمذجة التنبؤية للبيانات غير المرئية. يمكن أن تكون البيانات جدولية أو نصية أو صورة أو كلامًا.

ظهر التعلم العميق في الخمسينيات من القرن الماضي عندما كتب فرانك روزنبلات ورقة بحثية عن Perceptron في عام 1950. كان Perceptron أول بنية شبكة عصبية يمكن تدريبها لأداء مهام التعلم الخطي تحت الإشراف. بمرور الوقت ، أدى البحث في هذا المجال ، وتوافر الكم الهائل من البيانات ، والموارد الحسابية الشاملة إلى زيادة هدير مجال التعلم العميق.

كيف يعمل التعلم العميق؟

الشبكة العصبية هي اللبنة الأساسية للتعلم العميق. الدماغ البشري يلهم الشبكة العصبية. يحتوي على العقد (الخلايا العصبية) التي تنقل المعلومات. تتكون الشبكة العصبية من ثلاث طبقات:

طبقة الإدخال
طبقة مخفية
طبقة الإخراج.

تستقبل طبقة الإدخال البيانات التي يقدمها المستخدم وتمررها إلى الطبقة المخفية. تقوم الطبقة المخفية بإجراء تحويل غير خطي على البيانات ، وتعرض طبقة المخرجات النتائج. يتم حساب الخطأ بين التنبؤ عند طبقة المخرجات والقيمة الفعلية باستخدام دالة الخسارة. تستمر العملية بشكل متكرر حتى يتم تقليل الخسارة.

الشبكة العصبية

أنواع بنيات التعلم العميق

هناك أنواع مختلفة من معماريات الشبكات العصبية ، مثل:

الشبكات العصبية الاصطناعية (ANN)
الشبكات العصبية التلافيفية (CNN)
الشبكات العصبية المتكررة (رن)
شبكات الخصومة التوليدية (GAN) ، إلخ.

يعتمد استخدام بنية الشبكة العصبية على نوع المشكلة قيد الدراسة.

تطبيقات التعلم العميق

يجد التعلم العميق تطبيقاته في العديد من الصناعات.

في الرعاية الصحية، يمكن استخدام الأساليب القائمة على الرؤية الحاسوبية التي تستخدم الشبكات العصبية التلافيفية تحليل الصور الطبية، على سبيل المثال ، التصوير المقطعي والتصوير بالرنين المغناطيسي.
في القطاع المالي ، يمكنه التنبؤ بأسعار الأسهم واكتشاف الأنشطة الاحتيالية.
طرق التعلم العميق في معالجة اللغات الطبيعية تستخدم في الترجمة الآلية ، وتحليل المشاعر ، وما إلى ذلك.

حدود التعلم العميق

على الرغم من أن التعلم العميق قد حقق أحدث النتائج في العديد من الصناعات ، إلا أن له حدوده ، وهي كما يلي:

بيانات ضخمة: يتطلب التعلم العميق كمية هائلة من البيانات المصنفة للتدريب. سيعطي نقص البيانات المصنفة نتائج دون المستوى.
تستغرق وقتًا طويلاً: قد يستغرق التدريب على مجموعة البيانات ساعات وأحيانًا أيامًا. يتضمن التعلم العميق الكثير من التجارب للوصول إلى المعيار المطلوب أو تحقيق نتائج ملموسة ، ويمكن أن يؤدي الافتقار إلى التكرار السريع إلى إبطاء العملية.
الموارد الحسابية: يتطلب التعلم العميق موارد حسابية مثل GPUs و TPUs للتدريب. تشغل نماذج التعلم العميق مساحة كبيرة بعد التدريب ، مما قد يمثل مشكلة أثناء النشر.

ما هو التعلم المعزز (RL)؟

التعلم المعزز ، من ناحية أخرى ، هو مجموعة فرعية من الذكاء الاصطناعي حيث يقوم الوكيل بتنفيذ إجراء على بيئته. يحدث "التعلم" بمكافأة الوكيل عندما يتعرض للسلوك المرغوب ومعاقبته بطريقة أخرى. من خلال الخبرة ، يتعلم الوكيل السياسة المثلى لتعظيم المكافأة.

تاريخيًا ، تلقى التعلم المعزز الأضواء في الخمسينيات والستينيات من القرن الماضي لأن خوارزميات صنع القرار تم تطويرها للأنظمة المعقدة. لذلك ، أدى البحث في هذا المجال إلى خوارزميات جديدة مثل Q-Learning و SARSA والممثل الناقد ، مما عزز التطبيق العملي للمنطقة.

تطبيقات التعلم المعزز

التعلم المعزز له تطبيقات بارزة في جميع الصناعات الرئيسية.

الروبوتات هو أحد أكثر التطبيقات شهرة في التعلم المعزز. باستخدام أساليب التعلم المعزز ، نسمح للروبوتات بالتعلم من البيئة وأداء المهمة المطلوبة.
يستخدم التعلم المعزز لتطوير محركات لألعاب مثل Chess and Go. تم تطوير AlphaGo (محرك Go) و AlphaZero (محرك الشطرنج) باستخدام التعلم المعزز.
في مجال التمويل ، يمكن أن يساعد التعلم المعزز في إجراء تجارة مربحة.

حدود التعلم المعزز

البيانات الضخمة: يتطلب التعلم المعزز قدرًا كبيرًا من البيانات والخبرة لتعلم السياسة المثلى.
استغلال المكافأة: من المهم الحفاظ على التوازن بين استكشاف الدولة ، وتشكيل السياسة المثلى ، واستغلال المعرفة المكتسبة لزيادة المكافأة. لن يصل الوكيل إلى أفضل نتيجة إذا كان الاستكشاف دون المستوى.
السلامة: التعلم المعزز يثير مخاوف تتعلق بالسلامة إذا لم يكن نظام المكافآت مصممًا ومقيدًا بشكل مناسب.

الاختلافات البارزة

باختصار ، الاختلافات البارزة بين التعلم المعزز والتعلم العميق هي كما يلي:

تعلم عميق	تعزيز التعلم
يحتوي على عقد مترابطة ، ويحدث التعلم عن طريق تقليل الخسارة عن طريق ضبط أوزان وتحيزات الخلايا العصبية.	يحتوي على وكيل يتعلم من البيئة من خلال التفاعل معها للوصول إلى السياسة المثلى.
يُستخدم التعلم العميق في مشاكل التعلم الخاضعة للإشراف حيث يتم تصنيف البيانات. ومع ذلك، يتم استخدامه في التعلم غير الخاضع للرقابة لحالات الاستخدام مثل الكشف عن الحالات الشاذة، وما إلى ذلك.	يتضمن التعلم المعزز وكيلًا يتعلم من بيئته دون الحاجة إلى بيانات مصنفة.
تستخدم في الكشف عن الأشياء وتصنيفها ، والترجمة الآلية وتحليل المشاعر ، إلخ.	تستخدم في الروبوتات والألعاب والمركبات المستقلة.

التعلم العميق المعزز - المجموعة

ظهر التعلم المعزز العميق كتقنية جديدة تجمع بين أساليب التعزيز والتعلم العميق. أحدث محرك الشطرنج، مثل AlphaZero، هو مثال على التعلم العميق المعزز. في AlphaZero ، توظف الشبكات العصبية العميقة وظائف رياضية للوكيل لتعلم لعب الشطرنج ضد نفسه.

في كل عام ، يطور اللاعبون الكبار في السوق أبحاثًا ومنتجات جديدة في السوق. من المتوقع أن يذهلنا التعلم العميق والتعلم المعزز بأساليب ومنتجات متطورة.

هل تريد المزيد من المحتوى المرتبط بالذكاء الاصطناعي؟ يزور Unite.ai.