الذكاء الاصطناعي 101
ما هو التعلم العميق؟
التعلم العميق هو واحد من أكثر المجالات تأثيرًا وأسرعها نموًا في مجال الذكاء الاصطناعي. ومع ذلك، يمكن أن يكون الحصول على فهم直觉 للتعلم العميق صعبًا لأن مصطلح التعلم العميق يغطي مجموعة متنوعة من الخوارزميات والتقنيات. التعلم العميق هو أيضًا فرع من فروع التعلم الآلي بشكل عام، لذلك من المهم فهم ما هو التعلم الآلي من أجل فهم التعلم العميق.
ما هو التعلم الآلي؟
التعلم العميق هو امتداد لبعض المفاهيم المنبثقة من التعلم الآلي، لذلك، دعونا نتخذ لحظة لشرح ما هو التعلم الآلي.
ببساطة، التعلم الآلي هو طريقة تمكن الأجهزة من أداء مهام محددة دون كتابة كل سطر من الخوارزميات المستخدمة في إنجاز تلك المهام. هناك العديد من خوارزميات التعلم الآلي المختلفة، ولكن واحدة من أكثر الخوارزميات المستخدمة شيوعًا هي الخوارزمية متعددة الطبقات. الخوارزمية متعددة الطبقات يُطلق عليها أيضًا اسم الشبكة العصبية، وتتكون من سلسلة من العقد/الخلايا العصبية المرتبطة ببعضها. هناك ثلاث طبقات مختلفة في الخوارزمية متعددة الطبقات: طبقة الإدخال، الطبقة المخفية، وطبقة الإخراج.
تأخذ طبقة الإدخال البيانات إلى الشبكة، حيث يتم تحويلها بواسطة العقد في الطبقة الوسطى/المخفية. العقد في الطبقة المخفية هي دوال رياضية يمكنها تحويل البيانات القادمة من طبقة الإدخال، واستخراج الأنماط ذات الصلة من بيانات الإدخال. هذا هو كيف “يتعلم” الشبكة العصبية. الشبكات العصبية تحصل على اسمها من حقيقة أنها مستوحاة من هيكل ووظيفة الدماغ البشري.
الروابط بين العقد في الشبكة لها قيم تسمى الأوزان. هذه القيم هي أساسًا افتراضات حول كيفية relación بيانات في طبقة معينة مع البيانات في الطبقة التالية. مع تدريب الشبكة، يتم تعديل الأوزان، والهدف هو أن الأوزان / الافتراضات حول البيانات في النهاية تتقارب على قيم تمثل الأنماط المهمة داخل البيانات.
الدوال التنشيطية موجودة في عقد الشبكة، وتحول هذه الدوال البيانات بطريقة غير خطية، مما يمكّن الشبكة من تعلم تمثيلات معقدة للبيانات. الدوال التنشيطية تضرب القيم الإدخالية بقيم الأوزان وإضافة مصطلح انحياز.
ما هو التعلم العميق؟
التعلم العميق هو المصطلح الممنوح لعمليات التعلم الآلي التي تجمع بين العديد من الخوارزميات متعددة الطبقات، بحيث لا توجد طبقة مخفية واحدة فقط ولكن طبقات مخفية متعددة. “أعمق” الشبكة العصبية العميقة، أنماط أكثر تعقيدًا يمكن للشبكة تعلمها.
الشبكات العميقة المكونة من الخلايا العصبية يُطلق عليها أحيانًا اسم الشبكات المتوصلة بالكامل أو الطبقات المتوصلة بالكامل، مع الإشارة إلى حقيقة أن خلية عصبية معينة تحتفظ بالاتصال مع جميع الخلايا العصبية المحيطة بها. يمكن دمج الشبكات المتوصلة بالكامل مع وظائف التعلم الآلي الأخرى لإنشاء هياكل تعلم عميق مختلفة.
أنواع مختلفة من التعلم العميق
هناك العديد من هياكل التعلم العميق التي يستخدمها الباحثون والمهندسون، وكل واحدة من الهياكل المختلفة لها حالة استخدام خاصة.
شبكات العصبية التلافيفية
شبكات العصبية التلافيفية، أو CNNs، هي هيكل الشبكة العصبية الذي يُستخدم بشكل شائع في إنشاء أنظمة الرؤية الحاسوبية. هيكل شبكات العصبية التلافيفية يسمح لها بتفسير بيانات الصور، وتحويلها إلى أرقام يمكن للشبكة المتوصلة بالكامل تفسيرها. شبكة CNN لها أربعة مكونات رئيسية:
- طبقات التلافيف
- طبقات العينة/المرشح
- دوال التنشيط
- الطبقات المتوصلة بالكامل
الطبقات التلافيفية هي التي تأخذ الصور كمدخلات إلى الشبكة، وتحليل الصور، والحصول على قيم البكسل. العينة أو التصفية هي حيث يتم تحويل قيم الصور أو تقليلها لتسهيل تمثيل الصور وتقليل حساسية مرشحات الصور للضوضاء. دوال التنشيط تتحكم في كيفية تدفق البيانات من طبقة إلى أخرى، والطبقات المتوصلة بالكامل هي التي تحليل القيم التي تمثل الصور وتتعلم الأنماط الموجودة في تلك القيم.
شبكات العصبية المتكررة / LSTM
شبكات العصبية المتكررة، أو RNNs، هي شائعة في المهام التي يهم فيها ترتيب البيانات، حيث يجب على الشبكة تعلم تسلسل البيانات. RNNs تُستخدم بشكل شائع في مشاكل معالجة اللغة الطبيعية، حيث يهم ترتيب الكلمات عند فك شفرة معنى الجملة. الجزء “المتكرر” من مصطلح الشبكة العصبية المتكررة يأتي من حقيقة أن الإخراج لعنصر معين في تسلسل يعتمد على الحساب السابق بالإضافة إلى الحساب الحالي. على عكس أشكال أخرى من الشبكات العصبية العميقة، RNNs لها “ذاكرة”، والمعلومات المحسوبة في خطوات زمنية مختلفة في التسلسل تُستخدم لحساب القيم النهائية.
هناك أنواع متعددة من RNNs، بما في ذلك RNNs ثنائية الاتجاه، التي تأخذ في الاعتبار عناصر التسلسل المستقبلية بالإضافة إلى العناصر السابقة، عند حساب قيمة عنصر. نوع آخر من RNNs هو الذاكرة القصيرة الأمد / LSTM. LSTMs هي أنواع من RNNs يمكنها التعامل مع سلاسل بيانات طويلة. RNNs العادية قد تتعرض لمشكلة “انفجار التدرج”. هذه القضية تحدث عندما يصبح سلسلة بيانات الإدخال طويلة جدًا، ولكن LSTMs لها تقنيات لمكافحة هذه المشكلة.
الترميز التلقائي
معظم هياكل التعلم العميق المذكورة حتى الآن تُستخدم في مشاكل التعلم الإشرافي، بدلاً من مهام التعلم غير الإشرافي. الترميز التلقائي يمكنه تحويل البيانات غير الإشرافية إلى تنسيق إشرافي، مما يسمح للشبكات العصبية بالعمل على المشكلة.
الترميز التلقائي يُستخدم بشكل متكرر لاكتشاف الشذوذ في مجموعات البيانات، وهو مثال على التعلم غير الإشرافي حيث أن طبيعة الشذوذ غير معروفة. أمثلة على اكتشاف الشذوذ تشمل اكتشاف الاحتيال للمؤسسات المالية. في هذا السياق، الغرض من الترميز التلقائي هو تحديد قاعدة من الأنماط العادية في البيانات وتحديد الشذوذ أو المخالفات.
هيكل الترميز التلقائي غالبًا ما يكون متناظرًا، مع طبقات مخفية مصفوفة بحيث ي似 الإخراج الإدخال. هناك أربعة أنواع من الترميز التلقائي التي تُستخدم بشكل متكرر:
- الترميز التلقائي العادي
- الترميز التلقائي المتعدد الطبقات
- الترميز التلقائي التلافيفي
- الترميز التلقائي المنظم
الترميز التلقائي العادي هو شبكات عصبية ذات طبقة مخفية واحدة، بينما الترميز التلقائي المتعدد الطبقات هو شبكات عميقة ذات أكثر من طبقة مخفية. الترميز التلقائي التلافيفي يستخدم طبقات تلافيفية بدلاً من الطبقات المتوصلة بالكامل، أو بالإضافة إليها. الترميز التلقائي المنظم يستخدم نوعًا معينًا من دالة الخسارة التي تتيح للشبكة العصبية أداء وظائف أكثر تعقيدًا، وظائف أخرى غير مجرد نسخ الإدخالات إلى الإخراج.
شبكات التوليد التبادلية
شبكات التوليد التبادلية (GANs) هي في الواقع شبكات عصبية عميقة متعددة بدلاً من شبكة واحدة. يتم تدريب نموذجين من التعلم العميق في نفس الوقت، ويتم إطعام مخرجاتهم إلى الشبكة الأخرى. الشبكات في منافسة مع بعضها البعض، ومنذ أن يحصلون على بيانات الإخراج من بعضهم البعض، كلاهما يتعلم من هذه البيانات ويتحسن. الشبكات في الأساس تلعب لعبة التزوير والكشف، حيث يحاول النموذج التوليدي إنشاء مثيلات جديدة ستخدع نموذج الكشف / المناهض. أصبحت GANs شائعة في مجال الرؤية الحاسوبية.
ملخص التعلم العميق
التعلم العميق يمدد مبادئ الشبكات العصبية لإنشاء نماذج متقدمة يمكنها تعلم أنماط معقدة وgeneralization تلك الأنماط إلى مجموعات بيانات مستقبلية. شبكات العصبية التلافيفية تُستخدم لتفسير الصور، بينما RNNs / LSTMs تُستخدم لتفسير البيانات التسلسلية. الترميز التلقائي يمكنه تحويل مهام التعلم غير الإشرافي إلى مهام تعلم إشرافي. أخيرًا، GANs هي شبكات متعددة تتنافس مع بعضها البعض وهي مفيدة بشكل خاص لمهام الرؤية الحاسوبية.










