رطم ما هي شبكات CNN (الشبكات العصبية التلافيفية)؟ - اتحدوا
اتصل بنا للحصول على مزيد من المعلومات
دروس متقدمة في الذكاء الاصطناعي:

منظمة العفو الدولية 101

ما هي شبكات CNN (الشبكات العصبية التلافيفية)؟

mm
تحديث on

ربما تساءلت كيف يتمكن Facebook أو Instagram من التعرف تلقائيًا على الوجوه في الصورة، أو كيف يتيح لك Google البحث في الويب عن صور مماثلة بمجرد تحميل صورة خاصة بك. هذه الميزات هي أمثلة على رؤية الكمبيوتر، ويتم تشغيلها بواسطة الشبكات العصبية التلافيفية (CNN). ومع ذلك ، ما هي بالضبط الشبكات العصبية التلافيفية؟ دعنا نلقي نظرة عميقة على بنية CNN ونفهم كيفية عملها.

ما هي الشبكات العصبية؟

قبل أن نبدأ الحديث عن الشبكات العصبية التلافيفية ، دعونا نتوقف لحظة لتعريف الشبكة العصبية العادية. هناك مقال آخر حول موضوع الشبكات العصبية المتاحة ، لذلك لن نتعمق فيها هنا. ومع ذلك ، لتحديدها بإيجاز فهي نماذج حسابية مستوحاة من الدماغ البشري. تعمل الشبكة العصبية عن طريق أخذ البيانات ومعالجة البيانات عن طريق تعديل "الأوزان" ، وهي افتراضات حول كيفية ارتباط ميزات الإدخال ببعضها البعض وبفئة الكائن. أثناء تدريب الشبكة ، يتم تعديل قيم الأوزان ونأمل أن تتقارب على الأوزان التي تلتقط العلاقات بين الميزات بدقة.

هذه هي الطريقة التي تعمل بها شبكة التغذية الأمامية العصبية ، وتتكون شبكات CNN من نصفين: شبكة عصبية تلقائية ومجموعة من الطبقات التلافيفية.

ما هي الشبكات العصبية الالتفافية (CNN)؟

ما هي "التلافيفات" التي تحدث في الشبكة العصبية التلافيفية؟ الالتواء هو عملية رياضية تنشئ مجموعة من الأوزان، مما يؤدي في الأساس إلى إنشاء تمثيل لأجزاء من الصورة. يشار إلى هذه المجموعة من الأوزان باسم نواة أو مرشح. يكون المرشح الذي تم إنشاؤه أصغر من صورة الإدخال بأكملها ، ويغطي جزءًا فرعيًا فقط من الصورة. يتم ضرب القيم الموجودة في المرشح بالقيم الموجودة في الصورة. ثم يتم نقل الفلتر لتشكيل تمثيل لجزء جديد من الصورة ، وتتكرر العملية حتى تتم تغطية الصورة بأكملها.

هناك طريقة أخرى للتفكير في هذا وهي تخيل جدار من الطوب ، حيث تمثل الطوب وحدات البكسل في صورة الإدخال. تنزلق "نافذة" للخلف وللأمام على طول الجدار ، وهو المرشح. الطوب الذي يمكن رؤيته من خلال النافذة هو وحدات البكسل التي يتم ضرب قيمتها بالقيم الموجودة داخل المرشح. لهذا السبب ، غالبًا ما يشار إلى طريقة تكوين الأوزان باستخدام مرشح بتقنية "النوافذ المنزلقة".

الناتج من المرشحات التي يتم نقلها حول صورة الإدخال بأكملها عبارة عن مصفوفة ثنائية الأبعاد تمثل الصورة بأكملها. هذه المجموعة تسمى "خريطة الميزات".

لماذا تعتبر التلافيف ضرورية

ما هو الغرض من خلق التلافيف على أي حال؟ تعد التلافيفات ضرورية لأن الشبكة العصبية يجب أن تكون قادرة على تفسير وحدات البكسل في الصورة على أنها قيم عددية. تتمثل وظيفة الطبقات التلافيفية في تحويل الصورة إلى قيم عددية يمكن للشبكة العصبية تفسيرها ثم استخراج الأنماط ذات الصلة منها. وظيفة المرشحات في الشبكة التلافيفية هي إنشاء مصفوفة ثنائية الأبعاد من القيم التي يمكن تمريرها إلى الطبقات اللاحقة للشبكة العصبية ، تلك التي ستتعلم الأنماط في الصورة.

المرشحات والقنوات

الصورة: cecebur عبر ويكيميديا ​​كومنز ، CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Convolutional_Neural_Network_NeuralNetworkFeatureLayers.gif)

لا تستخدم شبكات CNN مرشحًا واحدًا فقط للتعرف على الأنماط من الصور المدخلة. يتم استخدام مرشحات متعددة، حيث تؤدي المصفوفات المختلفة التي تم إنشاؤها بواسطة المرشحات المختلفة إلى تمثيل أكثر تعقيدًا وثراءً لصورة الإدخال. الأرقام الشائعة لفلاتر شبكات CNN هي 32 و 64 و 128 و 512. وكلما زاد عدد المرشحات ، زادت الفرص المتاحة لشبكة CNN لفحص بيانات الإدخال والتعلم منها.

تحلل شبكة CNN الاختلافات في قيم البكسل لتحديد حدود الكائنات. في صورة ذات تدرج رمادي ، ستنظر CNN فقط في الاختلافات في المصطلحات بالأبيض والأسود ، من الضوء إلى الظلام. عندما تكون الصور صورًا ملونة ، لا تأخذ CNN الضوء والظلام في الاعتبار فحسب ، بل يجب أن تأخذ قنوات الألوان الثلاثة المختلفة - الأحمر والأخضر والأزرق - في الاعتبار أيضًا. في هذه الحالة ، تمتلك المرشحات 3 قنوات ، تمامًا مثل الصورة نفسها. يُشار إلى عدد القنوات التي يشير إليها المرشح بعمقه ، ويجب أن يتطابق عدد القنوات في المرشح مع عدد القنوات في الصورة.

الشبكة العصبية التلافيفية (CNN) معمار

دعنا نلقي نظرة على الهندسة المعمارية الكاملة لـ شبكة عصبية تلافيفية. توجد طبقة تلافيفية في بداية كل شبكة تلافيفية ، حيث من الضروري تحويل بيانات الصورة إلى مصفوفات عددية. ومع ذلك ، يمكن أن تأتي الطبقات التلافيفية أيضًا بعد طبقات تلافيفية أخرى ، مما يعني أنه يمكن تكديس هذه الطبقات فوق بعضها البعض. إن وجود طبقات تلافيفية متعددة يعني أن المخرجات من طبقة واحدة يمكن أن تخضع لمزيد من التلافيف وأن يتم تجميعها معًا في أنماط ذات صلة. عمليًا ، هذا يعني أنه مع تقدم بيانات الصورة عبر الطبقات التلافيفية ، تبدأ الشبكة في "التعرف" على السمات الأكثر تعقيدًا للصورة.

تعد الطبقات المبكرة من ConvNet مسؤولة عن استخراج الميزات ذات المستوى المنخفض ، مثل وحدات البكسل التي تشكل خطوطًا بسيطة. ستجمع الطبقات اللاحقة من ConvNet هذه الخطوط معًا في أشكال. تستمر عملية الانتقال من التحليل السطحي إلى التحليل العميق حتى تتعرف ConvNet على الأشكال المعقدة مثل الحيوانات والوجوه البشرية والسيارات.

بعد مرور البيانات عبر جميع الطبقات التلافيفية ، تنتقل إلى الجزء المتصل بكثافة من شبكة CNN. الطبقات المتصلة بكثافة هي ما تبدو عليه الشبكة العصبية التقليدية للتغذية الأمامية ، وهي سلسلة من العقد مصفوفة في طبقات متصلة ببعضها البعض. تمر البيانات عبر هذه الطبقات المتصلة بكثافة ، والتي تتعرف على الأنماط التي تم استخراجها بواسطة الطبقات التلافيفية ، وبذلك تصبح الشبكة قادرة على التعرف على الكائنات.

Blogger والمبرمج مع تخصصات في تعلم آلة و تعلم عميق المواضيع. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الصالح الاجتماعي.