الذكاء الاصطناعي 101

ما هي الشبكات العصبية التلافيفية (CNNs)?

mm

ربما كنت قد تساءلت عن كيفية تمكن فيسبوك أو إنستجرام من التعرف تلقائيًا على الوجوه في صورة، أو كيف يسمح جوجل لك بالبحث على الويب عن صور مشابهة فقط عن طريق تحميل صورة خاصة بك. هذه الميزات هي أمثلة على رؤية الكمبيوتر، وهي مدعومة بواسطة الشبكات العصبية التلافيفية (CNNs). ومع ذلك، ما هي الشبكات العصبية التلافيفية على وجه التحديد؟ دعونا نغوص深ًا في هيكل الشبكة العصبية التلافيفية ونفهم كيف تعمل.

ما هي الشبكات العصبية؟

قبل أن نبدأ في الحديث عن الشبكات العصبية التلافيفية، دعونا نتخذ لحظة لتعريف الشبكة العصبية العادية. هناك مقال آخر حول موضوع الشبكات العصبية، لذلك لن نغوص sâu في هذا الموضوع هنا. ومع ذلك، لتعريفها بشكل简ف، فهي نماذج حسابية مستوحاة من الدماغ البشري. تعمل الشبكة العصبية عن طريق أخذ البيانات وتحويلها من خلال تعديل “الأوزان”، والتي هي افتراضات حول كيفية ارتباط ميزات الإدخال ببعضها البعض وفئة الكائن. مع تدريب الشبكة، يتم تعديل قيم الأوزان وستتجه إلى الأوزان التي تُقبض بشكل دقيق على العلاقات بين الميزات.

هذا هو كيفية عمل الشبكة العصبية التلافيفية، وهي تتكون من نصفين: شبكة عصبية تلافيفية و مجموعة من الطبقات التلافيفية.

ما هي الشبكات العصبية التلافيفية (CNNs)?

ما هي “التلافيفات” التي تحدث في شبكة عصبية تلافيفية؟ التلافيف هو عملية رياضية تُنشئ مجموعة من الأوزان، وتُنشئ بشكل أساسي تمثيلًا لجزء من الصورة. هذه المجموعة من الأوزان تعرف باسم نواة أو مرشح. المرشح الذي يتم إنشاؤه هو أصغر من الصورة الإدخالية بأكملها، ويتغطى فقط جزءًا من الصورة. يتم ضرب قيم المرشح مع قيم الصورة. ثم يتم نقل المرشح إلى تشكيل تمثيل لجزء جديد من الصورة، ويتم تكرار العملية حتى يتم تغطية الصورة بأكملها.

يمكن التفكير في هذا على أنه جدار طوب، حيث تمثل الطوب بكسلات الصورة الإدخالية. “نافذة” يتم سحبها إلى الأمام والخلف على طول الجدار، وهي المرشح. الطوب التي يمكن رؤيتها من خلال النافذة هي البكسلات التي يتم ضرب قيمها بقيم المرشح. لهذا السبب، يتم اعتبار هذه الطريقة لإنشاء أوزان باستخدام مرشح باسم تقنية “النوافذ المنزلقة”.

الخرج من المرشحات التي يتم نقلها حول الصورة الإدخالية بأكملها هو مصفوفة ثنائية الأبعاد تمثل الصورة بأكملها. هذه المصفوفة تعرف باسم “خريطة الميزات”.

لماذا التلافيفات ضرورية

ما هو الغرض من إنشاء التلافيفات على أي حال؟ التلافيفات ضرورية لأن الشبكة العصبية يجب أن تكون قادرة على تفسير البكسلات في الصورة على أنها قيم رقمية. وظيفة الطبقات التلافيفية هي تحويل الصورة إلى قيم رقمية يمكن للشبكة العصبية تفسيرها و استخراج الأنماط منها. مهمة المرشحات في الشبكة التلافيفية هي إنشاء مصفوفة ثنائية الأبعاد من القيم التي يمكن تمريرها إلى الطبقات اللاحقة من الشبكة العصبية، تلك التي ستتعلم الأنماط في الصورة.

المرشحات والقنوات

صورة: cecebur via Wikimedia Commons, CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Convolutional_Neural_Network_NeuralNetworkFeatureLayers.gif)

الشبكات العصبية التلافيفية لا تستخدم مرشحًا واحدًا فقط لتعلم الأنماط من الصور الإدخالية. يتم استخدام عدة مرشحات، حيث يؤدي المصفوفات المختلفة التي يتم إنشاؤها بواسطة المرشحات المختلفة إلى تمثيل أكثر تعقيدًا وغنى للصورة الإدخالية. الأعداد الشائعة من المرشحات للشبكات العصبية التلافيفية هي 32 و 64 و 128 و 512. كلما زاد عدد المرشحات، زادت الفرص التي لديها الشبكة العصبية التلافيفية لفحص البيانات الإدخالية و تعلمها.

تتحليل الشبكة العصبية التلافيفية الفرق في قيم البكسلات لتحديد حدود الكائنات. في صورة بالأبيض والأسود، ستتحقق الشبكة العصبية التلافيفية فقط من الفرق بين الأسود والأبيض، من الغامق إلى الفاتح. عندما تكون الصور صورًا ملونة، لا تقوم الشبكة العصبية التلافيفية فقط بمراعاة الغامق والفاتح، بل يجب أن تأخذ أيضًا في الاعتبار القنوات الثلاث الملونة – الأحمر والأخضر والأزرق. في هذه الحالة، يتمتع المرشحات بثلاث قنوات، تمامًا مثل الصورة نفسها. يُطلق على عدد القنوات التي يتمتع بها المرشح اسم “العمق”، ويجب أن يتطابق عدد القنوات في المرشح مع عدد القنوات في الصورة.

هيكل الشبكة العصبية التلافيفية (CNN)

دعونا نلقي نظرة على هيكل الشبكة العصبية التلافيفية الكامل. يتم العثور على طبقة تلافيفية في بداية كل شبكة عصبية تلافيفية، لأنها ضرورية لتحويل بيانات الصورة إلى مصفوفات رقمية. ومع ذلك، يمكن أن تتبع الطبقات التلافيفية الطبقات التلافيفية الأخرى، مما يعني أن هذه الطبقات يمكن أن تُطبق فوق بعضها البعض. وجود طبقات تلافيفية متعددة يعني أن الإخراج من طبقة يمكن أن يخضع لمزيد من التلافيفات ويمكن تجميعها في أنماط ذات صلة.

الطبقات الأولى من الشبكة العصبية التلافيفية مسؤولة عن استخراج الميزات منخفضة المستوى، مثل البكسلات التي تشكل خطوطًا بسيطة. ستجمع الطبقات اللاحقة من الشبكة العصبية التلافيفية هذه الخطوط معًا في أشكال. يستمر هذا العملية من التحليل السطحي إلى التحليل العميق حتى تعترف الشبكة العصبية التلافيفية بالشكل المعقد مثل الحيوانات والوجوه البشرية والسيارات.

بعد أن تعبر البيانات جميع الطبقات التلافيفية، تنتقل إلى الجزء المتصل كثيفًا من الشبكة العصبية التلافيفية. الطبقات المتصلّة كثيفًا هي ما تبدو عليه شبكة عصبية تقليدية متصلة إلى الأمام، وهي سلسلة من العقد مصفوفة في طبقات متصلة ببعضها البعض. تعبر البيانات هذه الطبقات المتصلّة كثيفًا، والتي تتعلم الأنماط التي تم استخراجها بواسطة الطبقات التلافيفية، وبالتالي تصبح الشبكة قادرة على التعرف على الكائنات.

مدون وبرمجي متخصص في مواضيع Machine Learning و Deep Learning. يأمل دانيال في مساعدة الآخرين على استخدام قوة الذكاء الاصطناعي من أجل الخير الاجتماعي.