ШІ 101
Що таке CNN (Конволюційні Нейронні Мережі)?

Можливо, ви коли-небудь задумувалися, як Facebook або Instagram можуть автоматично розпізнавати обличчя на зображенні, або як Google дозволяє вам шукати веб-сторінки за подібними фотографіями, просто завантажуючи свою власну фотографію. Ці функції є прикладами комп’ютерного зору, і вони працюють завдяки конволюційним нейронним мережам (CNN). Але що саме є конволюційними нейронними мережами? Давайте глибоко зануримося в архітектуру CNN і зрозуміємо, як вони працюють.
Що таке Нейронні Мережі?
Перед тим, як ми почнемо говорити про конволюційні нейронні мережі, давайте визначимо звичайну нейронну мережу. Є інша стаття на тему нейронних мереж, тому ми не будемо занурюватися надто глибоко в них тут. Однак, щоб коротко визначити їх, вони є обчислювальними моделями, які надихаються людським мозком. Нейронна мережа працює, приймаючи дані і маніпулюючи даними шляхом регулювання “ваг”, які є припущеннями про те, як входові ознаки пов’язані між собою і класом об’єкта. Коли мережа тренується, значення ваг регулюються, і вони, мабуть, зійдуться до ваг, які точно відображають відносини між ознаками.
Це як працює фід-форвард нейронна мережа, і CNN складаються з двох частин: фід-форвард нейронної мережі і групи конволюційних шарів.
Що таке Конволюційні Нейронні Мережі (CNN)?
Що таке “конволюції”, які відбуваються в конволюційній нейронній мережі? Конволюція – це математична операція, яка створює набір ваг, фактично створюючи представлення частини зображення. Цей набір ваг називається ядром або фільтром. Фільтр, який створюється, менший за весь вхідний зображення, покриваючи лише підмножину зображення. Значення в фільтрі множаться з значеннями в зображенні. Фільтр потім переміщується, щоб утворити представлення нової частини зображення, і процес повторюється, поки все зображення не буде покрито.
Інший спосіб подумати про це – уявити стіну з цеглин, де цеглини представляють пікселі вхідного зображення. “Вікно” переміщується взад і вперед по стіні, яке є фільтром. Цеглини, які видно через вікно, є пікселями, значення яких множаться на значення всередині фільтра. Через це метод створення ваг з фільтром часто називається технікою “переміщення вікна”.
Вихід з фільтрів, які переміщуються по всьому вхідному зображенню, являє собою двовимірний масив, який представляє все зображення. Цей масив називається “картою ознак”.
Чому Конволюції Є Необхідними
Яка мета створення конволюцій? Конволюції необхідні, оскільки нейронна мережа повинна бути здатна інтерпретувати пікселі в зображенні як числові значення. Функція конволюційних шарів полягає в тому, щоб перетворити зображення на числові значення, які нейронна мережа може інтерпретувати, а потім витягувати відповідні закономірності. Робота фільтрів у конволюційній мережі полягає в тому, щоб створити двовимірний масив значень, який можна передати в пізніші шари нейронної мережі, які навчаться закономірностям у зображенні.
Фільтри І Канали

Фото: cecebur via Wikimedia Commons, CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Convolutional_Neural_Network_NeuralNetworkFeatureLayers.gif)












