ИИ 101
Что такое нейронные сети?

Что такое искусственные нейронные сети (ИНС)?
Многие из самых значительных достижений в области ИИ обусловлены искусственными нейронными сетями. Искусственные нейронные сети (ИНС) представляют собой соединение математических функций, объединенных в формате, вдохновленном нейронными сетями, найденными в человеческом мозге. Эти ИНС способны извлекать сложные закономерности из данных, применять эти закономерности к не виденным данным для классификации/распознавания данных. Таким образом, машина «учится». Это краткий обзор нейронных сетей, но давайте более внимательно рассмотрим нейронные сети, чтобы лучше понять, что они такое и как они работают.
Многослойный перцептрон: объяснение
Прежде чем мы рассмотрим более сложные нейронные сети, мы возьмем момент, чтобы рассмотреть простую версию ИНС, многослойный перцептрон (МП).

Представьте себе сборочную линию на заводе. На этой сборочной линии один работник получает предмет, делает некоторые корректировки, и затем передает его следующему работнику в линии, который делает то же самое. Этот процесс продолжается до тех пор, пока последний работник в линии не нанесет последние штрихи на предмет и не положит его на ленту, которая вынесет его из завода. В этой аналогии есть несколько «слоев» в сборочной линии, и продукты перемещаются между слоями, когда они перемещаются от работника к работнику. Сборочная линия также имеет входную точку и выходную точку.
Многослойный перцептрон можно рассматривать как очень простую производственную линию, состоящую из трех слоев: входного слоя, скрытого слоя и выходного слоя. Входной слой – это место, где данные вводятся в МП, а в скрытом слое некоторое количество «работников» обрабатывает данные, прежде чем передать их на выходной слой, который представляет продукт внешнему миру. В случае МП эти работники называются «нейронами» (или иногда узлами), и когда они обрабатывают данные, они манипулируют ими через ряд математических функций.
Внутри сети есть структуры, соединяющие узел с узлом, называемые «весами». Веса представляют собой предположение о том, как данные связаны между собой, когда они перемещаются через сеть. Другими словами, веса отражают уровень влияния, который один нейрон оказывает на другой нейрон. Веса проходят через «активационную функцию», когда они выходят из текущего узла, что является типом математической функции, которая преобразует данные. Они преобразуют линейные данные в нелинейные представления, что позволяет сети анализировать сложные закономерности.
Аналогия с человеческим мозгом, подразумеваемая «искусственной нейронной сетью», заключается в том, что нейроны, составляющие человеческий мозг, соединены друг с другом подобным образом, как и узлы в ИНС.
Хотя многослойные перцептроны существуют с 1940-х годов, было несколько ограничений, которые не позволяли им быть особенно полезными. Однако в течение последних нескольких десятилетий была создана техника, называемая «обратным распространением», которая позволила сетям корректировать веса нейронов и тем самым учиться намного более эффективно. Обратное распространение изменяет веса в нейронной сети, позволяя сети лучше захватить фактические закономерности в данных.
Глубокие нейронные сети
Глубокие нейронные сети принимают базовую форму МП и делают ее больше, добавляя больше скрытых слоев в середине модели. Итак, вместо входного слоя, скрытого слоя и выходного слоя есть много скрытых слоев в середине, и выходы одного скрытого слоя становятся входами для следующего скрытого слоя, пока данные не пройдут через всю сеть и не будут возвращены.
Многие скрытые слои глубокой нейронной сети способны интерпретировать более сложные закономерности, чем традиционный многослойный перцептрон. Различные слои глубокой нейронной сети учатся закономерностям различных частей данных. Например, если входные данные состоят из изображений, первая часть сети может интерпретировать яркость или темноту пикселей, а более поздние слои будут выделять формы и края, которые можно использовать для распознавания объектов на изображении.
Различные типы нейронных сетей

Существует несколько типов нейронных сетей, и каждый из различных типов нейронных сетей имеет свои собственные преимущества и недостатки (и, следовательно, свои собственные случаи использования). Тип глубокой нейронной сети, описанный выше, является наиболее распространенным типом нейронной сети и часто называется сетью прямого распространения.
Одним из вариантов нейронных сетей является рекуррентная нейронная сеть (РНС). В случае РНС используются петлевые механизмы для сохранения информации из предыдущих состояний анализа, что означает, что они могут интерпретировать данные, где порядок имеет значение. РНС полезны для получения закономерностей из последовательных/хронологических данных. РНС могут быть либо односторонними, либо двусторонними. В случае двусторонней нейронной сети сеть может принимать информацию из более поздних частей последовательности, а также из более ранних частей последовательности. Поскольку двусторонняя РНС принимает во внимание больше информации, она лучше способна выделять правильные закономерности из данных.
Свёрточная нейронная сеть – это особый тип нейронной сети, который хорошо подходит для интерпретации закономерностей, найденных в изображениях. Свёрточная нейронная сеть работает, проходя фильтр над пикселями изображения и получая числовое представление пикселей внутри изображения, которое она может затем анализировать на предмет закономерностей. Свёрточная нейронная сеть структурирована так, что свёрточные слои, которые выделяют пиксели из изображения, приходят первыми, а затем плотно связанные слои прямого распространения, которые фактически учатся распознавать объекты, приходят после этого.












