заглушки Что такое нейронные сети? - Unite.ИИ
Свяжитесь с нами:
Мастер-класс по ИИ:

AI 101

Что такое нейронные сети?

mm
обновленный on

Что такое искусственные нейронные сети (ИНС)?

Многие из самых больших достижений в области ИИ управляется искусственными нейронными сетями. Искусственные нейронные сети (ИНС) — это соединение математических функций, объединенных в формате, вдохновленном нейронными сетями, обнаруженными в человеческом мозге. Эти ИНС способны извлекать сложные закономерности из данных, применяя эти закономерности к невидимым данным для их классификации/распознавания. Таким образом машина «обучается». Это краткое изложение нейронных сетей, но давайте взглянем на нейронные сети поближе, чтобы лучше понять, что они собой представляют и как они работают.

Объяснение многослойного персептрона

Прежде чем мы рассмотрим более сложные нейронные сети, мы уделим немного времени рассмотрению простой версии ИНС, Многослойный персептрон (MLP).

Представьте себе сборочную линию на заводе. На этой сборочной линии один рабочий получает деталь, вносит в нее некоторые коррективы, а затем передает ее следующему рабочему в линии, который делает то же самое. Этот процесс продолжается до тех пор, пока последний рабочий в очереди не нанесет последние штрихи на изделие и не наденет его на ленту, которая доставит его с фабрики. В этой аналогии сборочная линия состоит из нескольких «слоев», и продукты перемещаются между слоями по мере их перемещения от рабочего к рабочему. Сборочная линия также имеет точку входа и точку выхода.

Многослойный персептрон можно рассматривать как очень простую производственную линию, состоящую всего из трех слоев: входного слоя, скрытого слоя и выходного слоя. На входном уровне данные передаются в MLP, а на скрытом уровне некоторое количество «работников» обрабатывает данные, прежде чем передать их на выходной уровень, который предоставляет продукт внешнему миру. В случае MLP эти работники называются «нейронами» (или иногда узлами), и когда они обрабатывают данные, они манипулируют ими с помощью ряда математических функций.

В сети есть структуры, соединяющие узел с узлом, называемые «весами». Веса — это предположение о том, как связаны точки данных при их перемещении по сети. Иными словами, веса отражают уровень влияния одного нейрона на другой нейрон. Веса проходят через «функцию активации», когда они покидают текущий узел, что является типом математической функции, которая преобразует данные. Они преобразуют линейные данные в нелинейные представления, что позволяет сети анализировать сложные закономерности.

Аналогия с человеческим мозгом, подразумеваемая «искусственной нейронной сетью», исходит из того факта, что нейроны, из которых состоит человеческий мозг, соединены вместе аналогично тому, как связаны узлы в ИНС.

Хотя многослойные персептроны существуют с 1940-х годов, существует ряд ограничений, которые не позволяют им быть особенно полезными. Однако в течение последних нескольких десятилетий метод под названием «обратное распространение» был создан, который позволил сетям корректировать веса нейронов и тем самым обучаться гораздо эффективнее. Обратное распространение ошибки изменяет веса в нейронной сети, позволяя сети лучше улавливать фактические закономерности в данных.

Глубокие нейронные сети

Глубокие нейронные сети принимают базовую форму MLP и расширяют ее, добавляя больше скрытых слоев в середине модели. Таким образом, вместо того, чтобы быть входным слоем, скрытым слоем и выходным слоем, в середине есть много скрытых слоев, и выходные данные одного скрытого слоя становятся входными данными для следующего скрытого слоя, пока данные не прошли весь путь. через сеть и были возвращены.

Несколько скрытых слоев глубокой нейронной сети способны интерпретировать более сложные шаблоны, чем традиционный многослойный персептрон. Различные слои глубокой нейронной сети изучают закономерности различных частей данных. Например, если входные данные состоят из изображений, первая часть сети может интерпретировать яркость или темноту пикселей, в то время как более поздние слои будут выбирать формы и края, которые можно использовать для распознавания объектов на изображении.

Различные типы нейронных сетей

Существуют различные типы нейронных сетей, и каждый из различных типов нейронных сетей имеет свои преимущества и недостатки (и, следовательно, свои варианты использования). Тип глубокой нейронной сети, описанный выше, является наиболее распространенным типом нейронной сети, и его часто называют нейронной сетью с прямой связью.

Одним из вариантов нейронных сетей является рекуррентная нейронная сеть (RNN). В случае рекуррентных нейронных сетей механизмы циклов используются для хранения информации из предыдущих состояний анализа, а это означает, что они могут интерпретировать данные там, где порядок имеет значение. RNN полезны для получения закономерностей на основе последовательных/хронологических данных. Рекуррентные нейронные сети могут быть однонаправленными или двунаправленными. В случае двунаправленной нейронной сети сеть может брать информацию как из более поздних, так и из более ранних частей последовательности. Поскольку двунаправленная RNN учитывает больше информации, она лучше способна извлекать правильные закономерности из данных.

Сверточная нейронная сеть — это особый тип нейронной сети, которая умеет интерпретировать закономерности, обнаруженные в изображениях. CNN работает, пропуская фильтр по пикселям изображения и получая числовое представление пикселей внутри изображения, которое затем можно анализировать на предмет закономерностей. CNN структурирована так, что сначала идут сверточные слои, которые вытягивают пиксели из изображения, а затем идут плотно связанные слои прямой связи, а после этого идут те, которые действительно научатся распознавать объекты.

Блогер и программист со специализацией в Машинное обучение и Глубокое обучение темы. Дэниел надеется помочь другим использовать возможности ИИ на благо общества.