Свяжитесь с нами:

Что такое машинное обучение?

AI 101

Что такое машинное обучение?

mm

Машинное обучение — одна из самых быстрорастущих технологических областей, но, несмотря на то, как часто используются слова «машинное обучение», может быть сложно понять, что именно такое машинное обучение.

Машинное обучение Это не просто термин, а обобщающий термин, который можно применять ко множеству различных концепций и методов. Понимание машинного обучения подразумевает знакомство с различными формами анализа моделей, переменными и алгоритмами. Давайте подробно рассмотрим машинное обучение, чтобы лучше понять, что оно собой представляет.

Что такое машинное обучение?

Хотя термин машинное обучение может применяться ко многим различным вещам, в целом этот термин относится к тому, чтобы позволить компьютеру выполнять задачи без получения явных построчных инструкций для этого. Специалисту по машинному обучению не нужно записывать все шаги, необходимые для решения проблемы, потому что компьютер способен «обучаться», анализируя закономерности в данных и обобщая эти закономерности на новые данные.

Системы машинного обучения состоят из трех основных частей:

  • входные
  • Алгоритмы
  • Выходы

Входные данные — это данные, которые подаются в систему машинного обучения, а входные данные можно разделить на метки и функции. Особенности — это релевантные переменные, переменные, которые будут проанализированы, чтобы изучить закономерности и сделать выводы. Между тем, метки — это классы/описания, данные отдельным экземплярам данных.

Функции и метки можно использовать в двух разных типах задач машинного обучения: обучение с учителем и обучение без учителя.

Неконтролируемое и контролируемое обучение

In контролируемое обучение, входные данные сопровождаются наземной истиной. Задачи контролируемого обучения имеют правильные выходные значения как часть набора данных, поэтому ожидаемые классы известны заранее. Это позволяет специалисту по данным проверить производительность алгоритма, проверив данные в тестовом наборе данных и увидев, какой процент элементов был правильно классифицирован.

В противоположность, неконтролируемое обучение проблемы не имеют прикрепленных к ним ярлыков истинности. Алгоритм машинного обучения, обученный выполнять задачи обучения без учителя, должен уметь самостоятельно выводить соответствующие закономерности в данных.

Алгоритмы контролируемого обучения обычно используются для задач классификации, когда имеется большой набор данных, заполненный экземплярами, которые необходимо отсортировать в один из множества различных классов. Другой тип обучения с учителем — это задача регрессии, в которой значение, выдаваемое алгоритмом, носит непрерывный характер, а не категориальное.

Между тем, алгоритмы обучения без учителя используются для таких задач, как оценка плотности, кластеризация и обучение представлению. Этим трем задачам требуется модель машинного обучения для определения структуры данных, для модели не заданы заранее определенные классы.

Давайте кратко рассмотрим некоторые из наиболее распространенных алгоритмов, используемых как в обучении без учителя, так и в обучении с учителем.

Типы контролируемого обучения

Общие алгоритмы контролируемого обучения включают в себя:

  • Наивный байесовский
  • Поддержка векторных машин
  • Логистическая регрессия
  • Случайные леса
  • Искусственные нейронные сети

Поддержка векторных машин — это алгоритмы, которые делят набор данных на разные классы. Точки данных группируются в кластеры путем рисования линий, отделяющих классы друг от друга. Точки, найденные на одной стороне линии, будут принадлежать к одному классу, а точки на другой стороне линии — к другому классу. Машины опорных векторов стремятся максимизировать расстояние между линией и точками, найденными по обе стороны от линии, и чем больше расстояние, тем увереннее классификатор в том, что точка принадлежит одному классу, а не другому классу.

Логистическая регрессия — это алгоритм, используемый в задачах бинарной классификации, когда точки данных необходимо классифицировать как принадлежащие к одному из двух классов. Логистическая регрессия работает, помечая точку данных либо 1, либо 0. Если воспринимаемая ценность точки данных составляет 0.49 или ниже, она классифицируется как 0, а если она равна 0.5 или выше, она классифицируется как 1.

Алгоритмы дерева решений работают, разделяя наборы данных на все более мелкие фрагменты. Точные критерии, используемые для разделения данных, зависят от инженера по машинному обучению, но цель состоит в том, чтобы в конечном итоге разделить данные на отдельные точки данных, которые затем будут классифицированы с использованием ключа.

Алгоритм случайного леса, по сути, представляет собой множество отдельных классификаторов дерева решений, связанных вместе в более мощный классификатор.

Наивный байесовский классификатор вычисляет вероятность того, что заданная точка данных произошла на основе вероятности предшествующего события. Он основан на теореме Байеса и помещает точки данных в классы на основе их вычисленной вероятности. При реализации наивного байесовского классификатора предполагается, что все предикторы оказывают одинаковое влияние на результат класса.

An Искусственная нейронная сеть, или многослойный персептрон, — это алгоритмы машинного обучения, вдохновленные структурой и функциями человеческого мозга. Искусственные нейронные сети получили свое название из-за того, что они состоят из множества узлов/нейронов, связанных вместе. Каждый нейрон манипулирует данными с помощью математической функции. В искусственных нейронных сетях есть входные слои, скрытые слои и выходные слои.

Скрытый слой нейронной сети — это место, где данные фактически интерпретируются и анализируются на наличие закономерностей. Другими словами, именно здесь алгоритм учится. Больше нейронов, объединенных вместе, создают более сложные сети, способные обучаться более сложным паттернам.

Типы неконтролируемого обучения

Алгоритмы неконтролируемого обучения включают в себя:

  • K-означает кластеризацию
  • автоассоциатор
  • Анализ главных компонентов

Кластеризация методом k-средних — это метод неконтролируемой классификации, который работает путем разделения точек данных на кластеры или группы на основе их признаков. Кластеризация методом k-средних анализирует признаки, обнаруженные в точках данных, и выделяет в них закономерности, которые делают точки данных, обнаруженные в кластере данного класса, более похожими друг на друга, чем на кластеры, содержащие другие точки данных. Это достигается путем размещения возможных центров для кластера, или центроидов, на графике данных и переназначения положения центроида до тех пор, пока не будет найдено положение, минимизирующее расстояние между центроидом и точками, принадлежащими классу этого центроида. Исследователь может указать желаемое количество кластеров.

Анализ главных компонентов это метод, который уменьшает большое количество функций/переменных до меньшего пространства функций/меньшего количества функций. «Главные компоненты» точек данных выбираются для сохранения, в то время как другие функции сжимаются в меньшее представление. Взаимосвязь между исходными наборами данных сохраняется, но, поскольку сложность точек данных проще, данные легче поддаются количественной оценке и описанию.

Автокодировщики — это версии нейронных сетей, которые можно применять для задач обучения без учителя. Автокодировщики способны принимать немаркированные данные в свободной форме и преобразовывать их в данные, пригодные для использования нейронной сетью, фактически создавая собственные маркированные обучающие данные. Цель автокодировщика — преобразовать входные данные и восстановить их как можно точнее, поэтому сеть заинтересована в том, чтобы определить наиболее важные признаки и извлечь их.

Блогер и программист со специализацией в Машинное обучение и Глубокое обучение темы. Дэниел надеется помочь другим использовать возможности ИИ на благо общества.