кочан Какво е машинно обучение? - Обединете.AI
Свържете се с нас
AI майсторски клас:

AI 101 г

Какво е машинно обучение?

mm
Обновено on

машина обучение е една от най-бързо развиващите се технологични области, но въпреки това колко често се подхвърлят думите „машинно обучение“, може да е трудно да се разбере какво точно е машинното обучение.

машина обучение не се отнася само до едно нещо, това е общ термин, който може да се приложи към много различни концепции и техники. Разбирането на машинното обучение означава да сте запознати с различни форми на моделен анализ, променливи и алгоритми. Нека разгледаме отблизо машинното обучение, за да разберем по-добре какво включва то.

Какво е машинно обучение?

Докато терминът машинно обучение може да се приложи към много различни неща, като цяло терминът се отнася до позволяването на компютъра да изпълнява задачи, без да получава изрични инструкции ред по ред за това. Специалистът по машинно обучение не трябва да пише всички стъпки, необходими за решаване на проблема, тъй като компютърът е способен да „учи“, като анализира модели в данните и обобщава тези модели към нови данни.

Системите за машинно обучение имат три основни части:

  • Входове
  • Алгоритми
  • Изходи

Входящите данни са данните, които се подават в системата за машинно обучение, и входните данни могат да бъдат разделени на етикети и функции. Характеристиките са съответните променливи, променливите, които ще бъдат анализирани, за да се научат модели и да се направят заключения. Междувременно етикетите са класове/описания, дадени на отделните екземпляри на данните.

Функциите и етикетите могат да се използват в два различни типа проблеми с машинното обучение: контролирано обучение и учене без надзор.

Неконтролирано срещу контролирано обучение

In контролирано обучение, входните данни са придружени от основна истина. Проблемите с контролирано обучение имат правилните изходни стойности като част от набора от данни, така че очакваните класове са известни предварително. Това дава възможност на специалиста по данни да провери ефективността на алгоритъма, като тества данните върху набор от тестови данни и види какъв процент от елементите са класифицирани правилно.

За разлика, учене без надзор проблемите нямат етикети за основна истина, прикрепени към тях. Алгоритъм за машинно обучение, обучен да изпълнява задачи за обучение без надзор, трябва да може сам да изведе съответните модели в данните.

Алгоритмите за контролирано обучение обикновено се използват за проблеми с класификацията, където има голям набор от данни, пълен с екземпляри, които трябва да бъдат сортирани в един от много различни класове. Друг тип контролирано обучение е регресионна задача, при която изходната стойност от алгоритъма е непрекъсната по природа вместо категорична.

Междувременно алгоритмите за неконтролирано обучение се използват за задачи като оценка на плътността, групиране и обучение за представяне. Тези три задачи се нуждаят от модела за машинно обучение, за да изведат структурата на данните, няма предварително дефинирани класове, дадени на модела.

Нека да разгледаме накратко някои от най-разпространените алгоритми, използвани както при неконтролирано обучение, така и при контролирано обучение.

Видове контролирано обучение

Общи алгоритми за контролирано обучение включват:

Поддръжка на векторни машини са алгоритми, които разделят набор от данни на различни класове. Точките от данни се групират в клъстери чрез чертане на линии, които разделят класовете един от друг. Точките, намерени от едната страна на линията, ще принадлежат към един клас, докато точките от другата страна на линията са различен клас. Поддържащите векторни машини имат за цел да увеличат максимално разстоянието между линията и точките, намиращи се от двете страни на линията, и колкото по-голямо е разстоянието, толкова по-уверен е класификаторът, че точката принадлежи към един клас, а не към друг клас.

Логистична регресия е алгоритъм, използван в задачи за двоична класификация, когато точките от данни трябва да бъдат класифицирани като принадлежащи към един от два класа. Логистичната регресия работи, като обозначава точката с данни с 1 или 0. Ако възприеманата стойност на точката с данни е 0.49 или по-ниска, тя се класифицира като 0, докато ако е 0.5 или по-висока, се класифицира като 1.

Алгоритми на дървото на решенията работят чрез разделяне на набори от данни на все по-малки фрагменти. Точните критерии, използвани за разделяне на данните, зависят от инженера по машинно обучение, но целта е в крайна сметка данните да се разделят на единични точки от данни, които след това ще бъдат класифицирани с помощта на ключ.

Алгоритъмът на произволна гора по същество е много единични Дърво на решенията класификатори, свързани заедно в по-мощен класификатор.

- Наивен класификатор на Бейс изчислява вероятността дадена точка от данни да се е случила въз основа на вероятността за възникване на предишно събитие. Базира се на Теорема на Бейс и поставя точките от данни в класове въз основа на тяхната изчислена вероятност. При внедряването на класификатор на Naive Bayes се приема, че всички предиктори имат еднакво влияние върху резултата от класа.

An Изкуствена невронна мрежа, или многослоен перцептрон, са алгоритми за машинно обучение, вдъхновени от структурата и функцията на човешкия мозък. Изкуствените невронни мрежи получават името си от факта, че са направени от много възли/неврони, свързани заедно. Всеки неврон манипулира данните с математическа функция. В изкуствените невронни мрежи има входни слоеве, скрити слоеве и изходни слоеве.

Скритият слой на невронната мрежа е мястото, където данните всъщност се интерпретират и анализират за модели. С други думи, това е мястото, където алгоритъмът се учи. Повече неврони, обединени заедно, правят по-сложни мрежи, способни да научават по-сложни модели.

Видове неконтролирано обучение

Алгоритмите за неконтролирано обучение включват:

  • K-означава групиране
  • Автокодери
  • Анализ на главния компонент

K-означава групиране е техника за неконтролирана класификация и работи чрез разделяне на точки от данни в клъстери или групи въз основа на техните характеристики. Клъстерирането на K-означава анализира характеристиките, намерени в точките от данни, и разграничава моделите в тях, които правят точките от данни, открити в даден клъстер от клас, по-сходни една с друга, отколкото са с клъстери, съдържащи другите точки от данни. Това се постига чрез поставяне на възможни центрове за клъстера или центроиди в графика на данните и пренасочване на позицията на центроида, докато се намери позиция, която минимизира разстоянието между центроида и точките, които принадлежат към класа на този центроид. Изследователят може да посочи желания брой клъстери.

Анализ на главния компонент е техника, която намалява голям брой характеристики/променливи в по-малко пространство за функции/по-малко функции. „Основните компоненти“ на точките от данни са избрани за запазване, докато другите характеристики са свити в по-малко представяне. Връзката между оригиналните отвари с данни се запазва, но тъй като сложността на точките от данни е по-проста, данните са по-лесни за количествено определяне и описание.

Автокодери са версии на невронни мрежи, които могат да се прилагат за неконтролирани учебни задачи. Автоенкодерите са в състояние да вземат немаркирани данни в свободна форма и да ги трансформират в данни, които невронната мрежа може да използва, като основно създават свои собствени етикетирани данни за обучение. Целта на автокодера е да конвертира входните данни и да ги възстанови възможно най-точно, така че в стимула на мрежата е да определи кои функции са най-важни и да ги извлече.

Блогър и програмист със специалности в Machine Learning намлява Дълбоко обучение теми. Даниел се надява да помогне на другите да използват силата на ИИ за социално благо.