Connect with us

Що таке машинне навчання?

ШІ 101

Що таке машинне навчання?

mm

Машинне навчання є одним з найшвидших зростаючих технологічних галузей, але попри те, як часто слова “машинне навчання” використовуються, може бути складно зрозуміти, що таке машинне навчання саме по собі.

Машинне навчання не відноситься лише до однієї речі, це термін- парасолька, який можна застосовувати до багатьох різних концепцій і технік. Розуміння машинного навчання означає знайомство з різними формами аналізу моделей, змінних і алгоритмів. Давайте ближче розглянемо машинне навчання, щоб краще зрозуміти, що воно охоплює.

Що таке машинне навчання?

Хоча термін машинне навчання можна застосовувати до багатьох різних речей, загалом термін відноситься до надання комп’ютеру можливості виконувати завдання без отримання явних інструкцій рядка за рядком. Спеціаліст з машинного навчання не повинен писати всі кроки, необхідні для вирішення проблеми, оскільки комп’ютер здатний “вчитися” шляхом аналізу закономірностей у даних і узагальнення цих закономірностей до нових даних.

Системи машинного навчання складаються з трьох основних частин:

  • Вхідні дані
  • Алгоритми
  • Вихідні дані

Вхідні дані – це дані, які подаються до системи машинного навчання, а вхідні дані можна розділити на мітки та ознаки. Ознаки – це відповідні змінні, змінні, які будуть аналізуватися для вивчення закономірностей і висновків. Тоді як мітки – це класи/описи, дані окремим екземплярам даних.

Ознаки та мітки можна використовувати в двох різних типах задач машинного навчання: навчанні з учителем і навчанні без учителя.

Навчання без учителя проти навчання з учителем

У навчанні з учителем вхідні дані супроводжуються основною правдою. Задачі навчання з учителем мають правильні вихідні значення як частину набору даних, тому очікувані класи відомі заздалегідь. Це робить можливим для спеціаліста з даних перевірити продуктивність алгоритму шляхом тестування даних на тестовому наборі даних і перегляду, який відсоток елементів був правильно класифікований.

Натомість навчання без учителя не мають міток основної правди, прикріплених до них. Алгоритм машинного навчання, навчений для виконання завдань навчання без учителя, повинен бути здатним самому вивести відповідні закономірності у даних.

Алгоритми навчання з учителем зазвичай використовуються для задач класифікації, де у вас є великий набір даних, заповнений екземплярами, які повинні бути відсортовані в один з багатьох різних класів. Інший тип навчання з учителем – це завдання регресії, де значення, виведене алгоритмом, є безперервним за своєю природою, а не категорійним.

Тоді як алгоритми навчання без учителя використовуються для завдань, таких як оцінка густини, кластеризація та навчання представленню. Ці три завдання потребують, щоб модель машинного навчання сама вивела структуру даних, немає попередньо визначених класів, даних моделі.

Давайте зробимо короткий огляд деяких з найбільш поширених алгоритмів, використовуваних як у навчанні без учителя, так і в навчанні з учителем.

Типи навчання з учителем

Поширені алгоритми навчання з учителем включають:

  • Наївний Баєс
  • Машини опорних векторів
  • Логістична регресія
  • Випадкові ліси
  • Штучні нейронні мережі

Машини опорних векторів – це алгоритми, які розділяють набір даних на різні класи. Точки даних групуються в кластери шляхом малювання ліній, які розділяють класи один від одного. Точки, знайдені на одній стороні лінії, належатимуть до одного класу, тоді як точки на іншій стороні лінії належатимуть до іншого класу. Машини опорних векторів спрямовані на максимізацію відстані між лінією та точками, знайденими на обох сторонах лінії, і чим більша відстань, тим більш впевнено класифікатор вважає, що точка належить до одного класу, а не іншого класу.

Логістична регресія – це алгоритм, який використовується в задачах бінарної класифікації, коли точки даних потрібно класифікувати як належні до одного з двох класів. Логістична регресія працює шляхом маркування точки даних або 1, або 0. Якщо сприйняте значення точки даних становить 0,49 або нижче, воно класифікується як 0, тоді як якщо воно становить 0,5 або вище, воно класифікується як 1.

Алгоритми дерева рішень працюють шляхом розділення наборів даних на дрібніші і дрібніші фрагменти. Точні критерії, використані для розділення даних, залежать від інженера-машинного навчання, але мета полягає в тому, щоб в кінцевому підсумку розділити дані на окремі точки даних, які потім будуть класифіковані за допомогою ключа.

Алгоритм випадкових лісів є по суті багатьма окремими класифікаторами дерева рішень, пов’язаними разом у більш потужний класифікатор.

Класифікатор Наївного Баєса розраховуємо ймовірність того, що дана точка даних виникла на основі ймовірності попередньої події. Він заснований на теоремі Баєса і розміщує точки даних у класах на основі їх розрахованої ймовірності. При реалізації класифікатора Наївного Баєса припускається, що всі передбачувані змінні мають однаковий вплив на результат класу.

Штучна нейронна мережа, або багаторівневий перцептрон, – це алгоритми машинного навчання, які надихаються структурою і функцією людського мозку. Штучні нейронні мережі отримали свою назву через те, що вони складаються з багатьох вузлів/нейронів, пов’язаних разом. Кожен нейрон маніпулює даними за допомогою математичної функції. У штучних нейронних мережах є вхідні шари, приховані шари та вихідні шари.

Прихований шар нейронної мережі – це місце, де дані фактично інтерпретуються та аналізуються для закономірностей. Інакше кажучи, це місце, де алгоритм вчиться. Більше нейронів, пов’язаних разом, створюють більш складні мережі, здатні вивчати більш складні закономірності.

Типи навчання без учителя

Алгоритми навчання без учителя включають:

  • Кластеризація методом k-середніх
  • Автокодувальники
  • Аналіз головних компонентів

Кластеризація методом k-середніх – це техніка без учителя класифікації, і вона працює шляхом розділення точок даних на кластери або групи на основі їх ознак. Кластеризація методом k-середніх аналізує ознаки, знайдені в точках даних, і розрізняє закономірності в них, які роблять точки даних, знайдені в даному класі кластера, більш схожими один на одного, ніж на кластери, що містять інші точки даних. Це досягається шляхом розміщення можливих центрів кластера, або центроїдів, у графіку даних і повторної призначення позиції центроїда, доки не буде знайдено позицію, яка мінімізує відстань між центроїдом і точками, які належать до класу центроїда. Дослідник може вказати бажану кількість кластерів.

Аналіз головних компонентів – це техніка, яка зменшує велику кількість ознак/змінних до меншого простору ознак/менших ознак. “Головні компоненти” точок даних обираються для збереження, тоді як інші ознаки стискаються до меншого представлення. Відносини між оригінальними даними зберігаються, але оскільки складність точок даних простіша, дані легше кількісно оцінити та описати.

Автокодувальники – це версії нейронних мереж, які можна застосовувати до завдань навчання без учителя. Автокодувальники здатні брати неозначені, вільні дані та перетворювати їх у дані, які нейронна мережа здатна використовувати, фактично створюючи自己的 позначені навчальні дані. Метою автокодувальника є перетворення вхідних даних і відновлення їх якомога точніше, тому мережа зацікавлена у визначенні, які ознаки найважливіші, і витягнути їх.

Блогер і програміст з спеціалізацією у темах Machine Learning і Deep Learning. Даніель сподівається допомогти іншим використовувати силу штучного інтелекту для соціальної добробути.