Refresh

This website www.unite.ai/uk/a-quick-guide-to-knn-algorithm/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

Зв'язатися з нами

Штучний Інтелект

Короткий посібник із розуміння алгоритму KNN

mm
оновлений on

З діловим світом, який агресивно приймає наука даних, вона стала однією з найбільш затребуваних сфер. Ми пояснюємо, що таке алгоритм K-найближчого сусіда та як він працює.

Що таке алгоритм KNN?

Алгоритм K-найближчих сусідів (або KNN) є одним із найбільш використовуваних алгоритмів навчання завдяки своїй простоті. KNN або K-найближчий алгоритм — це контрольований алгоритм навчання, який працює за принципом, згідно з яким кожна точка даних, розташована поруч одна з одною, відноситься до одного класу. Основне припущення тут полягає в тому, що речі, які знаходяться поруч одна з одною, схожі одна на одну. Здебільшого використовується алгоритм KNN через його легкість інтерпретації та короткий час обчислення.

KNN широко використовується для задач класифікації та регресії в машинному навчанні. Кілька прикладів KNN – це алгоритми, які використовуються порталами електронної комерції для рекомендації подібних продуктів.

Давайте розглянемо приклад:

На наведеному зображенні ми маємо два класи даних. Клас A представляє квадрати, а клас B представляє трикутники.

Проблема полягає в тому, щоб призначити нову вхідну точку даних одному з двох класів за допомогою алгоритму KNN

Першим кроком є ​​визначення значення «K», яке означає кількість найближчих сусідів.

Якщо значення «k» дорівнює 6, він шукатиме 6 найближчих сусідів до цієї точки даних. Якщо значення «k» дорівнює 5, він шукатиме 5 найближчих сусідів до цієї точки даних.

Давайте розглянемо 'K' = 4, що означає, що алгоритм розглядатиме чотирьох сусідів, які є найближчими до точки даних.

Тепер, при 'K' = 4, один трикутник і два квадрати можна розглядати як найближчих сусідів. Отже, нову точку даних на основі «K» = 4 буде віднесено до класу A.

Де використовувати KNN?

KNN використовується як у задачах класифікації, так і в задачах прогнозування регресії. Однак, коли він використовується в промислових цілях, він переважно використовується в класифікації, оскільки він справедливий за всіма параметрами, оціненими при визначенні зручності використання техніки.

  1. Сила передбачення
  2. Час розрахунку
  3. Легкість інтерпретації результату

Як він використовується в щоденних проблемах?

Незважаючи на свою простоту, KNN працює набагато краще, ніж інші потужні класифікатори, і використовується в таких місцях, як економічне прогнозування та стиснення даних, розпізнавання відео, розпізнавання зображень, розпізнавання рукописного тексту та розпізнавання мови.

Деякі основні способи використання алгоритму KNN

Алгоритм KNN використовується в банківській системі, щоб передбачити, чи придатна особа для схвалення кредиту, чи ні, передбачаючи, чи має вона чи вона схожі риси з неплатником. KNN також допомагає підрахувати кредитні бали окремих осіб, порівнюючи його з особами, які мають подібні риси.

Компанії, що використовують KNN

Більшість компаній електронної комерції та розваг, таких як Amazon або Netflix, використовують KNN, коли рекомендують продукти для покупки або фільми/шоу для перегляду.

Як вони взагалі роблять ці рекомендації? Що ж, ці компанії збирають дані про поведінку користувачів, як-от попередні продукти, які ви купили, або фільми, які ви дивилися на їхньому веб-сайті, і застосовують KNN.

Компанії введуть ваші доступні дані про клієнтів і порівняють їх з іншими клієнтами, які купували подібні продукти або дивилися подібні фільми.

Продукти та фільми будуть рекомендовані вам залежно від того, як алгоритм класифікує цю точку даних.

Переваги та недоліки КНН

Переваги КНН

  • Швидкий розрахунок
  • Простий алгоритм – інтерпретувати
  • Універсальний – корисний для класифікації та регресії
  • Висока точність
  • Жодних припущень щодо даних – немає необхідності робити додаткові припущення чи будувати модель.

Недоліки КНН

  • Точність залежить від якості даних
  • Прогнозування стає повільним із великим обсягом даних
  • Не актуально для великих наборів даних
  • Потрібно зберігати всі навчальні дані, тому потрібен великий обсяг пам’яті
  • Це може бути обчислювально дорогим, оскільки зберігає все навчання

У цьому блозі ми спробували пояснити алгоритм K-NN, який широко використовується для класифікації. Ми обговорили основний підхід до KNN, як він працює, а також його переваги та недоліки.

Алгоритм KNN є одним із найпростіших алгоритмів і може давати дуже агресивні результати. Алгоритми KNN можна використовувати як для задач класифікації, так і для регресії.

Персонал Data Scientist з більш ніж 8-річним досвідом роботи в ІТ-індустрії. Компетентність у науках про дані та цифровому маркетингу. Експертиза у професійно дослідженому технічному контенті.