Suivez nous sur

Un guide rapide pour comprendre un algorithme KNN

Intelligence Artificielle

Un guide rapide pour comprendre un algorithme KNN

mm

Alors que le monde des affaires adopte de manière agressive Sciences des données, il est devenu l'un des domaines les plus recherchés. Nous expliquons ce qu'est un algorithme de K plus proche voisin et comment il fonctionne.

Qu'est-ce que l'algorithme KNN ?

Algorithme K-Nearest Neighbors (ou KNN) est l'un des algorithmes d'apprentissage les plus utilisés en raison de sa simplicité. L'algorithme KNN ou K-plus proche voisin est un algorithme d'apprentissage supervisé qui fonctionne sur le principe que chaque point de données proche l'un de l'autre appartient à la même classe. L'hypothèse de base ici est que les choses proches les unes des autres se ressemblent. L'algorithme KNN est principalement utilisé en raison de sa facilité d'interprétation et de son faible temps de calcul.

KNN est largement utilisé pour les problèmes de classification et de régression dans l'apprentissage automatique. Quelques exemples de KNN sont les algorithmes utilisés par les portails de commerce électronique pour recommander des produits similaires.

Passons en revue un exemple :

Dans l'image donnée, nous avons deux classes de données. Classe A représentant des carrés et Classe B représentant des triangles.

Le problème est d'attribuer un nouveau point de données d'entrée à l'une des deux classes à l'aide de l'algorithme KNN

La première étape consiste à définir la valeur de 'K' qui représente le nombre de voisins les plus proches.

Si la valeur de "k" est 6, il recherchera les 6 voisins les plus proches de ce point de données. Si la valeur de "k" est 5, il recherchera les 5 voisins les plus proches de ce point de données.

Considérons « K » = 4, ce qui signifie que l’algorithme considérera les quatre voisins les plus proches du point de données.

Maintenant, à 'K' = 4, un triangle et deux carrés peuvent être considérés comme les voisins les plus proches. Ainsi, le nouveau point de données basé sur 'K' = 4, serait affecté à la classe A.

OĂą utiliser KNN ?

KNN est utilisé à la fois dans les problèmes prédictifs de classification et de régression. Cependant, lorsqu'il est appliqué à des fins industrielles, il est principalement utilisé dans la classification car il est équitable pour tous les paramètres évalués lors de la détermination de l'utilisabilité d'une technique.

  1. Puissance de prédiction
  2. Temps de calcul
  3. Facilité d'interprétation de la sortie

Comment est-il employé dans les problèmes quotidiens ?

Malgré sa simplicité, KNN fonctionne bien mieux que d'autres classificateurs puissants et est utilisé dans des endroits tels que les prévisions économiques et la compression de données, la reconnaissance vidéo, la reconnaissance d'image, la détection d'écriture manuscrite et la reconnaissance vocale.

Quelques utilisations majeures de l'algorithme KNN

L'algorithme KNN est utilisé dans le système bancaire pour prédire si une personne est apte ou non à l'approbation d'un prêt en prédisant si elle présente des caractéristiques similaires à celles d'un défaillant. KNN aide également à calculer les cotes de crédit des individus en les comparant avec des personnes ayant des traits similaires.

Entreprises utilisant KNN

La plupart des entreprises de commerce électronique et de divertissement comme Amazon ou Netflix utilisent KNN pour recommander des produits à acheter ou des films/émissions à regarder.

Comment font-ils ces recommandations ? Ces entreprises collectent des donnĂ©es sur le comportement des utilisateurs, comme les produits achetĂ©s prĂ©cĂ©demment ou les films regardĂ©s sur leur site web, et appliquent le KNN.

Les entreprises entreront vos données clients disponibles et les compareront à d'autres clients qui ont acheté des produits similaires ou qui ont regardé des films similaires.

Les produits et les films vous seront alors recommandés, selon la façon dont l'algorithme classe ce point de données.

Avantages et inconvénients de KNN

Avantages de KNN

  • Calcul rapide
  • Algorithme simple – Ă  interprĂ©ter
  • Polyvalent – ​​utile pour la classification et la rĂ©gression
  • Haute prĂ©cision
  • Aucune hypothèse sur les donnĂ©es - pas besoin de faire d'hypothèses supplĂ©mentaires ou de crĂ©er un modèle.

Inconvénients de KNN

  • La prĂ©cision dĂ©pend de la qualitĂ© des donnĂ©es
  • La prĂ©diction devient lente avec des donnĂ©es volumineuses
  • N'est pas pertinent pour les grands ensembles de donnĂ©es
  • Besoin de stocker toutes les donnĂ©es d'entraĂ®nement, nĂ©cessite donc une mĂ©moire Ă©levĂ©e
  • Il peut ĂŞtre coĂ»teux en calcul car il stocke toute la formation

Dans ce blog, nous avons essayé d'expliquer l'algorithme K-NN qui est largement utilisé pour la classification. Nous avons discuté de l'approche de base derrière KNN, de son fonctionnement, de ses avantages et de ses inconvénients.

L'algorithme KNN est l'un des algorithmes les plus simples et peut donner des résultats très agressifs. Les algorithmes KNN peuvent être utilisés à la fois pour les problèmes de classification et de régression.

Personnel scientifique des données avec plus de 8 ans d'expérience professionnelle dans l'industrie informatique. Compétent en science des données et en marketing numérique. Expertise dans le contenu technique recherché par des professionnels.