Connect with us

IA 101

Cos’è un KNN (K-Nearest Neighbors)?

mm

Cos’è K-Nearest Neighbors (KNN)?

K-Nearest Neighbors è una tecnica e un algoritmo di apprendimento automatico che può essere utilizzato per entrambi i compiti di regressione e classificazione. K-Nearest Neighbors esamina le etichette di un numero scelto di punti dati che circondano un punto dati di destinazione, al fine di effettuare una previsione sulla classe a cui appartiene il punto dati. K-Nearest Neighbors (KNN) è un algoritmo concettualmente semplice ma molto potente, e per questi motivi, è uno degli algoritmi di apprendimento automatico più popolari. Facciamo un’analisi approfondita dell’algoritmo KNN e vediamo esattamente come funziona. Avere una buona comprensione di come funziona KNN ci permetterà di apprezzare i migliori e i peggiori casi d’uso per KNN.

Panoramica di K-Nearest Neighbors (KNN)

Photo: Antti Ajanki AnAj via Wikimedia Commons, CC BY SA 3.0 (https://commons.wikimedia.org/wiki/File:KnnClassification.svg)

Immaginiamo un set di dati su un piano 2D. Immaginiamo una serie di punti dati su un grafico, sparsi lungo il grafico in piccoli cluster. KNN esamina la distribuzione dei punti dati e, a seconda degli argomenti forniti al modello, separa i punti dati in gruppi. Questi gruppi vengono quindi assegnati a un’etichetta. L’ipotesi principale che un modello KNN fa è che i punti dati/istanze che esistono in prossimità l’uno dell’altro sono molto simili, mentre se un punto dati è lontano da un altro gruppo è dissimile da quei punti dati.

Un modello KNN calcola la similarità utilizzando la distanza tra due punti su un grafico. La maggiore è la distanza tra i punti, la minore è la loro similarità. Ci sono molti modi per calcolare la distanza tra i punti, ma la metrica di distanza più comune è la distanza euclidea (la distanza tra due punti in linea retta).

KNN è un algoritmo di apprendimento supervisionato, il che significa che gli esempi nel set di dati devono avere etichette assegnate. Ci sono due altre cose importanti da sapere su KNN. In primo luogo, KNN è un algoritmo non parametrico. Ciò significa che non vengono fatte ipotesi sul set di dati quando si utilizza il modello. Invece, il modello è costruito interamente dai dati forniti. In secondo luogo, non c’è divisione del set di dati in set di addestramento e test quando si utilizza KNN. KNN non fa generalizzazioni tra un set di addestramento e un set di test, quindi tutti i dati di addestramento vengono utilizzati anche quando il modello è richiesto di effettuare previsioni.

Come funziona un algoritmo KNN

Blogger e programmatore con specializzazioni in Machine Learning e Deep Learning argomenti. Daniel spera di aiutare gli altri a utilizzare il potere dell'AI per il bene sociale.