Künstliche Intelligenz

Eine Kurzanleitung zum Verständnis eines KNN-Algorithmus

Veröffentlicht 1. Februar 2021

Aktualisiert December 9, 2022

Palak Airon

Mit der aggressiven Übernahme durch die Geschäftswelt Daten Wissenschaft, es hat sich zu einem der gefragtesten Bereiche entwickelt. Wir erklären, was ein K-Nearest-Neighbor-Algorithmus ist und wie er funktioniert.

Was ist der KNN-Algorithmus?

K-Nearest Neighbors-Algorithmus (oder KNN) ist aufgrund seiner Einfachheit einer der am häufigsten verwendeten Lernalgorithmen. Der KNN- oder K-Nearest-Neighbor-Algorithmus ist ein überwachter Lernalgorithmus, der auf dem Prinzip basiert, dass jeder Datenpunkt, der nahe beieinander liegt, zur gleichen Klasse gehört. Die Grundannahme hier ist, dass die Dinge, die nahe beieinander liegen, einander ähnlich sind. Meistens wird der KNN-Algorithmus wegen seiner einfachen Interpretation und geringen Berechnungszeit verwendet.

KNN wird häufig für Klassifizierungs- und Regressionsprobleme beim maschinellen Lernen verwendet. Einige Beispiele für KNN sind Algorithmen, die von E-Commerce-Portalen verwendet werden, um ähnliche Produkte zu empfehlen.

Sehen wir uns ein Beispiel an:

Im gegebenen Bild haben wir zwei Datenklassen. Klasse A repräsentiert Quadrate und Klasse B repräsentiert Dreiecke.

Das Problem besteht darin, mithilfe des KNN-Algorithmus einen neuen Eingabedatenpunkt einer der beiden Klassen zuzuordnen

Der erste Schritt besteht darin, den Wert von „K“ zu definieren, der für die Anzahl der nächsten Nachbarn steht.

Wenn der Wert von „k“ 6 ist, wird nach 6 nächsten Nachbarn zu diesem Datenpunkt gesucht. Wenn der Wert von „k“ 5 ist, wird nach 5 nächsten Nachbarn zu diesem Datenpunkt gesucht.

Nehmen wir an, „K“ ist 4, was bedeutet, dass der Algorithmus die vier Nachbarn berücksichtigt, die dem Datenpunkt am nächsten sind.

Bei „K“ = 4 sind nun ein Dreieck und zwei Quadrate die nächsten Nachbarn. Der neue Datenpunkt basierend auf „K“ = 4 würde also der Klasse A zugeordnet.

Wo kann KNN verwendet werden?

KNN wird sowohl bei Klassifizierungs- als auch bei Regressionsvorhersageproblemen verwendet. Wenn es jedoch für industrielle Zwecke eingesetzt wird, wird es meist zur Klassifizierung verwendet, da es alle Parameter berücksichtigt, die bei der Bestimmung der Verwendbarkeit einer Technik bewertet werden.

Vorhersagekraft
Berechnungszeit
Einfache Interpretation der Ausgabe

Wie wird es bei alltäglichen Problemen eingesetzt?

Trotz seiner Einfachheit funktioniert KNN viel besser als andere leistungsstarke Klassifikatoren und wird beispielsweise bei Wirtschaftsprognosen und Datenkomprimierung, Videoerkennung, Bilderkennung, Handschrifterkennung und Spracherkennung eingesetzt.

Einige Hauptanwendungen des KNN-Algorithmus

Der KNN-Algorithmus wird im Bankensystem verwendet, um vorherzusagen, ob eine Person für die Kreditgenehmigung geeignet ist oder nicht, indem vorhergesagt wird, ob sie ähnliche Merkmale wie ein zahlungsunfähiger Kreditnehmer aufweist. KNN hilft auch bei der Berechnung der Kreditwürdigkeit von Einzelpersonen, indem es diese mit Personen mit ähnlichen Merkmalen vergleicht.

Unternehmen, die KNN nutzen

Die meisten E-Commerce- und Unterhaltungsunternehmen wie Amazon oder Netflix verwenden KNN, wenn sie Produkte zum Kauf oder Filme/Sendungen zum Ansehen empfehlen.

Wie kommen diese Empfehlungen überhaupt zustande? Nun, diese Unternehmen sammeln Daten zum Benutzerverhalten, beispielsweise zu zuvor gekauften Produkten oder Filmen, die Sie auf ihrer Website angesehen haben, und wenden KNN an.

Die Unternehmen geben Ihre verfügbaren Kundendaten ein und vergleichen diese mit anderen Kunden, die ähnliche Produkte gekauft oder ähnliche Filme gesehen haben.

Die Produkte und Filme werden Ihnen dann empfohlen, je nachdem, wie der Algorithmus diesen Datenpunkt klassifiziert.

Vor- und Nachteile von KNN

Vorteile von KNN

Schnelle Berechnung
Einfacher Algorithmus – zum Interpretieren
Vielseitig – nützlich für Klassifizierung und Regression
Hohe Genauigkeit
Keine Annahmen über Daten – keine Notwendigkeit, zusätzliche Annahmen zu treffen oder ein Modell zu erstellen.

Nachteile von KNN

Die Genauigkeit hängt von der Qualität der Daten ab
Bei großen Datenmengen wird die Vorhersage langsam
Ist für große Datensätze nicht relevant
Alle Trainingsdaten müssen gespeichert werden, daher ist viel Speicher erforderlich
Es kann rechenintensiv sein, da das gesamte Training gespeichert wird

In diesem Blog haben wir versucht, den K-NN-Algorithmus zu erklären, der häufig zur Klassifizierung verwendet wird. Wir haben den grundlegenden Ansatz von KNN, seine Funktionsweise sowie seine Vor- und Nachteile besprochen.

Der KNN-Algorithmus ist einer der einfachsten Algorithmen und kann äußerst aggressive Ergebnisse liefern. KNN-Algorithmen können sowohl für Klassifizierungs- als auch für Regressionsprobleme verwendet werden.

Verwandte Themen:Datenwissenschaft KNN

Palak Airon

Mitarbeiter von Data Scientists mit über 8 Jahren Berufserfahrung in der IT-Branche. Kompetent in Data Science und digitalem Marketing. Fachkenntnisse in professionell recherchierten technischen Inhalten.