KĂĽnstliche Intelligenz
Eine Kurzanleitung zum Verständnis eines KNN-Algorithmus

Mit der aggressiven Übernahme durch die Geschäftswelt Daten Wissenschaft, es hat sich zu einem der gefragtesten Bereiche entwickelt. Wir erklären, was ein K-Nearest-Neighbor-Algorithmus ist und wie er funktioniert.
Was ist der KNN-Algorithmus?
K-Nearest Neighbors-Algorithmus (oder KNN) ist aufgrund seiner Einfachheit einer der am häufigsten verwendeten Lernalgorithmen. Der KNN- oder K-Nearest-Neighbor-Algorithmus ist ein überwachter Lernalgorithmus, der auf dem Prinzip basiert, dass jeder Datenpunkt, der nahe beieinander liegt, zur gleichen Klasse gehört. Die Grundannahme hier ist, dass die Dinge, die nahe beieinander liegen, einander ähnlich sind. Meistens wird der KNN-Algorithmus wegen seiner einfachen Interpretation und geringen Berechnungszeit verwendet.
KNN wird häufig für Klassifizierungs- und Regressionsprobleme beim maschinellen Lernen verwendet. Einige Beispiele für KNN sind Algorithmen, die von E-Commerce-Portalen verwendet werden, um ähnliche Produkte zu empfehlen.
Sehen wir uns ein Beispiel an:
Im gegebenen Bild haben wir zwei Datenklassen. Klasse A repräsentiert Quadrate und Klasse B repräsentiert Dreiecke.
Das Problem besteht darin, mithilfe des KNN-Algorithmus einen neuen Eingabedatenpunkt einer der beiden Klassen zuzuordnen
Der erste Schritt besteht darin, den Wert von „K“ zu definieren, der für die Anzahl der nächsten Nachbarn steht.

Wenn der Wert von „k“ 6 ist, wird nach 6 nächsten Nachbarn zu diesem Datenpunkt gesucht. Wenn der Wert von „k“ 5 ist, wird nach 5 nächsten Nachbarn zu diesem Datenpunkt gesucht.
Nehmen wir an, „K“ ist 4, was bedeutet, dass der Algorithmus die vier Nachbarn berücksichtigt, die dem Datenpunkt am nächsten sind.
Bei „K“ = 4 sind nun ein Dreieck und zwei Quadrate die nächsten Nachbarn. Der neue Datenpunkt basierend auf „K“ = 4 würde also der Klasse A zugeordnet.

Wo kann KNN verwendet werden?
KNN wird sowohl bei Klassifizierungs- als auch bei Regressionsvorhersageproblemen verwendet. Wenn es jedoch fĂĽr industrielle Zwecke eingesetzt wird, wird es meist zur Klassifizierung verwendet, da es alle Parameter berĂĽcksichtigt, die bei der Bestimmung der Verwendbarkeit einer Technik bewertet werden.
- Vorhersagekraft
- Berechnungszeit
- Einfache Interpretation der Ausgabe
Wie wird es bei alltäglichen Problemen eingesetzt?
Trotz seiner Einfachheit funktioniert KNN viel besser als andere leistungsstarke Klassifikatoren und wird beispielsweise bei Wirtschaftsprognosen und Datenkomprimierung, Videoerkennung, Bilderkennung, Handschrifterkennung und Spracherkennung eingesetzt.
Einige Hauptanwendungen des KNN-Algorithmus
Der KNN-Algorithmus wird im Bankensystem verwendet, um vorherzusagen, ob eine Person für die Kreditgenehmigung geeignet ist oder nicht, indem vorhergesagt wird, ob sie ähnliche Merkmale wie ein zahlungsunfähiger Kreditnehmer aufweist. KNN hilft auch bei der Berechnung der Kreditwürdigkeit von Einzelpersonen, indem es diese mit Personen mit ähnlichen Merkmalen vergleicht.
Unternehmen, die KNN nutzen
Die meisten E-Commerce- und Unterhaltungsunternehmen wie Amazon oder Netflix verwenden KNN, wenn sie Produkte zum Kauf oder Filme/Sendungen zum Ansehen empfehlen.
Wie kommen diese Empfehlungen ĂĽberhaupt zustande? Nun, diese Unternehmen sammeln Daten zum Benutzerverhalten, beispielsweise zu zuvor gekauften Produkten oder Filmen, die Sie auf ihrer Website angesehen haben, und wenden KNN an.
Die Unternehmen geben Ihre verfügbaren Kundendaten ein und vergleichen diese mit anderen Kunden, die ähnliche Produkte gekauft oder ähnliche Filme gesehen haben.
Die Produkte und Filme werden Ihnen dann empfohlen, je nachdem, wie der Algorithmus diesen Datenpunkt klassifiziert.
Vor- und Nachteile von KNN
Vorteile von KNN
- Schnelle Berechnung
- Einfacher Algorithmus – zum Interpretieren
- Vielseitig – nützlich für Klassifizierung und Regression
- Hohe Genauigkeit
- Keine Annahmen über Daten – keine Notwendigkeit, zusätzliche Annahmen zu treffen oder ein Modell zu erstellen.
Nachteile von KNN
- Die Genauigkeit hängt von der Qualität der Daten ab
- Bei groĂźen Datenmengen wird die Vorhersage langsam
- Ist für große Datensätze nicht relevant
- Alle Trainingsdaten mĂĽssen gespeichert werden, daher ist viel Speicher erforderlich
- Es kann rechenintensiv sein, da das gesamte Training gespeichert wird
In diesem Blog haben wir versucht, den K-NN-Algorithmus zu erklären, der häufig zur Klassifizierung verwendet wird. Wir haben den grundlegenden Ansatz von KNN, seine Funktionsweise sowie seine Vor- und Nachteile besprochen.
Der KNN-Algorithmus ist einer der einfachsten Algorithmen und kann äußerst aggressive Ergebnisse liefern. KNN-Algorithmen können sowohl für Klassifizierungs- als auch für Regressionsprobleme verwendet werden.












