Verbind je met ons

Artificial Intelligence

Een beknopte handleiding voor het begrijpen van een KNN-algoritme

mm

Met de zakenwereld die agressief adopteert data Science, is het een van de meest gewilde gebieden geworden. We leggen uit wat een K-naaste buur-algoritme is en hoe het werkt.

Wat is KNN-algoritme?

K-Nearest Neighbours-algoritme (of KNN) is vanwege zijn eenvoud een van de meest gebruikte leeralgoritmen. KNN of K-naaste buuralgoritme is een algoritme voor leren onder toezicht dat werkt volgens het principe dat elk gegevenspunt dat dicht bij elkaar komt, in dezelfde klasse valt. De basisaanname hier is dat de dingen die dicht bij elkaar staan, op elkaar lijken. Meestal wordt het KNN-algoritme gebruikt vanwege het gemak van interpretatie en de korte rekentijd.

KNN wordt veel gebruikt voor classificatie- en regressieproblemen bij machinaal leren. Een paar voorbeelden van KNN zijn algoritmen die door e-commerceportals worden gebruikt om soortgelijke producten aan te bevelen.

Laten we een voorbeeld bekijken:

In de gegeven afbeelding hebben we twee gegevensklassen. Klasse A vertegenwoordigt vierkanten en klasse B vertegenwoordigt driehoeken.

Het probleem is om een ​​nieuw invoergegevenspunt toe te wijzen aan een van de twee klassen met behulp van het KNN-algoritme

De eerste stap is het definiëren van de waarde van 'K', wat staat voor het aantal dichtstbijzijnde buren.

Als de waarde van "k" 6 is, zoekt het naar 6 dichtstbijzijnde buren van dat datapunt. Als de waarde van "k" 5 is, zoekt het naar 5 dichtstbijzijnde buren van dat datapunt.

Stel dat 'K' = 4 is, dan houdt het algoritme rekening met de vier buren die het dichtst bij het gegevenspunt liggen.

Nu, bij 'K' = 4, kunnen één driehoek en twee vierkanten worden gezien als de dichtstbijzijnde buren. Het nieuwe datapunt op basis van 'K' = 4 zou dus worden toegewezen aan klasse A.

Waar KNN gebruiken?

KNN wordt gebruikt bij zowel classificatie- als regressievoorspellende problemen. Wanneer het echter voor industriële doeleinden wordt toegepast, wordt het meestal gebruikt bij classificatie, aangezien het alle parameters die worden geëvalueerd bij het bepalen van de bruikbaarheid van een techniek, in evenwicht houdt.

  1. Voorspellingskracht
  2. Berekeningstijd
  3. Gemak om de uitvoer te interpreteren

Hoe wordt het gebruikt bij dagelijkse problemen?

Ondanks zijn eenvoud werkt KNN veel beter dan andere krachtige classificaties en wordt het gebruikt op plaatsen zoals economische prognoses en datacompressie, videoherkenning, beeldherkenning, handschriftdetectie en spraakherkenning.

Enkele belangrijke toepassingen van het KNN-algoritme

KNN-algoritme wordt in het banksysteem gebruikt om te voorspellen of een persoon geschikt is voor goedkeuring van een lening of niet door te voorspellen of hij of zij vergelijkbare eigenschappen heeft als een wanbetaler. KNN helpt ook bij het berekenen van de kredietscores van individuen door deze te vergelijken met personen met vergelijkbare eigenschappen.

Bedrijven die KNN gebruiken

De meeste e-commerce- en entertainmentbedrijven zoals Amazon of Netflix gebruiken KNN bij het aanbevelen van producten om te kopen of films/shows om te bekijken.

Hoe komen ze überhaupt tot deze aanbevelingen? Nou, deze bedrijven verzamelen gegevens over het gedrag van gebruikers, zoals eerder gekochte producten of films die je op hun website hebt bekeken, en passen KNN toe.

De bedrijven zullen uw beschikbare klantgegevens invoeren en die vergelijken met andere klanten die soortgelijke producten hebben gekocht of soortgelijke films hebben bekeken.

De producten en filmpjes worden je dan aanbevolen, afhankelijk van hoe het algoritme dat datapunt classificeert.

Voor- en nadelen van KNN

Voordelen KNN

  • Snelle berekening
  • Eenvoudig algoritme – interpreteren
  • Veelzijdig – handig voor classificatie en regressie
  • Hoge nauwkeurigheid
  • Geen aannames over gegevens - geen aanvullende aannames nodig of een model bouwen.

Nadelen van KNN

  • De nauwkeurigheid hangt af van de kwaliteit van de gegevens
  • Voorspelling wordt traag met grote gegevens
  • Is niet relevant voor grote datasets
  • Noodzaak om alle trainingsgegevens op te slaan, vereist daarom veel geheugen
  • Het kan rekenkundig duur zijn omdat het alle training opslaat

In deze blog hebben we geprobeerd het K-NN-algoritme uit te leggen dat veel wordt gebruikt voor classificatie. We bespraken de basisbenadering achter KNN, hoe het werkt en de voor- en nadelen ervan.

KNN-algoritme is een van de eenvoudigste algoritmen en kan zeer agressieve resultaten opleveren. KNN-algoritmen kunnen zowel voor classificatie- als regressieproblemen worden gebruikt.

Data Scientist-personeel met meer dan 8 jaar professionele ervaring in de IT-industrie. Competentie in datawetenschap en digitale marketing. Expertise in professioneel onderzochte technische inhoud.