Artificial Intelligence

Een beknopte handleiding voor het begrijpen van een KNN-algoritme

gepubliceerd 1 februari 2021

Bijgewerkt December 9, 2022

Palak Airon

Met de zakenwereld die agressief adopteert data Science, is het een van de meest gewilde gebieden geworden. We leggen uit wat een K-naaste buur-algoritme is en hoe het werkt.

Wat is KNN-algoritme?

K-Nearest Neighbours-algoritme (of KNN) is vanwege zijn eenvoud een van de meest gebruikte leeralgoritmen. KNN of K-naaste buuralgoritme is een algoritme voor leren onder toezicht dat werkt volgens het principe dat elk gegevenspunt dat dicht bij elkaar komt, in dezelfde klasse valt. De basisaanname hier is dat de dingen die dicht bij elkaar staan, op elkaar lijken. Meestal wordt het KNN-algoritme gebruikt vanwege het gemak van interpretatie en de korte rekentijd.

KNN wordt veel gebruikt voor classificatie- en regressieproblemen bij machinaal leren. Een paar voorbeelden van KNN zijn algoritmen die door e-commerceportals worden gebruikt om soortgelijke producten aan te bevelen.

Laten we een voorbeeld bekijken:

In de gegeven afbeelding hebben we twee gegevensklassen. Klasse A vertegenwoordigt vierkanten en klasse B vertegenwoordigt driehoeken.

Het probleem is om een nieuw invoergegevenspunt toe te wijzen aan een van de twee klassen met behulp van het KNN-algoritme

De eerste stap is het definiëren van de waarde van 'K', wat staat voor het aantal dichtstbijzijnde buren.

Als de waarde van "k" 6 is, zoekt het naar 6 dichtstbijzijnde buren van dat datapunt. Als de waarde van "k" 5 is, zoekt het naar 5 dichtstbijzijnde buren van dat datapunt.

Stel dat 'K' = 4 is, dan houdt het algoritme rekening met de vier buren die het dichtst bij het gegevenspunt liggen.

Nu, bij 'K' = 4, kunnen één driehoek en twee vierkanten worden gezien als de dichtstbijzijnde buren. Het nieuwe datapunt op basis van 'K' = 4 zou dus worden toegewezen aan klasse A.

Waar KNN gebruiken?

KNN wordt gebruikt bij zowel classificatie- als regressievoorspellende problemen. Wanneer het echter voor industriële doeleinden wordt toegepast, wordt het meestal gebruikt bij classificatie, aangezien het alle parameters die worden geëvalueerd bij het bepalen van de bruikbaarheid van een techniek, in evenwicht houdt.

Voorspellingskracht
Berekeningstijd
Gemak om de uitvoer te interpreteren

Hoe wordt het gebruikt bij dagelijkse problemen?

Ondanks zijn eenvoud werkt KNN veel beter dan andere krachtige classificaties en wordt het gebruikt op plaatsen zoals economische prognoses en datacompressie, videoherkenning, beeldherkenning, handschriftdetectie en spraakherkenning.

Enkele belangrijke toepassingen van het KNN-algoritme

KNN-algoritme wordt in het banksysteem gebruikt om te voorspellen of een persoon geschikt is voor goedkeuring van een lening of niet door te voorspellen of hij of zij vergelijkbare eigenschappen heeft als een wanbetaler. KNN helpt ook bij het berekenen van de kredietscores van individuen door deze te vergelijken met personen met vergelijkbare eigenschappen.

Bedrijven die KNN gebruiken

De meeste e-commerce- en entertainmentbedrijven zoals Amazon of Netflix gebruiken KNN bij het aanbevelen van producten om te kopen of films/shows om te bekijken.

Hoe komen ze überhaupt tot deze aanbevelingen? Nou, deze bedrijven verzamelen gegevens over het gedrag van gebruikers, zoals eerder gekochte producten of films die je op hun website hebt bekeken, en passen KNN toe.

De bedrijven zullen uw beschikbare klantgegevens invoeren en die vergelijken met andere klanten die soortgelijke producten hebben gekocht of soortgelijke films hebben bekeken.

De producten en filmpjes worden je dan aanbevolen, afhankelijk van hoe het algoritme dat datapunt classificeert.

Voor- en nadelen van KNN

Voordelen KNN

Snelle berekening
Eenvoudig algoritme – interpreteren
Veelzijdig – handig voor classificatie en regressie
Hoge nauwkeurigheid
Geen aannames over gegevens - geen aanvullende aannames nodig of een model bouwen.

Nadelen van KNN

De nauwkeurigheid hangt af van de kwaliteit van de gegevens
Voorspelling wordt traag met grote gegevens
Is niet relevant voor grote datasets
Noodzaak om alle trainingsgegevens op te slaan, vereist daarom veel geheugen
Het kan rekenkundig duur zijn omdat het alle training opslaat

In deze blog hebben we geprobeerd het K-NN-algoritme uit te leggen dat veel wordt gebruikt voor classificatie. We bespraken de basisbenadering achter KNN, hoe het werkt en de voor- en nadelen ervan.

KNN-algoritme is een van de eenvoudigste algoritmen en kan zeer agressieve resultaten opleveren. KNN-algoritmen kunnen zowel voor classificatie- als regressieproblemen worden gebruikt.

Gerelateerde onderwerpen:data science KNN

Meer dan 20 wereldwijde experts werken samen om gratis cursus AI-ethiek aan te bieden

Mis het niet

Algoritme kan raciale vooroordelen in de gezondheidszorg aanpakken als het goed is opgeleid

Palak Airon

Data Scientist-personeel met meer dan 8 jaar professionele ervaring in de IT-industrie. Competentie in datawetenschap en digitale marketing. Expertise in professioneel onderzochte technische inhoud.