Connect with us

Ένας Γρήγορος Οδηγός για την Κατανόηση του Αλγορίθμου KNN

Τεχνητή νοημοσύνη

Ένας Γρήγορος Οδηγός για την Κατανόηση του Αλγορίθμου KNN

mm

Με τον επιχειρηματικό κόσμο να υιοθετεί επιθετικά την Data Science, έχει γίνει ένα από τα πιο αναζητούμενα πεδία. Εξηγούμε τι είναι ο αλγόριθμος K-nearest neighbor και πώς λειτουργεί.

Τι είναι ο Αλγόριθμος KNN;

K-Nearest Neighbors algorithm (ή KNN) είναι ένας από τους πιο χρησιμοποιούμενους αλγορίθμους μάθησης λόγω της απλότητας του. Ο KNN ή αλγόριθμος K-nearest neighbor είναι ένας αλγόριθμος επιβλεπόμενης μάθησης που λειτουργεί με βάση την αρχή ότι κάθε σημείο δεδομένων που πέφτει κοντά στο ένα άλλο ανήκει στην ίδια κατηγορία. Η βασική υπόθεση εδώ είναι ότι τα πράγματα που είναι κοντά το ένα στο άλλο, είναι παρόμοια. Συνήθως, ο αλγόριθμος KNN χρησιμοποιείται λόγω της ευκολίας ερμηνείας και του χαμηλού χρόνου υπολογισμού.
Ο KNN χρησιμοποιείται ευρέως για προβλήματα ταξινόμησης και παλινδρόμησης στη μηχανική μάθηση. Κάποιες περιπτώσεις χρήσης του KNN είναι οι αλγόριθμοι που χρησιμοποιούνται από τις ηλεκτρονικές πύλες για να συνιστώνται παρόμοια προϊόντα.

Ας Αναθεωρήσουμε Ένα Παραδείγμα:

Στην παρατιθέμενη εικόνα, έχουμε δύο κατηγορίες δεδομένων. Η Κατηγορία A αντιπροσωπεύει τα τετράγωνα και η Κατηγορία B αντιπροσωπεύει τα τρίγωνα.
Το πρόβλημα είναι να ανατεθεί ένα νέο σημείο δεδομένων σε μία από τις δύο κατηγορίες με τη χρήση του αλγορίθμου KNN
Ο πρώτος βήμας είναι να οριστεί η τιμή του ‘K’ που αντιπροσωπεύει τον αριθμό των πλησιέστερων γειτόνων.

Εάν η τιμή του “k” είναι 6, θα αναζητήσει 6 πλησιέστερους γείτονες σε αυτό το σημείο δεδομένων, εάν η τιμή του “k” είναι 5, θα αναζητήσει 5 πλησιέστερους γείτονες σε αυτό το σημείο δεδομένων.
Ας θεωρήσουμε ‘K’ = 4, που σημαίνει ότι ο αλγόριθμος θα λάβει υπόψη τους τέσσερις γείτονες που είναι οι πλησιέστεροι στο σημείο δεδομένων.
Τώρα, στο ‘K’ = 4, μπορείτε να δείτε ένα τρίγωνο και δύο τετράγωνα ως τους πλησιέστερους γείτονες. Έτσι, το νέο σημείο δεδομένων με βάση το ‘K’ = 4, θα ανατεθεί στην Κατηγορία A.

Πού να Χρησιμοποιήσετε τον KNN;

Ο KNN χρησιμοποιείται και στα προβλήματα ταξινόμησης και στα προβλήματα παλινδρόμησης. Όταν εφαρμόζεται για βιομηχανικούς σκοπούς, συνήθως χρησιμοποιείται στην ταξινόμηση, поскольку είναι ιδιαίτερα αποτελεσματικός όταν αξιολογούνται semua οι παράμετροι που καθορίζουν τη χρησιμότητα μιας τεχνικής.

  1. Ισχύς Προέβλεψης
  2. Χρόνος Υπολογισμού
  3. Ευκολία Ερμηνείας της Έξοδου

Πώς Χρησιμοποιείται στις Καθημερινές Προβλήματα;

Παρά την απλότητά του, ο KNN λειτουργεί πολύ καλύτερα από άλλους ισχυρούς ταξινομητές και χρησιμοποιείται σε μέρη όπως η οικονομική πρόβλεψη, η συμπίεση δεδομένων, η αναγνώριση βίντεο, η αναγνώριση εικόνας, η ανίχνευση γραφής και η αναγνώριση ομιλίας.

Κάποιες Κύριες Χρήσεις του Αλγορίθμου KNN

Ο αλγόριθμος KNN χρησιμοποιείται στο τραπεζικό σύστημα για να προβλέψει εάν ένα άτομο είναι κατάλληλο για έγκριση δανείου ή όχι, προβλέποντας εάν έχει παρόμοια χαρακτηριστικά με έναν αθέτη. Ο KNN επίσης βοηθά στον υπολογισμό του πιστωτικού σκορ των ατόμων, συγκρίνοντάς το με άτομα που έχουν παρόμοια χαρακτηριστικά.

Εταιρείες που Χρησιμοποιούν τον KNN

Πολλές εταιρείες ηλεκτρονικού εμπορίου και ψυχαγωγίας, όπως η Amazon ή η Netflix, χρησιμοποιούν τον KNN όταν συνιστώνται προϊόντα για αγορά ή ταινίες/σειρές για προβολή.
Πώς κάνουν αυτές τις συστάσεις; Αυτές οι εταιρείες συλλέγουν δεδομένα για τη συμπεριφορά των χρηστών, όπως τα προηγούμενα προϊόντα που έχουν αγοράσει ή τις ταινίες που έχουν δει στην ιστοσελίδα τους και εφαρμόζουν τον KNN.
Οι εταιρείες θα εισαγάγουν τα διαθέσιμα δεδομένα του πελάτη και θα τα συγκρίνουν με άλλα πελάτες που έχουν αγοράσει παρόμοια προϊόντα ή έχουν δει παρόμοιες ταινίες.
Τα προϊόντα και οι ταινίες θα συνιστώνται τότε, ανάλογα με τον τρόπο που ο αλγόριθμος ταξινομεί αυτό το σημείο δεδομένων.

Πλεονεκτήματα και Μειονεκτήματα του KNN

Πλεονεκτήματα του KNN

  • Γρήγορη υπολογιστική διαδικασία
  • Απλός αλγόριθμος – εύκολος στην ερμηνεία
  • Πολυμορφικός – χρήσιμος για ταξινόμηση και παλινδρόμηση
  • Υψηλή ακρίβεια
  • Χωρίς υποθέσεις για τα δεδομένα – δεν χρειάζεται να κάνουμε πρόσθετες υποθέσεις ή να δημιουργήσουμε ένα μοντέλο.

Μειονεκτήματα του KNN

  • Η ακρίβεια εξαρτάται από την ποιότητα των δεδομένων
  • Η πρόβλεψη γίνεται αργή με μεγάλα δεδομένα
  • Δεν είναι σχετικός για μεγάλα σύνολα δεδομένων
  • Χρειάζεται να αποθηκεύσετε όλα τα δεδομένα εκπαίδευσης, επομένως απαιτεί υψηλή μνήμη
  • Μπορεί να είναι υπολογιστικά δαπανηρός, καθώς αποθηκεύει όλα τα δεδομένα εκπαίδευσης

Στο αυτό το blog, προσπαθήσαμε να εξηγήσουμε τον αλγόριθμο K-NN, ο οποίος χρησιμοποιείται ευρέως για ταξινόμηση. Συζητήσαμε την βασική προσέγγιση πίσω από τον KNN, πώς λειτουργεί και τα πλεονεκτήματα και μειονεκτήματά του.
Ο αλγόριθμος KNN είναι ένας από τους πιο απλούς αλγορίθμους και μπορεί να δώσει πολύ αποτελεσματικά αποτελέσματα. Ο αλγόριθμος KNN μπορεί να χρησιμοποιηθεί και για προβλήματα ταξινόμησης και για προβλήματα παλινδρόμησης.

Data Scientist personnel with over 8 years of professional experience in the IT industry. Competent in Data Science and Digital Marketing. Expertise in professionally researched technical content.