στέλεχος Τι είναι η Μηχανική Μάθηση; - Unite.AI
Συνδεθείτε μαζί μας
Masterclass AI:

AI 101

Τι είναι η Μηχανική Εκμάθηση;

mm
Ενημερώθηκε on

Η μηχανική μάθηση είναι ένα από τα ταχύτερα αναπτυσσόμενα τεχνολογικά πεδία, αλλά παρά το πόσο συχνά πετιούνται οι λέξεις «μηχανική μάθηση», μπορεί να είναι δύσκολο να κατανοήσουμε τι ακριβώς είναι η μηχανική μάθηση.

Εκμάθηση μηχανών δεν αναφέρεται μόνο σε ένα πράγμα, είναι ένας όρος ομπρέλα που μπορεί να εφαρμοστεί σε πολλές διαφορετικές έννοιες και τεχνικές. Η κατανόηση της μηχανικής μάθησης σημαίνει εξοικείωση με διαφορετικές μορφές ανάλυσης μοντέλων, μεταβλητών και αλγορίθμων. Ας ρίξουμε μια προσεκτική ματιά στη μηχανική εκμάθηση για να κατανοήσουμε καλύτερα τι περιλαμβάνει.

Τι είναι η Μηχανική Μάθηση;

Ενώ ο όρος μηχανική μάθηση μπορεί να εφαρμοστεί σε πολλά διαφορετικά πράγματα, γενικά, ο όρος αναφέρεται στη δυνατότητα σε έναν υπολογιστή να εκτελεί εργασίες χωρίς να λαμβάνει σαφείς οδηγίες γραμμή προς γραμμή για να το κάνει. Ένας ειδικός μηχανικής εκμάθησης δεν χρειάζεται να γράψει όλα τα βήματα που απαιτούνται για την επίλυση του προβλήματος, επειδή ο υπολογιστής είναι ικανός να «μαθαίνει» αναλύοντας μοτίβα μέσα στα δεδομένα και γενικεύοντας αυτά τα μοτίβα σε νέα δεδομένα.

Τα συστήματα μηχανικής μάθησης έχουν τρία βασικά μέρη:

  • Είσοδοι
  • Αλγόριθμοι
  • Έξοδοι

Οι είσοδοι είναι τα δεδομένα που τροφοδοτούνται στο σύστημα μηχανικής εκμάθησης και τα δεδομένα εισόδου μπορούν να χωριστούν σε ετικέτες και χαρακτηριστικά. Χαρακτηριστικά είναι οι σχετικές μεταβλητές, οι μεταβλητές που θα αναλυθούν για την εκμάθηση προτύπων και την εξαγωγή συμπερασμάτων. Εν τω μεταξύ, οι ετικέτες είναι κλάσεις/περιγραφές που δίνονται στα μεμονωμένα στιγμιότυπα των δεδομένων.

Οι δυνατότητες και οι ετικέτες μπορούν να χρησιμοποιηθούν σε δύο διαφορετικούς τύπους προβλημάτων μηχανικής μάθησης: την εποπτευόμενη μάθηση και την μάθηση χωρίς επίβλεψη.

Μη εποπτευόμενη έναντι εποπτευόμενης μάθησης

In εποπτευόμενη μάθηση, τα δεδομένα εισόδου συνοδεύονται από μια βασική αλήθεια. Τα εποπτευόμενα προβλήματα εκμάθησης έχουν τις σωστές τιμές εξόδου ως μέρος του συνόλου δεδομένων, επομένως οι αναμενόμενες κλάσεις είναι γνωστές εκ των προτέρων. Αυτό δίνει τη δυνατότητα στον επιστήμονα δεδομένων να ελέγξει την απόδοση του αλγορίθμου δοκιμάζοντας τα δεδομένα σε ένα σύνολο δεδομένων δοκιμής και βλέποντας το ποσοστό των στοιχείων που ταξινομήθηκαν σωστά.

Σε αντίθεση, μη εποπτευόμενη μάθηση Τα προβλήματα δεν έχουν ετικέτες βασικής αλήθειας κολλημένες σε αυτά. Ένας αλγόριθμος μηχανικής μάθησης που έχει εκπαιδευτεί να εκτελεί εργασίες μάθησης χωρίς επίβλεψη πρέπει να είναι σε θέση να συμπεράνει από μόνος του τα σχετικά μοτίβα στα δεδομένα.

Οι αλγόριθμοι εποπτευόμενης μάθησης χρησιμοποιούνται συνήθως για προβλήματα ταξινόμησης, όπου κάποιος έχει ένα μεγάλο σύνολο δεδομένων γεμάτο με παρουσίες που πρέπει να ταξινομηθούν σε μία από πολλές διαφορετικές κλάσεις. Ένας άλλος τύπος εποπτευόμενης μάθησης είναι μια εργασία παλινδρόμησης, όπου η τιμή που εξάγεται από τον αλγόριθμο είναι συνεχούς χαρακτήρα αντί για κατηγορική.

Εν τω μεταξύ, αλγόριθμοι μάθησης χωρίς επίβλεψη χρησιμοποιούνται για εργασίες όπως η εκτίμηση της πυκνότητας, η ομαδοποίηση και η εκμάθηση αναπαράστασης. Αυτές οι τρεις εργασίες χρειάζονται το μοντέλο μηχανικής εκμάθησης για να συμπεράνει τη δομή των δεδομένων, δεν υπάρχουν προκαθορισμένες κλάσεις που δίνονται στο μοντέλο.

Ας ρίξουμε μια σύντομη ματιά σε μερικούς από τους πιο συνηθισμένους αλγόριθμους που χρησιμοποιούνται τόσο στην μάθηση χωρίς επίβλεψη όσο και στην εποπτευόμενη μάθηση.

Τύποι εποπτευόμενης μάθησης

Οι κοινοί αλγόριθμοι εποπτευόμενης μάθησης περιλαμβάνουν:

  • Ναϊβ Μπέις
  • Υποστηρικτικές μηχανές υποστήριξης
  • Λογιστική παλινδρόμηση
  • Τυχαία δάση
  • Τεχνητά νευρικά δίκτυα

Υποστηρικτικές μηχανές υποστήριξης είναι αλγόριθμοι που χωρίζουν ένα σύνολο δεδομένων σε διαφορετικές κλάσεις. Τα σημεία δεδομένων ομαδοποιούνται σε συμπλέγματα σχεδιάζοντας γραμμές που χωρίζουν τις κλάσεις η μία από την άλλη. Τα σημεία που βρίσκονται στη μία πλευρά της γραμμής θα ανήκουν σε μία κατηγορία, ενώ τα σημεία στην άλλη πλευρά της γραμμής είναι διαφορετική κατηγορία. Οι Υποστήριξη Διανυσματικές Μηχανές στοχεύουν στη μεγιστοποίηση της απόστασης μεταξύ της γραμμής και των σημείων που βρίσκονται σε κάθε πλευρά της γραμμής, και όσο μεγαλύτερη είναι η απόσταση τόσο πιο σίγουρος είναι ο ταξινομητής ότι το σημείο ανήκει σε μια κατηγορία και όχι σε μια άλλη κατηγορία.

Λογιστική παλινδρόμηση είναι ένας αλγόριθμος που χρησιμοποιείται σε εργασίες δυαδικής ταξινόμησης όταν τα σημεία δεδομένων πρέπει να ταξινομηθούν ότι ανήκουν σε μία από τις δύο κλάσεις. Η Logistic Regression λειτουργεί επισημαίνοντας το σημείο δεδομένων είτε 1 είτε 0. Εάν η αντιληπτή τιμή του σημείου δεδομένων είναι 0.49 ή μικρότερη, ταξινομείται ως 0, ενώ εάν είναι 0.5 ή πάνω ταξινομείται ως 1.

Αλγόριθμοι Δέντρου Αποφάσεων λειτουργούν διαιρώντας τα σύνολα δεδομένων σε όλο και μικρότερα τμήματα. Τα ακριβή κριτήρια που χρησιμοποιούνται για τη διαίρεση των δεδομένων εναπόκεινται στον μηχανικό μηχανικής εκμάθησης, αλλά ο στόχος είναι να διαιρεθούν τελικά τα δεδομένα σε μεμονωμένα σημεία δεδομένων, τα οποία στη συνέχεια θα ταξινομηθούν χρησιμοποιώντας ένα κλειδί.

Ένας αλγόριθμος Random Forest είναι ουσιαστικά πολλοί μεμονωμένοι ταξινομητές Decision Tree που συνδέονται μεταξύ τους σε έναν πιο ισχυρό ταξινομητή.

Η Naive Bayes Classifier υπολογίζει την πιθανότητα να έχει συμβεί ένα δεδομένο σημείο δεδομένων με βάση την πιθανότητα να συμβεί ένα προηγούμενο συμβάν. Βασίζεται στο θεώρημα Bayes και τοποθετεί τα σημεία δεδομένων σε κλάσεις με βάση την υπολογισμένη τους πιθανότητα. Κατά την εφαρμογή ενός ταξινομητή Naive Bayes, θεωρείται ότι όλοι οι προγνωστικοί παράγοντες έχουν την ίδια επίδραση στο αποτέλεσμα της τάξης.

An Τεχνητό Νευρωνικό Δίκτυο, ή multi-layer perceptron, είναι αλγόριθμοι μηχανικής μάθησης εμπνευσμένοι από τη δομή και τη λειτουργία του ανθρώπινου εγκεφάλου. Τα τεχνητά νευρωνικά δίκτυα πήραν το όνομά τους από το γεγονός ότι αποτελούνται από πολλούς κόμβους/νευρώνες συνδεδεμένους μεταξύ τους. Κάθε νευρώνας χειρίζεται τα δεδομένα με μια μαθηματική συνάρτηση. Στα τεχνητά νευρωνικά δίκτυα, υπάρχουν επίπεδα εισόδου, κρυφά στρώματα και στρώματα εξόδου.

Το κρυφό στρώμα του νευρωνικού δικτύου είναι όπου τα δεδομένα ερμηνεύονται και αναλύονται για μοτίβα. Με άλλα λόγια, εκεί μαθαίνει ο αλγόριθμος. Περισσότεροι νευρώνες που ενώνονται μεταξύ τους καθιστούν πιο πολύπλοκα δίκτυα ικανά να μάθουν πιο πολύπλοκα μοτίβα.

Τύποι μάθησης χωρίς επίβλεψη

Οι αλγόριθμοι μάθησης χωρίς επίβλεψη περιλαμβάνουν:

  • Κ-σημαίνει ομαδοποίηση
  • Αυτόματο κωδικοποιητές
  • Ανάλυση κύριων συστατικών

Κ-σημαίνει ομαδοποίηση είναι μια τεχνική ταξινόμησης χωρίς επίβλεψη και λειτουργεί διαχωρίζοντας σημεία δεδομένων σε συμπλέγματα ή ομάδες με βάση τα χαρακτηριστικά τους. Η ομαδοποίηση K-means αναλύει τα χαρακτηριστικά που βρίσκονται στα σημεία δεδομένων και διακρίνει μοτίβα σε αυτά που κάνουν τα σημεία δεδομένων που βρίσκονται σε ένα δεδομένο σύμπλεγμα κλάσεων πιο όμοια μεταξύ τους παρά με τα συμπλέγματα που περιέχουν τα άλλα σημεία δεδομένων. Αυτό επιτυγχάνεται με την τοποθέτηση πιθανών κέντρων για το σύμπλεγμα, ή κεντροειδών, σε ένα γράφημα των δεδομένων και επανατοποθετώντας τη θέση του κέντρου μέχρι να βρεθεί μια θέση που ελαχιστοποιεί την απόσταση μεταξύ του κέντρου και των σημείων που ανήκουν στην κατηγορία αυτού του κέντρου. Ο ερευνητής μπορεί να καθορίσει τον επιθυμητό αριθμό συστάδων.

Ανάλυση κύριων συστατικών είναι μια τεχνική που μειώνει μεγάλο αριθμό χαρακτηριστικών/μεταβλητών σε μικρότερο χώρο χαρακτηριστικών/λιγότερα χαρακτηριστικά. Τα «κύρια στοιχεία» των σημείων δεδομένων επιλέγονται για διατήρηση, ενώ τα άλλα χαρακτηριστικά συμπιέζονται σε μια μικρότερη αναπαράσταση. Η σχέση μεταξύ των αρχικών φίλτρων δεδομένων διατηρείται, αλλά επειδή η πολυπλοκότητα των σημείων δεδομένων είναι απλούστερη, τα δεδομένα είναι ευκολότερο να ποσοτικοποιηθούν και να περιγραφούν.

Αυτόματο κωδικοποιητές είναι εκδόσεις νευρωνικών δικτύων που μπορούν να εφαρμοστούν σε εργασίες μάθησης χωρίς επίβλεψη. Οι αυτοκωδικοποιητές είναι ικανοί να λαμβάνουν δεδομένα χωρίς ετικέτα, ελεύθερης μορφής και να τα μετατρέπουν σε δεδομένα που μπορεί να χρησιμοποιήσει ένα νευρωνικό δίκτυο, δημιουργώντας βασικά τα δικά τους δεδομένα εκπαίδευσης με ετικέτα. Ο στόχος ενός αυτόματου κωδικοποιητή είναι να μετατρέψει τα δεδομένα εισόδου και να τα ξαναχτίσει όσο το δυνατόν ακριβέστερα, επομένως είναι στο κίνητρο του δικτύου να καθορίσει ποιες λειτουργίες είναι οι πιο σημαντικές και να τις εξαγάγει.

Blogger και προγραμματιστής με ειδικότητες στο Μηχανική μάθηση και Βαθιά μάθηση Θέματα. Ο Daniel ελπίζει να βοηθήσει άλλους να χρησιμοποιήσουν τη δύναμη της τεχνητής νοημοσύνης για κοινωνικό καλό.