Τεχνητή νοημοσύνη 101
Τι είναι η Μηχανική Μάθηση;

Η μηχανική μάθηση είναι ένα από τα πιο γρήγορα εξελισσόμενα τεχνολογικά πεδία, αλλά παρά το πόσο συχνά χρησιμοποιούνται οι λέξεις “μηχανική μάθηση”, μπορεί να είναι δύσκολο να κατανοηθεί τι είναι ακριβώς η μηχανική μάθηση.
Η μηχανική μάθηση δεν αναφέρεται σε ένα μόνο πράγμα, είναι ένας ομπρέλα όρος που μπορεί να εφαρμοστεί σε πολλές διαφορετικές έννοιες και τεχνικές. Η κατανόηση της μηχανικής μάθησης σημαίνει να είναι εξοικειωμένοι με διαφορετικές μορφές ανάλυσης μοντέλων, μεταβλητών και αλγορίθμων. Ας ρίξουμε μια πιο προσεκτική ματιά στη μηχανική μάθηση για να κατανοήσουμε καλύτερα τι περιλαμβάνει.
Τι είναι η Μηχανική Μάθηση;
Ενώ ο όρος μηχανική μάθηση μπορεί να εφαρμοστεί σε πολλά διαφορετικά πράγματα, γενικά, ο όρος αναφέρεται στην ενεργοποίηση ενός υπολογιστή να εκτελεί εργασίες χωρίς να λαμβάνει ρητές οδηγίες γραμμή-προς-γραμμή για να το κάνει. Ένας ειδικός στη μηχανική μάθηση δεν χρειάζεται να γράψει όλες τις οδηγίες που είναι απαραίτητες για να λυθεί το πρόβλημα, επειδή ο υπολογιστής είναι ικανός να “μάθει” αναλύοντας τα μοτίβα μέσα στα δεδομένα και γενικεύοντας αυτά τα μοτίβα σε νέα δεδομένα.
Τα συστήματα μηχανικής μάθησης έχουν τρία βασικά μέρη:
- Εισόδους
- Αλγορίθμους
- Εξόδους
Οι εισόδους είναι τα δεδομένα που εισάγονται στο σύστημα μηχανικής μάθησης, και τα δεδομένα εισόδου μπορούν να διαχωριστούν σε ετικέτες και χαρακτηριστικά. Τα χαρακτηριστικά είναι οι σχετικές μεταβλητές, οι μεταβλητές που θα αναλυθούν για να μάθουν μοτίβα και να βγάλουν συμπεράσματα. Εν τω μεταξύ, οι ετικέτες είναι ταξινόμησεις/περιγραφές που δίνονται στα μεμονωμένα στιγμιότυπα των δεδομένων.
Τα χαρακτηριστικά και οι ετικέτες μπορούν να χρησιμοποιηθούν σε δύο διαφορετικά είδη προβλημάτων μηχανικής μάθησης: εποπτευόμενη μάθηση και μη εποπτευόμενη μάθηση.
Μη εποπτευόμενη vs. Εποπτευόμενη Μάθηση
Στην εποπτευόμενη μάθηση, τα δεδομένα εισόδου συνοδεύονται από μια βασική αλήθεια. Τα προβλήματα εποπτευόμενης μάθησης έχουν τις σωστές τιμές εξόδου ως μέρος του συνόλου δεδομένων, οπότε οι αναμενόμενες τάξεις είναι γνωστές εκ των προτέρων. Αυτό καθιστά δυνατό για τον επιστήμονα δεδομένων να ελέγξει την απόδοση του αλγορίθμου δοκιμάζοντας τα δεδομένα σε ένα σύνολο δοκιμών και βλέποντας ποιο ποσοστό των στοιχείων ταξινομήθηκε σωστά.
Αντίθετα, μη εποπτευόμενη μάθηση προβλήματα δεν έχουν ετικέτες βασικής αλήθειας που επισυνάπτονται σε αυτά. Ένας αλγόριθμος μηχανικής μάθησης που εκπαιδεύεται για να εκτελέσει εργασίες μη εποπτευόμενης μάθησης πρέπει να είναι σε θέση να συναγάγει τα σχετικά μοτίβα στα δεδομένα από μόνη της.
Ας ρίξουμε μια σύντομη ματιά σε κάποιους από τους πιο κοινούς αλγορίθμους που χρησιμοποιούνται και στην εποπτευόμενη μάθηση και στην μη εποπτευόμενη μάθηση.
Τύποι Εποπτευόμενης Μάθησης
Κοινοί αλγόριθμοι εποπτευόμενης μάθησης περιλαμβάνουν:
- Απλό Μπέιζ
- Μηχανές Υποστήριξης Διανύσματος
- Λογιστική Παλινδρόμηση
- Τυχαία Δάση
- Τεχνητά Νευρωνικά Δίκτυα
Μηχανές Υποστήριξης Διανύσματος είναι αλγόριθμοι που χωρίζουν το σύνολο δεδομένων σε διαφορετικές τάξεις. Τα σημεία δεδομένων ομαδοποιούνται σε συσσωματώσεις με τη διαδικασία σχεδίασης γραμμών που χωρίζουν τις τάξεις η μια από την άλλη. Τα σημεία που βρίσκονται στην μια πλευρά της γραμμής θα ανήκουν σε μια τάξη, ενώ τα σημεία στην άλλη πλευρά της γραμμής θα ανήκουν σε μια διαφορετική τάξη. Οι Μηχανές Υποστήριξης Διανύσματος στοχεύουν στο να μεγιστοποιήσουν την απόσταση μεταξύ της γραμμής και των σημείων που βρίσκονται σε κάθε πλευρά της γραμμής, και όσο μεγαλύτερη είναι η απόσταση, τόσο πιο βέβαιος είναι ο ταξινομητής ότι το σημείο ανήκει σε μια τάξη και όχι σε μια άλλη τάξη.
Λογιστική Παλινδρόμηση είναι ένας αλγόριθμος που χρησιμοποιείται σε δικομματικές εργασίες ταξινόμησης, όταν τα σημεία δεδομένων πρέπει να ταξινομηθούν ως ανήκοντα σε μια από δύο τάξεις. Η Λογιστική Παλινδρόμηση λειτουργεί με την ετικέτα του σημείου δεδομένων ως 1 ή 0. Αν η ανιχνευμένη τιμή του σημείου δεδομένων είναι 0,49 ή κάτω από αυτό, ταξινομείται ως 0, ενώ αν είναι 0,5 ή πάνω από αυτό, ταξινομείται ως 1.
Αλγόριθμοι Δέντρου Απόφασης λειτουργούν με τη διαίρεση των συνόλων δεδομένων σε μικρότερα και μικρότερα θραύσματα. Τα ακριβή κριτήρια που χρησιμοποιούνται για τη διαίρεση των δεδομένων είναι στην ευθύνη του μηχανικού μηχανικής μάθησης, αλλά ο στόχος είναι τελικά να διαιρέσει τα δεδομένα σε μεμονωμένα σημεία δεδομένων, τα οποία θα ταξινομηθούν χρησιμοποιώντας ένα κλειδί.
Ένας αλγόριθμος Τυχαίου Δάσους είναι ουσιαστικά πολλοί μεμονωμένοι ταξινομητές Δέντρου Απόφασης που συνδέονται μαζί σε έναν πιο ισχυρό ταξινομητή.
Ο ταξινομητής Απλό Μπέιζ υπολογίζει την πιθανότητα που ένα δεδομένο σημείο έχει εμφανιστεί με βάση την πιθανότητα μιας προηγούμενης घटनής. Βασίζεται στο Θεώρημα Μπέιζ και τοποθετεί τα σημεία δεδομένων σε τάξεις με βάση την υπολογισμένη πιθανότητα. Όταν εφαρμόζεται ένας ταξινομητής Απλό Μπέιζ, υποθέτουμε ότι όλοι οι προβλέψεις έχουν την ίδια επιρροή στο αποτέλεσμα της τάξης.
Ένα Τεχνητό Νευρωνικό Δίκτυο, ή πολυστρωματικός персέπτρονας, είναι αλγόριθμοι μηχανικής μάθησης που εμπνέονται από τη δομή και τη λειτουργία του ανθρώπινου εγκεφάλου. Τα Τεχνητά Νευρωνικά Δίκτυα πήραν το όνομά τους από το γεγονός ότι αποτελούνται από πολλά συνδεδεμένα κόμβους/νεύρα. Κάθε νεύρο χειρίζεται τα δεδομένα με μια μαθηματική συνάρτηση. Στα Τεχνητά Νευρωνικά Δίκτυα, υπάρχουν στρώματα εισόδου, κρυφά στρώματα και στρώματα εξόδου.
Το κρυφό στρώμα του νευρωνικού δικτύου είναι όπου τα δεδομένα ερμηνεύονται και αναλύονται πραγματικά για μοτίβα. Με άλλα λόγια, είναι όπου ο αλγόριθμος μαθαίνει. Περισσότερα νεύρα που συνδέονται μαζί κάνουν πιο σύνθετα δίκτυα ικανά να μάθουν πιο σύνθετα μοτίβα.
Τύποι Μη Εποπτευόμενης Μάθησης
Αλγόριθμοι Μη Εποπτευόμενης Μάθησης περιλαμβάνουν:
- Ομαδοποίηση K-μέσων
- Αυτοκωδικοποιητές
- Ανάλυση Πρωτεύοντος Συστατικού
Η ομαδοποίηση K-μέσων είναι μια τεχνική μη εποπτευόμενης ταξινόμησης, και λειτουργεί με τη διαίρεση σημείων δεδομένων σε ομάδες ή συσσωματώσεις με βάση τα χαρακτηριστικά τους. Η ομαδοποίηση K-μέσων αναλύει τα χαρακτηριστικά που βρίσκονται στα σημεία δεδομένων και διακρίνει μοτίβα σε αυτά που κάνουν τα σημεία δεδομένων που βρίσκονται σε μια τάξη να είναι πιο παρόμοια μεταξύ τους από ότι είναι με τις τάξεις που περιέχουν τα άλλα σημεία δεδομένων. Αυτό επιτυγχάνεται με τη τοποθέτηση πιθανών κέντρων για την ομάδα, ή κεντρώων, σε ένα γράφημα των δεδομένων και επανατοποθέτησης της θέσης του κέντρου μέχρι να βρεθεί μια θέση που ελαχιστοποιεί την απόσταση μεταξύ του κέντρου και των σημείων που ανήκουν στο κέντρο. Ο ερευνητής μπορεί να καθορίσει τον επιθυμητό αριθμό ομάδων.
Ανάλυση Πρωτεύοντος Συστατικού είναι μια τεχνική που μειώνει μεγάλα νούμερα χαρακτηριστικών/μεταβλητών σε ένα μικρότερο χώρο χαρακτηριστικών/λιγότερα χαρακτηριστικά. Τα “πρωτεύοντα συστατικά” των σημείων δεδομένων επιλέγονται για διατήρηση, ενώ τα άλλα χαρακτηριστικά συμπιέζονται σε μια μικρότερη αναπαράσταση. Η σχέση μεταξύ των αρχικών τμημάτων δεδομένων διατηρείται, αλλά由于 η πολυπλοκότητα των σημείων δεδομένων είναι απλούστερη, τα δεδομένα είναι πιο εύκολα να ποσοτικοποιηθούν και να περιγραφούν.
Οι αυτοκωδικοποιητές είναι εκδοχές νευρωνικών δικτύων που μπορούν να εφαρμοστούν σε εργασίες μη εποπτευόμενης μάθησης. Οι αυτοκωδικοποιητές είναι ικανοί να πάρουν ανετικέλεστα, ελεύθερα δεδομένα και να τα μετατρέψουν σε δεδομένα που ένα νευρωνικό δίκτυο είναι ικανό να χρησιμοποιήσει, ουσιαστικά δημιουργώντας τα δικά τους ετικετεμένα δεδομένα εκπαίδευσης. Ο στόχος του αυτοκωδικοποιητή είναι να μετατρέψει τα δεδομένα εισόδου και να τα ξαναχτίσει όσο πιο ακριβώς γίνεται, οπότε είναι στο συμφέρον του δικτύου να καθορίσει ποια χαρακτηριστικά είναι τα πιο σημαντικά και να τα εξαγάγει.












