Τεχνητή νοημοσύνη 101

Τι είναι τα Νευρωνικά Δίκτυα;

mm

Τι είναι τα Τεχνητά Νευρωνικά Δίκτυα (ANNs);

Πολλοί από τους μεγαλύτερους προγραμματισμούς στην τεχνητή νοημοσύνη είναι κινητοί από τεχνητά νευρωνικά δίκτυα. Τα Τεχνητά Νευρωνικά Δίκτυα (ANNs) είναι η σύνδεση μαθηματικών συναρτήσεων που συνδέονται μαζί σε μια μορφή που εμπνέεται από τα νευρωνικά δίκτυα που βρίσκονται στον ανθρώπινο εγκέφαλο. Αυτά τα ANNs είναι ικανά να εξάγουν σύνθετα πρότυπα από δεδομένα, να εφαρμόζουν αυτά τα πρότυπα σε μη είδη δεδομένων για να ταξινομήσουν/αναγνωρίσουν τα δεδομένα. Με αυτόν τον τρόπο, η μηχανή «μαθαίνει». Αυτό είναι ένα γρήγορο περίγραμμα για τα νευρωνικά δίκτυα, αλλά ας ρίξουμε μια πιο προσεκτική ματιά στα νευρωνικά δίκτυα για να κατανοήσουμε τι είναι και πώς λειτουργούν.

Περίληψη του Πολυστρωματικού Περκεπτρόνου

Πριν εξετάσουμε πιο σύνθετα νευρωνικά δίκτυα, θα σταθούμε για μια στιγμή να εξετάσουμε μια απλή εκδοχή του ANNs, ένα Πολυστρωματικό Περκεπτρόνα (MLP).

Φανταστείτε μια γραμμή συναρμολόγησης σε ένα εργοστάσιο. Σε αυτή τη γραμμή συναρμολόγησης, ένας εργάτης λαμβάνει ένα αντικείμενο, κάνει κάποιες ρυθμίσεις σε αυτό και στη συνέχεια το περνάει στον επόμενο εργάτη στη γραμμή, ο οποίος κάνει το ίδιο. Αυτή η διαδικασία συνεχίζεται μέχρι ο τελευταίος εργάτης στη γραμμή να βάλει τις τελικές πινελιές στο αντικείμενο και να το τοποθετήσει σε μια ζώνη που θα το πάρει έξω από το εργοστάσιο. Σε αυτή την αναλογία, υπάρχουν πολλά «στρώματα» στη γραμμή συναρμολόγησης, και τα προϊόντα κινούνται μεταξύ των στρωμάτων καθώς κινούνται από εργάτη σε εργάτη. Η γραμμή συναρμολόγησης έχει επίσης ένα σημείο εισόδου και ένα σημείο εξόδου.

Ένας Πολυστρωματικός Περκεπτρόνας μπορεί να θεωρηθεί ως μια πολύ απλή γραμμή παραγωγής, αποτελούμενη από τρία στρώματα συνολικά: ένα στρώμα εισόδου, ένα κρυφό στρώμα και ένα στρώμα εξόδου. Το στρώμα εισόδου είναι όπου τα δεδομένα εισάγονται στο MLP, και στο κρυφό στρώμα κάποιοι «εργάτες» χειρίζονται τα δεδομένα πριν τα περάσουν στο στρώμα εξόδου, το οποίο δίνει το προϊόν στον έξω κόσμο. Σε περίπτωση του MLP, αυτοί οι «εργάτες» ονομάζονται «νεύρωνα» (ή иногда κόμβοι) και όταν χειρίζονται τα δεδομένα, τα χειρίζονται μέσω μιας σειράς μαθηματικών συναρτήσεων.

Εντός του δικτύου, υπάρχουν δομές που συνδέουν τον κόμβο με τον κόμβο που ονομάζονται «βαρύτητες». Οι βαρύτητες είναι μια υπόθεση σχετικά με το πώς τα δεδομένα συνδέονται καθώς κινούνται μέσα στο δίκτυο. Για να το πούμε με άλλη manera, οι βαρύτητες αντανακλούν το επίπεδο επιρροής που έχει ένας νεύωνας σε έναν άλλο νεύωνα. Οι βαρύτητες περνούν από μια «συνάρτηση ενεργοποίησης» όταν εξέρχονται από τον τρέχοντα κόμβο, η οποία είναι एक είδος μαθηματικής συνάρτησης που μετατρέπει τα δεδομένα. Μετατρέπουν γραμμικά δεδομένα σε μη γραμμικές αναπαραστάσεις, το οποίο επιτρέπει στο δίκτυο να αναλύσει σύνθετα πρότυπα.

Η αναλογία με τον ανθρώπινο εγκέφαλο που υποδηλώνεται από το «τεχνητό νευρωνικό δίκτυο» προέρχεται από το γεγονός ότι οι νεύρωνας που αποτελούν τον ανθρώπινο εγκέφαλο είναι συνδεδεμένοι με παρόμοιο τρόπο με τον οποίο οι κόμβοι σε ένα ANNs είναι συνδεδεμένοι.

Ενώ οι πολυστρωματικοί περκεπτρόνοι υπάρχουν από τη δεκαετία του 1940, υπήρχαν πολλά περιορισμοί που τους εμπόδιζαν να είναι ιδιαίτερα χρήσιμοι. Ωστόσο, κατά τη διάρκεια των τελευταίων δύο δεκαετιών, μια τεχνική που ονομάζεται «αναστροφή προπαγάνδας» δημιουργήθηκε, η οποία επέτρεψε στα δίκτυα να điều chỉnh τις βαρύτητες των νευρώνων και να μάθουν πολύ πιο αποτελεσματικά. Η αναστροφή προπαγάνδας αλλάζει τις βαρύτητες στο νευρωνικό δίκτυο, επιτρέποντας στο δίκτυο να καταγράψει καλύτερα τα πραγματικά πρότυπα μέσα στα δεδομένα.

Βαθιά Νευρωνικά Δίκτυα

Τα βαθιά νευρωνικά δίκτυα λαμβάνουν τη βασική μορφή του MLP και την κάνουν μεγαλύτερη προσθέτοντας περισσότερα κρυφά στρώματα στο μέσο του μοντέλου. Έτσι, αντί να υπάρχει ένα στρώμα εισόδου, ένα κρυφό στρώμα και ένα στρώμα εξόδου, υπάρχουν πολλά κρυφά στρώματα στο μέσο και οι έξοδοι του ενός κρυφού στρώματος γίνονται οι έισοδοι για το επόμενο κρυφό στρώμα μέχρι τα δεδομένα να έχουν διανύσει όλο το δίκτυο και να έχουν επιστραφεί.

Τα πολλαπλά κρυφά στρώματα ενός βαθιά νευρωνικού δικτύου είναι ικανά να ερμηνεύσουν πιο σύνθετα πρότυπα από τον παραδοσιακό πολυστρωματικό περκεπτρόνα. Διαφορετικά στρώματα του βαθιά νευρωνικού δικτύου μαθαίνουν τα πρότυπα διαφορετικών τμημάτων των δεδομένων. Για παράδειγμα, αν τα δεδομένα εισόδου αποτελούνται από εικόνες, το πρώτο τμήμα του δικτύου μπορεί να ερμηνεύσει την φωτεινότητα ή τη σκουρότητα των pixel, ενώ τα μεταγενέστερα στρώματα θα επιλέξουν σχήματα και άκρες που μπορούν να χρησιμοποιηθούν για την αναγνώριση αντικειμένων στην εικόνα.

Διαφορετικά Είδη Νευρωνικών Δικτύων

Υπάρχουν διάφορα είδη νευρωνικών δικτύων, και κάθε είδος νευρωνικού δικτύου έχει τα δικά του πλεονεκτήματα και μειονεκτήματα (και επομένως τις δικές του περιπτώσεις χρήσης). Το είδος βαθιά νευρωνικού δικτύου που περιγράφηκε παραπάνω είναι το πιο κοινό είδος νευρωνικού δικτύου και συχνά ονομάζεται feedforward νευρωνικό δίκτυο.

Μια παραλλαγή των νευρωνικών δικτύων είναι το Αναδρομικό Νευρωνικό Δίκτυο (RNN). Σε περίπτωση Αναδρομικών Νευρωνικών Δικτύων, χρησιμοποιούνται μηχανισμοί βρόχου για να κρατήσουν πληροφορίες από προηγούμενες καταστάσεις ανάλυσης, που σημαίνει ότι μπορούν να ερμηνεύσουν δεδομένα όπου η σειρά έχει σημασία. Τα RNNs είναι χρήσιμα στη διάρκεια προτύπων από σειριακά/χρονολογικά δεδομένα. Τα Αναδρομικά Νευρωνικά Δίκτυα μπορούν να είναι είτε μονοκατευθυντικά είτε δικατευθυντικά. Σε περίπτωση δικατευθυνικού νευρωνικού δικτύου, το δίκτυο μπορεί να πάρει πληροφορίες από μεταγενέστερα σημεία της ακολουθίας, καθώς και από προηγούμενα τμήματα της ακολουθίας.既然 το δικατευθυντικό RNN λαμβάνει περισσότερες πληροφορίες υπόψη, είναι καλύτερα σε θέση να βγάλει τα σωστά πρότυπα από τα δεδομένα.

Ένα Συνβολικό Νευρωνικό Δίκτυο είναι ένα ειδικό είδος νευρωνικού δικτύου που είναι ικανό να ερμηνεύσει τα πρότυπα που βρίσκονται μέσα στις εικόνες. Ένα CNN λειτουργεί περνώντας ένα φίλτρο πάνω από τα pixel της εικόνας και επιτυγχάνοντας μια αριθμητική αναπαράσταση των pixel внутри της εικόνας, η οποία μπορεί στη συνέχεια να αναλυθεί για πρότυπα. Ένα CNN είναι δομημένο так, ώστε τα συνβολικά στρώματα που βγάζουν τα pixel από την εικόνα να έρχονται πρώτα, και στη συνέχεια τα πυκνά συνδεδεμένα feed-forward στρώματα, αυτά που θα μάθουν πραγματικά να αναγνωρίσουν αντικείμενα, έρχονται μετά από αυτό.

Blogger και προγραμματιστής με ειδικότητες στα Machine Learning και Deep Learning θέματα. Ο Daniel ελπίζει να βοηθήσει τους άλλους να χρησιμοποιήσουν τη δύναμη του AI για κοινωνικό καλό.