Βασικές αρχές της AI

Τι είναι το Deep Learning;

mm

Το deep learning είναι ένα από τα πιο επιρρεπείς και ταχύτερα αναπτυσσόμενα πεδία της τεχνητής νοημοσύνης. Ωστόσο, η απόκτηση μιας εννοιολογικής κατανόησης του deep learning μπορεί να είναι δύσκολη επειδή ο όρος deep learning καλύπτει eine ποικιλία διαφορετικών αλγορίθμων και τεχνικών. Το deep learning είναι επίσης ένας υπο-τομέας της μηχανικής μάθησης γενικά, έτσι είναι σημαντικό να κατανοήσουμε τι είναι η μηχανική μάθηση για να κατανοήσουμε το deep learning.

Τι είναι η Μηχανική Μάθηση;

Deep learning είναι μια επέκταση некоторых από τις έννοιες που προέρχονται από τη μηχανική μάθηση, έτσι για αυτόν τον λόγο, ας πάρουμε ένα λεπτό για να εξηγήσουμε τι είναι η μηχανική μάθηση.

Απλά, η μηχανική μάθηση είναι μια μέθοδος που επιτρέπει στους υπολογιστές να εκτελούν συγκεκριμένες εργασίες χωρίς να κωδικοποιούν κάθε γραμμή των αλγορίθμων που χρησιμοποιούνται για την εκτέλεση αυτών των εργασιών. Υπάρχουν πολλά διαφορετικά αλγόριθμοι μηχανικής μάθησης, αλλά ένας από τους πιο συχνά χρησιμοποιούμενους αλγόριθμους είναι ο πολυστιβαίος персέπτρον. Ένας πολυστιβαίος персέπτρον αναφέρεται επίσης ως νευρωνικό δίκτυο και αποτελείται από μια σειρά από κόμβους/νεύρων που συνδέονται. Υπάρχουν τρεις διαφορετικές στρώσεις σε ένα πολυστιβαίο персέπτρον: η στρώση εισόδου, η στρώση κρυφής και η στρώση εξόδου.

Η στρώση εισόδου λαμβάνει τα δεδομένα στο δίκτυο, όπου τα δεδομένα επεξεργάζονται από τους κόμβους στη μέση/κρυφή στρώση. Οι κόμβοι στη στρώση κρυφής είναι μαθηματικές συναρτήσεις που μπορούν να επεξεργαστούν τα δεδομένα που έρχονται από τη στρώση εισόδου, εξάγοντας σχετικές μοτίβα από τα δεδομένα εισόδου. Αυτός είναι ο τρόπος με τον οποίο το νευρωνικό δίκτυο «μαθαίνει». Τα νευρωνικά δίκτυα ονομάζονται così επειδή είναι εμπνευσμένα από τη δομή και τη λειτουργία του ανθρώπινου εγκεφάλου.

Οι συνδέσεις μεταξύ των κόμβων στο δίκτυο έχουν τιμές που ονομάζονται βαρύτητες. Αυτές οι τιμές είναι ουσιαστικά υποθέσεις σχετικά με το πώς τα δεδομένα σε μια στρώση σχετίζονται με τα δεδομένα στην επόμενη στρώση. Όσο το δίκτυο εκπαιδεύεται, οι βαρύτητες điều chỉnhονται και ο στόχος είναι ότι οι βαρύτητες/υποθέσεις σχετικά με τα δεδομένα θα τελικά συναντηθούν σε τιμές που αντιπροσωπεύουν με ακρίβεια τα σημαντικά μοτίβα μέσα στα δεδομένα.

Οι συναρτήσεις ενεργοποίησης υπάρχουν στους κόμβους του δικτύου και αυτές οι συναρτήσεις μετατρέπουν τα δεδομένα με μη γραμμικό τρόπο, επιτρέποντας στο δίκτυο να μάθει σύνθετες αναπαραστάσεις των δεδομένων. Οι συναρτήσεις ενεργοποίησης πολλαπλασιάζουν τις τιμές εισόδου με τις τιμές βαρύτητας και προσθέτουν einen όρο προκαταβολής.

Τι είναι το Deep Learning;

Το deep learning είναι ο όρος που δίνεται στις αρχιτεκτονικές μηχανικής μάθησης που συνδυάζουν πολλά πολυστιβαία персέπτρον, ώστε να μην υπάρχει μόνο μια κρυφή στρώση αλλά πολλές κρυφές στρώσεις. Το «βαθύτερο» που είναι το βαθύ νευρωνικό δίκτυο, το πιο σύνθετο μοτίβο που μπορεί να μάθει το δίκτυο.

Τα δίκτυα βαθιάς στρώσης που αποτελούνται από νεύρωνες ονομάζονται đôi φορά πλήρως συνδεδεμένα δίκτυα ή πλήρως συνδεμένες στρώσεις, αναφερόμενα στο γεγονός ότι ένα δεδομένο νεύρωνας διατηρεί μια σύνδεση με όλα τα νεύρωνα που το περιβάλλουν. Τα πλήρως συνδεδεμένα δίκτυα μπορούν να συνδυαστούν με άλλες συναρτήσεις μηχανικής μάθησης για να δημιουργήσουν διαφορετικές αρχιτεκτονικές deep learning.

Διαφορετικά Είδη Deep Learning

Υπάρχουν πολλά διαφορετικά είδη αρχιτεκτονικών deep learning που χρησιμοποιούνται από ερευνητές και μηχανικούς και κάθε ένα από αυτά τα διαφορετικά είδη έχει τη δική του ειδική περίπτωση χρήσης.

Νευρωνικά Δίκτυα Συσφίξεως

Νευρωνικά δίκτυα συσφίξεως, ή CNN, είναι η αρχιτεκτονική νευρωνικού δικτύου που χρησιμοποιείται συνήθως στη δημιουργία συστημάτων υπολογιστικής όρασης. Η δομή των νευρωνικών δικτύων συσφίξεως επιτρέπει να ερμηνεύουν δεδομένα εικόνων, μετατρέποντάς τα σε αριθμούς που ένα πλήρως συνδεδεμένο δίκτυο μπορεί να ερμηνεύσει. Ένα CNN έχει τέσσερις κύριες συνιστώσες:

  • Στρώσεις συσφίξεως
  • Στρώσεις υποδειγματοποίησης/πools
  • Συναρτήσεις ενεργοποίησης
  • Πλήρως συνδεμένες στρώσεις

Οι στρώσεις συσφίξεως είναι αυτές που λαμβάνουν τις εικόνες ως εισόδους στο δίκτυο, αναλύοντας τις εικόνες και λαμβάνοντας τις τιμές των pixel. Η υποδειγματοποίηση ή πools είναι όπου οι τιμές εικόνων μετατρέπονται/μειώνονται για να απλοποιηθεί η αναπαράσταση των εικόνων και να μειωθεί η ευαισθησία των φίλτρων εικόνων στο θόρυβο. Οι συναρτήσεις ενεργοποίησης ελέγχουν πώς τα δεδομένα ρέουν από τη μια στρώση στην επόμενη στρώση και οι πλήρως συνδεμένες στρώσεις είναι αυτές που αναλύουν τις τιμές που αντιπροσωπεύουν την εικόνα και μάθουν τα μοτίβα που περιέχονται σε αυτές τις τιμές.

ΡNN/LSTM

ΡNN, ή αναδρομικά νευρωνικά δίκτυα, είναι δημοφιλή για εργασίες όπου η σειρά των δεδομένων έχει σημασία, όπου το δίκτυο πρέπει να μάθει για μια ακολουθία δεδομένων. Τα RNN εφαρμόζονται συνήθως σε προβλήματα όπως η επεξεργασία φυσικής γλώσσας, επειδή η σειρά των λέξεων έχει σημασία όταν αποκωδικοποιούμε τη σημασία μιας πρότασης. Η «αναδρομική» частина του όρου Αναδρομικά Νευρωνικά Δίκτυα προέρχεται από το γεγονός ότι η έξοδος για ένα δεδομένο στοιχείο σε μια ακολουθία εξαρτάται από την προηγούμενη υπολογισμένη τιμή καθώς και από την τρέχουσα υπολογισμένη τιμή. Σε αντίθεση με άλλους τύπους βαθιάς μάθησης, τα RNN έχουν «μνήμη» και οι πληροφορίες που υπολογίζονται στις διαφορετικές χρονικές στιγμές της ακολουθίας χρησιμοποιούνται για να υπολογιστούν οι τελικές τιμές.

Υπάρχουν πολλά είδη RNN, συμπεριλαμβανομένων των RNN με διεύθυνση, τα οποία λαμβάνουν υπόψη τα μελλοντικά στοιχεία της ακολουθίας, εκτός από τα προηγούμενα στοιχεία, όταν υπολογίζουν την τιμή ενός στοιχείου. Ένας άλλος τύπος RNN είναι το Δίκτυο Μικρής και Μακράς Μνήμης, ή LSTM. Τα LSTM είναι τύποι RNN που μπορούν να χειριστούν μακρές αλυσίδες δεδομένων. Τα κανονικά RNN μπορεί να πέσουν θύματα του προβλήματος της «εκρηκτικής κλίσης». Αυτό το ζήτημα συμβαίνει όταν η αλυσίδα των δεδομένων εισόδου γίνεται πολύ μακρά, αλλά τα LSTM έχουν τεχνικές για να καταπολεμήσουν αυτό το πρόβλημα.

Αυτοκωδικοποιητές

Τα περισσότερα από τα είδη deep learning που αναφέρθηκαν μέχρι τώρα εφαρμόζονται σε προβλήματα εποπτευόμενης μάθησης, 而 όχι σε εργασίες ανεπόπτητης μάθησης. Οι αυτοκωδικοποιητές μπορούν να μετατρέψουν ανεπόπτητη δεδομένα σε εποπτευόμενη μορφή, επιτρέποντας στα νευρωνικά δίκτυα να χρησιμοποιηθούν στο πρόβλημα.

Οι αυτοκωδικοποιητές χρησιμοποιούνται συχνά για την ανίχνευση ανωμαλιών σε συνόλους δεδομένων, ένα παράδειγμα ανεπόπτητης μάθησης, επειδή η φύση της ανωμαλίας δεν είναι γνωστή. Τέτοια παραδείγματα ανίχνευσης ανωμαλιών περιλαμβάνουν την ανίχνευση απάτης για τις χρηματοοικονομικές ιδρύματα. Σε αυτό το πλαίσιο, ο σκοπός ενός αυτοκωδικοποιητή είναι να καθορίσει μια βάση κανονικών μοτίβων στα δεδομένα και να αναγνωρίσει ανωμαλίες ή εκκεντρικούς.

Η δομή ενός αυτοκωδικοποιητή είναι συχνά συμμετρική, με κρυφές στρώσεις διατεταγμένες так, ώστε η έξοδος του δικτύου να μοιάζει με την είσοδο. Οι τέσσερις τύποι αυτοκωδικοποιητών που χρησιμοποιούνται συχνά είναι:

  • Κανονικοί/περιορισμένοι αυτοκωδικοποιητές
  • Πολυστρωματικοί κωδικοποιητές
  • Συσφιγκτικοί κωδικοποιητές
  • Κανονισμένοι κωδικοποιητές

Οι κανονικοί/περιορισμένοι αυτοκωδικοποιητές είναι απλά νευρωνικά δίκτυα με μια seule κρυφή στρώση, ενώ οι πολυστρωματικοί αυτοκωδικοποιητές είναι βαθιά δίκτυα με περισσότερες από μια κρυφές στρώσεις. Οι συσφιγκτικοί αυτοκωδικοποιητές χρησιμοποιούν συσφιγκτικές στρώσεις αντί για, ή εκτός από, πλήρως συνδεμένες στρώσεις. Οι κανονισμένοι αυτοκωδικοποιητές χρησιμοποιούν một ειδικό είδος συνάρτησης απώλειας που επιτρέπει στο νευρωνικό δίκτυο να εκτελεί πιο σύνθετες συναρτήσεις, συναρτήσεις πέρα από την απλή αντιγραφή εισόδου σε έξοδο.

Αντιπαλικές Γεννήτριες Δίκτυα

Τα Αντιπαλικά Γεννήτριες Δίκτυα (GAN) είναι στην πραγματικότητα πολλά βαθιά νευρωνικά δίκτυα αντί για ένα μόνο δίκτυο. Δύο βαθιά μοντέλα μάθησης εκπαιδεύονται ταυτόχρονα και οι εξόδους τους τροφοδοτούνται στο άλλο δίκτυο. Τα δίκτυα είναι σε ανταγωνισμό μεταξύ τους και既然 λαμβάνουν πρόσβαση στα δεδομένα εξόδου του άλλου, και τα δύο μαθαίνουν από αυτά τα δεδομένα και βελτιώνονται. Τα δίκτυα είναι ουσιαστικά ένα παιχνίδι πλαστογράφησης και ανίχνευσης, όπου το γεννήτρια μοντέλο προσπαθεί να δημιουργήσει νέα παραδείγματα που θα απομακρύνουν το μοντέλο ανίχνευσης/το διακριτικό. Τα GAN έχουν γίνει δημοφιλή στο πεδίο της υπολογιστικής όρασης.

Σύνοψη Deep Learning

Το deep learning επεκτείνει τις αρχές των νευρωνικών δικτύων για να δημιουργήσει σύνθετα μοντέλα που μπορούν να μάθουν σύνθετα μοτίβα και να γενικεύσουν αυτά τα μοτίβα σε μελλοντικά συνόλα δεδομένων. Τα νευρωνικά δίκτυα συσφίξεως χρησιμοποιούνται για την ερμηνεία εικόνων, ενώ τα RNN/LSTM χρησιμοποιούνται για την ερμηνεία ακολουθιακών δεδομένων. Οι αυτοκωδικοποιητές μπορούν να μετατρέψουν ανεπόπτητη εργασίες μάθησης σε εποπτευόμενη μορφή. Τέλος, τα GAN είναι πολλά δίκτυα που αντιτάσσονται μεταξύ τους και είναι ιδιαίτερα χρήσιμα για εργασίες υπολογιστικής όρασης.

Blogger και προγραμματιστής με ειδικότητες στα Machine Learning και Deep Learning θέματα. Ο Daniel ελπίζει να βοηθήσει τους άλλους να χρησιμοποιήσουν τη δύναμη του AI για κοινωνικό καλό.