AI 101

Τι είναι το Meta-Learning;

Ενημερώθηκε on Αύγουστος 23, 2020

Τι είναι το Meta-Learning;

Ένας από τους ταχύτερα αναπτυσσόμενους τομείς έρευνας στη μηχανική μάθηση είναι ο τομέας του μετα-learning. Η μετα-μάθηση, στο πλαίσιο της μηχανικής μάθησης, είναι η χρήση αλγορίθμων μηχανικής μάθησης για να βοηθήσει στην εκπαίδευση και τη βελτιστοποίηση άλλων μοντέλων μηχανικής μάθησης. Καθώς η μετα-μάθηση γίνεται όλο και πιο δημοφιλής και αναπτύσσονται περισσότερες τεχνικές μετα-μάθησης, είναι ωφέλιμο να κατανοήσουμε τι είναι η μετα-μάθηση και να έχουμε μια αίσθηση των διάφορων τρόπων που μπορεί να εφαρμοστεί. Ας εξετάσουμε τις ιδέες πίσω από τη μετα-μάθηση, είδη μετα-μάθησης, καθώς και μερικούς από τους τρόπους με τους οποίους μπορεί να χρησιμοποιηθεί η μετα-μάθηση.

Ο όρος μετα-μάθηση επινοήθηκε από τον Donald Maudsley για να περιγράψει μια διαδικασία με την οποία οι άνθρωποι αρχίζουν να διαμορφώνουν αυτό που μαθαίνουν, αποκτώντας «ολοένα και περισσότερο έλεγχο των συνηθειών αντίληψης, έρευνας, μάθησης και ανάπτυξης που έχουν εσωτερικεύσει». Αργότερα, οι γνωστικοί επιστήμονες και οι ψυχολόγοι θα περιέγραφαν τη μετα-μάθηση ως «μάθηση πώς να μαθαίνεις».

Για την έκδοση μηχανικής μάθησης της μετα-μάθησης, η γενική ιδέα του «μαθαίνω πώς να μαθαίνω» εφαρμόζεται στα συστήματα τεχνητής νοημοσύνης. Με την έννοια της τεχνητής νοημοσύνης, η μετα-μάθηση είναι η ικανότητα μιας τεχνητά ευφυούς μηχανής να μαθαίνει πώς να εκτελεί διάφορες σύνθετες εργασίες, ακολουθώντας τις αρχές που χρησιμοποιούσε για να μάθει μια εργασία και εφαρμόζοντάς την σε άλλες εργασίες. Τα συστήματα τεχνητής νοημοσύνης τυπικά πρέπει να εκπαιδεύονται για να ολοκληρώσουν μια εργασία μέσω του mastering πολλών μικρών δευτερευουσών εργασιών. Αυτή η εκπαίδευση μπορεί να διαρκέσει πολύ και οι πράκτορες AI δεν μεταφέρουν εύκολα τη γνώση που αποκτήθηκε κατά τη διάρκεια μιας εργασίας σε μια άλλη εργασία. Η δημιουργία μοντέλων και τεχνικών μετα-μάθησης μπορεί να βοηθήσει την τεχνητή νοημοσύνη να μάθει να γενικεύει μεθόδους μάθησης και να αποκτά νέες δεξιότητες πιο γρήγορα.

Τύποι Meta-Learning

Optimizer Meta-Learning

Η μετα-μάθηση χρησιμοποιείται συχνά για τη βελτιστοποίηση της απόδοσης ενός ήδη υπάρχοντος νευρωνικού δικτύου. Οι μέθοδοι μετα-εκμάθησης του Optimizer λειτουργούν συνήθως τροποποιώντας τις υπερπαραμέτρους ενός διαφορετικού νευρωνικού δικτύου προκειμένου να βελτιωθεί η απόδοση του βασικού νευρωνικού δικτύου. Το αποτέλεσμα είναι ότι το δίκτυο-στόχος θα πρέπει να γίνει καλύτερο στην εκτέλεση της εργασίας στην οποία εκπαιδεύεται. Ένα παράδειγμα βελτιστοποίησης μετα-μάθησης είναι η χρήση ενός δικτύου για βελτίωση κλίση κατάβασης αποτελέσματα.

Few-Shots Meta-Learning

Μια προσέγγιση μετα-μάθησης λίγων λήψεων είναι μια προσέγγιση όπου κατασκευάζεται ένα βαθύ νευρωνικό δίκτυο το οποίο είναι ικανό να γενικεύει από τα σύνολα δεδομένων εκπαίδευσης σε μη ορατά σύνολα δεδομένων. Μια περίπτωση ταξινόμησης λίγων λήψεων είναι παρόμοια με μια κανονική εργασία ταξινόμησης, αλλά αντ' αυτού, τα δείγματα δεδομένων είναι ολόκληρα σύνολα δεδομένων. Το μοντέλο εκπαιδεύεται σε πολλές διαφορετικές μαθησιακές εργασίες/σύνολα δεδομένων και στη συνέχεια βελτιστοποιείται για κορυφαία απόδοση στο πλήθος των εκπαιδευτικών εργασιών και των αόρατων δεδομένων. Σε αυτή την προσέγγιση, ένα ενιαίο δείγμα εκπαίδευσης χωρίζεται σε πολλαπλές τάξεις. Αυτό σημαίνει ότι κάθε δείγμα προπόνησης/σύνολο δεδομένων θα μπορούσε ενδεχομένως να αποτελείται από δύο κατηγορίες, για συνολικά 4 βολές. Σε αυτή την περίπτωση, η συνολική εκπαιδευτική εργασία θα μπορούσε να περιγραφεί ως εργασία ταξινόμησης 4 βολών 2 τάξεων.

Στην εκμάθηση με λίγες λήψεις, η ιδέα είναι ότι τα μεμονωμένα δείγματα εκπαίδευσης είναι μινιμαλιστικά και ότι το δίκτυο μπορεί να μάθει να αναγνωρίζει αντικείμενα αφού δει μόνο μερικές εικόνες. Αυτό μοιάζει πολύ με το πώς ένα παιδί μαθαίνει να διακρίνει αντικείμενα αφού δει μόνο μερικές εικόνες. Αυτή η προσέγγιση έχει χρησιμοποιηθεί για τη δημιουργία τεχνικών όπως τα μοντέλα παραγωγής μιας λήψης και τα νευρωνικά δίκτυα επαυξημένης μνήμης.

Metric Meta-Learning

Η μετα-μάθηση με βάση τη μέτρηση είναι η χρήση νευρωνικών δικτύων για να προσδιοριστεί εάν μια μέτρηση χρησιμοποιείται αποτελεσματικά και εάν το δίκτυο ή τα δίκτυα επιτυγχάνουν τη μέτρηση-στόχο. Η μετρική μετα-εκμάθηση είναι παρόμοια με την εκμάθηση με λίγες λήψεις, καθώς χρησιμοποιούνται λίγα μόνο παραδείγματα για την εκπαίδευση του δικτύου και την εκμάθηση του μετρικού χώρου. Η ίδια μέτρηση χρησιμοποιείται σε διάφορους τομείς και εάν τα δίκτυα αποκλίνουν από τη μέτρηση θεωρείται ότι αποτυγχάνουν.

Επαναλαμβανόμενο μοντέλο μετα-μάθησης

Το επαναλαμβανόμενο μοντέλο μετα-μάθησης είναι η εφαρμογή τεχνικών μετα-μάθησης σε επαναλαμβανόμενα νευρωνικά δίκτυα και παρόμοια δίκτυα μακροπρόθεσμης βραχυπρόθεσμης μνήμης. Αυτή η τεχνική λειτουργεί εκπαιδεύοντας το μοντέλο RNN/LSTM ώστε να μαθαίνει διαδοχικά ένα σύνολο δεδομένων και στη συνέχεια χρησιμοποιώντας αυτό το εκπαιδευμένο μοντέλο ως βάση για έναν άλλο μαθητή. Ο μετα-μαθητής υιοθετεί τον συγκεκριμένο αλγόριθμο βελτιστοποίησης που χρησιμοποιήθηκε για την εκπαίδευση του αρχικού μοντέλου. Η κληρονομημένη παραμετροποίηση του meta-learner του δίνει τη δυνατότητα να αρχικοποιείται γρήγορα και να συγκλίνει, αλλά εξακολουθεί να μπορεί να ενημερώνεται για νέα σενάρια.

Πώς λειτουργεί το Meta-Learning;

Ο ακριβής τρόπος με τον οποίο διεξάγεται η μετα-μάθηση ποικίλλει ανάλογα με το μοντέλο και τη φύση της εργασίας. Ωστόσο, σε γενικές γραμμές, ένα έργο μετα-μάθησης περιλαμβάνει αντιγραφή των παραμέτρων του πρώτου δικτύου στις παραμέτρους του δεύτερου δικτύου/του βελτιστοποιητή.

Υπάρχουν δύο διαδικασίες εκπαίδευσης στη μετα-μάθηση. Το μοντέλο μετα-μάθησης συνήθως εκπαιδεύεται μετά από πολλά βήματα εκπαίδευσης στο βασικό μοντέλο. Μετά τα βήματα προς τα εμπρός, προς τα πίσω και βελτιστοποίησης που εκπαιδεύουν το βασικό μοντέλο, εκτελείται το πάσο εκπαίδευσης προς τα εμπρός για το μοντέλο βελτιστοποίησης. Για παράδειγμα, μετά από τρία ή τέσσερα βήματα εκπαίδευσης στο βασικό μοντέλο, υπολογίζεται μια μετα-απώλεια. Αφού υπολογιστεί η μετα-απώλεια, υπολογίζονται οι διαβαθμίσεις για κάθε μετα-παράμετρο. Αφού συμβεί αυτό, ενημερώνονται οι μετα-παράμετροι στο βελτιστοποιητή.

Μια δυνατότητα για τον υπολογισμό της μετα-απώλειας είναι να ολοκληρώσετε το πάσο προπόνησης του αρχικού μοντέλου και στη συνέχεια να συνδυάσετε τις απώλειες που έχουν ήδη υπολογιστεί. Ο μετα-βελτιστοποιητής θα μπορούσε ακόμη και να είναι ένας άλλος μετα-μαθητής, αν και σε κάποιο σημείο πρέπει να χρησιμοποιηθεί ένας διακριτός βελτιστοποιητής όπως το ADAM ή το SGD.

Πολλά μοντέλα βαθιάς μάθησης μπορεί να έχουν εκατοντάδες χιλιάδες ή και εκατομμύρια παραμέτρους. Η δημιουργία ενός meta-learner που έχει ένα εντελώς νέο σύνολο παραμέτρων θα ήταν υπολογιστικά δαπανηρή και για αυτόν τον λόγο, συνήθως χρησιμοποιείται μια τακτική που ονομάζεται κοινή χρήση συντεταγμένων. Η κοινή χρήση συντεταγμένων περιλαμβάνει τη μηχανική του meta-learner/βελτιστοποιητή, έτσι ώστε να μαθαίνει μια μόνο παράμετρο από το βασικό μοντέλο και στη συνέχεια απλώς να κλωνοποιεί αυτήν την παράμετρο στη θέση όλων των άλλων παραμέτρων. Το αποτέλεσμα είναι ότι οι παράμετροι που διαθέτει ο βελτιστοποιητής δεν εξαρτώνται από τις παραμέτρους του μοντέλου.

Σχετικά θέματα:101 μετα-learning

Επόμενο

Τι είναι η backpropagation;

Μην χάσετε

Τι είναι τα CNN (Συνελικτικά Νευρωνικά Δίκτυα);

Ντάνιελ Νέλσον

Blogger και προγραμματιστής με ειδικότητες στο Μηχανική μάθηση και Βαθιά μάθηση Θέματα. Ο Daniel ελπίζει να βοηθήσει άλλους να χρησιμοποιήσουν τη δύναμη της τεχνητής νοημοσύνης για κοινωνικό καλό.

Unite.AI

Τι είναι το Meta-Learning;

AI 101

Τι είναι το Meta-Learning;

Πίνακας περιεχομένων

Τι είναι το Meta-Learning;

Τύποι Meta-Learning

Πώς λειτουργεί το Meta-Learning;

Unite.AI

Τι είναι το Meta-Learning;

Πίνακας περιεχομένων

Τι είναι το Meta-Learning;

Τύποι Meta-Learning

Πώς λειτουργεί το Meta-Learning;

Μπορεί να σου αρέσει