Connect with us

Το AI της Google διδάσκει τους ρομπότ να κινούνται παρακολουθώντας σκύλους

Τεχνητή νοημοσύνη

Το AI της Google διδάσκει τους ρομπότ να κινούνται παρακολουθώντας σκύλους

mm

就算 κάποια από τα πιο προηγμένα ρομπότ σήμερα ακόμη κινούνται με κάποιο τρόπο άβολη, σπασμωδική. Για να κάνουν τα ρομπότ να κινούνται με πιο φυσιολογικό, ομαλό τρόπο, ερευνητές στη Google έχουν αναπτύξει ένα σύστημα AI που είναι ικανό να μαθαίνει από τις κινήσεις των πραγματικών ζώων. Η ερευνητική ομάδα της Google δημοσίευσε ένα προ-έκδοση εγγράφου που περιέγραφε την προσέγγισή τους την περασμένη εβδομάδα. Στο έγγραφο και σε μια συνοδευτική ανάρτηση στο blog, η ερευνητική ομάδα περιγράφει το λόγο πίσω από το σύστημα. Οι συγγραφείς του εγγράφου πιστεύουν ότι η ενδυνάμωση των ρομπότ με πιο φυσιολογικές κινήσεις θα τους βοηθήσει να εκτελέσουν πραγματικές εργασίες που απαιτούν ακριβείς κινήσεις, όπως η παράδοση αντικειμένων μεταξύ διαφορετικών επιπέδων ενός κτιρίου.

Όπως ανέφερε το VentureBeat, η ερευνητική ομάδα χρησιμοποίησε ενισχυμένη μάθηση για να εκπαιδεύσει τα ρομπότ τους. Οι ερευνητές άρχισαν συλλέγοντας κλιπ πραγματικών ζώων που κινούνται και χρησιμοποιώντας τεχνικές ενισχυμένης μάθησης (RL) για να ωθήσουν τα ρομπότ να μιμηθούν τις κινήσεις των ζώων στα βίντεο κλιπ. Σε αυτή την περίπτωση, οι ερευνητές εκπαίδευσαν τα ρομπότ σε κλιπ ενός σκύλου, σχεδιασμένα σε einen φυσικό προσομοιωτή, οδηγώντας ένα τετράποδο ρομπότ Unitree Laikago να μιμηθεί τις κινήσεις του σκύλου. Μετά την εκπαίδευση του ρομπότ, ήταν ικανό να εκτελέσει σύνθετες κινήσεις όπως το πήδημα, η στροφή και το γρήγορο περπάτημα, με ταχύτητα περίπου 2,6 μιλίων την ώρα.

Τα δεδομένα εκπαίδευσης αποτελούνταν από περίπου 200 εκατομμύρια δείγματα σκύλων σε κίνηση, που παρακολουθούνται σε einen φυσικό προσομοιωτή. Οι διάφορες κινήσεις τότε περνούσαν από συνάρτηση ανταμοιβής και πολιτικές που οι πράκτορες έμαθαν με. Μετά τη δημιουργία των πολιτικών στο προσομοιωτή, μεταφέρθηκαν στον πραγματικό κόσμο χρησιμοποιώντας μια τεχνική που ονομάζεται.latent space adaptation. Επειδή οι φυσικοί προσομοιωτές που χρησιμοποιήθηκαν για την εκπαίδευση των ρομπότ μπορούσαν μόνο να προσεγγίσουν certains аспектς της πραγματικής κίνησης, οι ερευνητές εφαρμόζουν τυχαία διάφορες perturbations στο προσομοιωτή, με σκοπό να προσομοιώσουν την λειτουργία υπό διαφορετικές συνθήκες.

Σύμφωνα με την ερευνητική ομάδα, ήταν σε θέση να προσαρμόσουν τις πολιτικές του προσομοιωτή στα πραγματικά ρομπότ χρησιμοποιώντας μόνο 8 λεπτά δεδομένων που συλλέχθηκαν από 50 διαφορετικές δοκιμές. Οι ερευνητές κατάφεραν να αποδείξουν ότι τα πραγματικά ρομπότ ήταν ικανά να μιμηθούν eine ποικιλία διαφορετικών, συγκεκριμένων κινήσεων όπως το τρέξιμο, η στροφή, το πήδημα και το περπάτημα. Ήταν ακόμη ικανά να μιμηθούν animations που δημιουργήθηκαν από καλλιτέχνες animation, όπως eine συνδυασμός πήδησης και στροφής.

Οι ερευνητές συνοψίζουν τα ευρήματα στο έγγραφο:

«Δείχνουμε ότι με την αξιοποίηση δεδομένων αναφοράς κίνησης, μια seule μάθηση-βασισμένη προσέγγιση είναι ικανή να συνθέσει αυτόματα ελεγκτές για eine ποικιλία συμπεριφορών για ρομπότ με πόδια. Με την ενσωμάτωση τεχνικών προσαρμογής τομέα δειγμάτων στην διαδικασία εκπαίδευσης, το σύστημά μας είναι ικανό να μάθει προσαρμοστικές πολιτικές στο προσομοιωτή που μπορούν να μεταφερθούν γρήγορα για ανάπτυξη στον πραγματικό κόσμο».

Οι πολιτικές ελέγχου που χρησιμοποιήθηκαν κατά τη διαδικασία ενισχυμένης μάθησης είχαν τους περιορισμούς τους. Λόγω των περιορισμών που επιβλήθηκαν από το υλικό και τους αλγόριθμους, υπήρχαν κάποια πράγματα που τα ρομπότ απλά δεν μπορούσαν να κάνουν. Δεν ήταν ικανά να τρέξουν ή να κάνουν μεγάλες πηδήξεις, για παράδειγμα. Οι πολιτικές που μάθανε επίσης δεν εμφάνισαν τόσο σταθερότητα σε σύγκριση με τις κινήσεις που σχεδιάστηκαν χειροκίνητα. Η ερευνητική ομάδα θέλει να πάρει το έργο παραπέρα, καθιστώντας τους ελεγκτές πιο ανθεκτικούς και ικανούς να μάθουν από διαφορετικά είδη δεδομένων. Ιδανικά, μελλοντικές εκδόσεις του πλαισίου θα είναι ικανές να μάθουν από δεδομένα βίντεο.

Blogger και προγραμματιστής με ειδικότητες στα Machine Learning και Deep Learning θέματα. Ο Daniel ελπίζει να βοηθήσει τους άλλους να χρησιμοποιήσουν τη δύναμη του AI για κοινωνικό καλό.