Ηγέτες της σκέψης
Η ανθρωποειδής εποχή δεν έρχεται — είναι ήδη εδώ

Νωρίτερα αυτόν τον μήνα, στην Κίνα, ένα ανθρωποειδές ρομπότ με το όνομα Ο Σουάνγκ Σουάνγκ ανέβηκε στη σκηνή σε μια τελετή αποφοίτησης λυκείου στο Φουτζιάν για την παραλαβή ενός διπλώματος — σφίγγοντας τα χέρια και ενθουσίαζοντας μαθητές και καθηγητές. Στιγμές σαν κι αυτές αντιπροσωπεύουν μια ουσιαστική αλλαγή, μια αλλαγή στην οποία τα ανθρωποειδή ρομπότ αρχίζουν να εισέρχονται στη δημόσια ζωή με πολύ ορατούς τρόπους.
Αυτές οι στιγμές σηματοδοτούν κάτι περισσότερο από την απλή δημόσια περιέργεια — σηματοδοτούν μια στροφή προς την ενσωμάτωση στον πραγματικό κόσμο. Αυτό το άρθρο διερευνά πώς τα ανθρωποειδή μεταβαίνουν από το θέαμα και την επίδειξη στη λειτουργικότητα — και γιατί αυτό που φαίνεται να είναι ένα κατόρθωμα που βασίζεται μόνο στο υλικό αφορά, στην πραγματικότητα, την ενσωματωμένη νοημοσύνη που επιτρέπει σε αυτές τις μηχανές να περπατούν, να αλληλεπιδρούν και να μαθαίνουν σε περιβάλλοντα που δεν έχουν σχεδιαστεί για αυτοματοποίηση. Θα συζητήσουμε επίσης πώς προσεγγίζουμε την εμπορευματοποίηση μέσω της έγκαιρης ανάπτυξης και των μακροπρόθεσμων συνεργασιών.
Πώς τα ανθρωποειδή ωθούν την Τεχνητή Νοημοσύνη στον πραγματικό κόσμο
Το χάσμα μεταξύ της εικονικής απόδοσης και της φυσικής αξιοπιστίας παραμένει μια από τις πιο παραβλεπόμενες προκλήσεις στην Τεχνητή Νοημοσύνη. Ένα chatbot μπορεί να δημιουργήσει παραγράφους με άπταιστο κείμενο χωρίς να χρειάζεται ποτέ να ενεργήσει πάνω σε αυτές — με τον ίδιο τρόπο που ένα μοντέλο όρασης μπορεί να αναγνωρίσει ένα βήμα σε μια εικόνα χωρίς να χρειάζεται να την πλοηγηθεί φυσικά ή να διακινδυνεύσει να πέσει. Τα ανθρωποειδή δεν έχουν αυτή την πολυτέλεια.
Για να λειτουργήσει στον πραγματικό κόσμο, η Τεχνητή Νοημοσύνη πρέπει να αφήνει πίσω της στατικά σύνολα δεδομένων και ελεγχόμενες συνθήκες. Πρέπει να βλέπει, να αποφασίζει και να ενεργεί σε περιβάλλοντα που μεταβάλλονται δευτερόλεπτο προς δευτερόλεπτο. Αυτό περιλαμβάνει ανώμαλα δάπεδα, αντικείμενα που δεν έχουν τοποθετηθεί σωστά, απρόβλεπτη ανθρώπινη συμπεριφορά και μη λεκτικά σήματα που εξαρτώνται από το περιβάλλον. Το αποτέλεσμα είναι μια καθημερινή αντιπαράθεση με θόρυβο, ασάφεια και πιθανή αποτυχία.
Εδώ είναι που η ενσωματωμένη συλλογιστική — όπου η γλώσσα βασίζεται στον χώρο, τον χρόνο και τις συνέπειες — αρχίζει να έχει μεγαλύτερη σημασία από την πρόχειρη πρόβλεψη. Για παράδειγμα, αν ένας άνθρωπος πει «προσοχή, είναι ολισθηρό», το ρομπότ πρέπει να συνδέσει αυτή τη φράση όχι μόνο με τον ορισμό μιας λέξης, αλλά και με την αντίληψη του χώρου, τους πιθανούς κινδύνους και τις προσαρμογές σε πραγματικό χρόνο.
Ταυτόχρονα, η πολυτροπική μάθηση καθίσταται απαραίτητη, επειδή κανένα μεμονωμένο κανάλι εισόδου δεν είναι αρκετά αξιόπιστο για να λειτουργήσει μόνο του. Μια κάμερα μπορεί να μην εντοπίσει μια λεία επιφάνεια, αλλά οι αισθητήρες πίεσης στο πόδι μπορούν να ανιχνεύσουν μια ξαφνική απώλεια πρόσφυσης. Ή, σε μια άλλη περίπτωση, η αναγνώριση ομιλίας μπορεί να αποτύχει σε μια θορυβώδη αποθήκη, αλλά οπτικές ενδείξεις ή χειρονομίες μπορούν να καλύψουν το κενό.
Η γενίκευση καθίσταται επίσης κρίσιμη. Ένα ρομπότ δεν μπορεί να βασίζεται στο να βλέπει το ακριβές περιβάλλον δύο φορές. Πρέπει να προσαρμόζει τη συμπεριφορά του όταν το πάτωμα είναι βρεγμένο, ο φωτισμός αλλάζει ή το κουτί δεν είναι εκεί που ήταν χθες. Αυτή είναι η διαφορά μεταξύ επιτυχημένης εκτέλεσης και αποτυχίας.
Στην Humanoid, αυτός είναι ο λόγος για τον οποίο ξεκινάμε νωρίς τις δοκιμές με εμπορικούς συνεργάτες. Ενσωματώνουμε τα ρομπότ μας σε ζωντανά περιβάλλοντα για να εντοπίζουμε άμεσα πιθανά ελαττώματα και να διασφαλίζουμε τη βέλτιστη λειτουργία πριν από την ανάπτυξη. Ένα ρομπότ που αποδίδει καλά σε προσομοίωση ή επίδειξη δεν είναι το ίδιο με ένα που κερδίζει την εμπιστοσύνη υπό πίεση, επειδή αυτή η εμπιστοσύνη τελικά βασίζεται στη μάθηση από τον πραγματικό κόσμο.
Γνωρίζουμε ότι τα ανθρωποειδή θα είναι εμπορικά διαθέσιμα μέσα στα επόμενα δύο χρόνια — αλλά δεν περιμένουμε. Για εμάς, η εμπορευματοποίηση ξεκινά νωρίς. Σημαίνει οικοδόμηση μακροπρόθεσμων συνεργασιών γύρω από πραγματικές περιπτώσεις χρήσης. Μέσω μιας σειράς πιλοτικών προγραμμάτων, όχι μόνο εκπαιδεύουμε τους συνεργάτες μας σχετικά με την τεχνολογία — αλλά μαθαίνουμε και μαζί τους. Αυτή η κοινή διαδικασία μάθησης μας βοηθά επίσης να βελτιώσουμε τις δομές κόστους και την αξιοπιστία της απόδοσης από την πρώτη κιόλας μέρα — εξασφαλίζοντας το καλύτερο δυνατό συνολικό κόστος ιδιοκτησίας (TCO) καθώς τα συστήματα κλιμακώνονται.
Γιατί τα ανθρωποειδή είναι το απόλυτο πεδίο δοκιμών για τη γενική νοημοσύνη
Ο κόσμος που έχουμε δημιουργήσει τα τελευταία εκατό χρόνια είναι προσαρμοσμένος στην ανθρώπινη κλίμακα. Λαβές θυρών, περονοφόρα ανυψωτικά μηχανήματα, αποθήκες — όλα αποκτούν συγκεκριμένες διαστάσεις, εύρος κίνησης και έμμεσες κοινωνικές συμπεριφορές. Τα ανθρωποειδή πρέπει να προσαρμοστούν σε αυτήν την πραγματικότητα, διαφορετικά κινδυνεύουν να έχουν εξαιρετικά περιορισμένη λειτουργικότητα.
Για να ανέβει τις σκάλες, να μεταφέρει ένα αντικείμενο, να ερμηνεύσει μια χειρονομία κατάδειξης ή να αναγνωρίσει δισταγμό σε μια φωνή, ένα ρομπότ πρέπει να κατανοήσει το πλαίσιο πολύ πέρα από την οπτική ταξινόμηση ή τον προγραμματισμένο σχεδιασμό κίνησης. Πρέπει να συμπεράνει την πρόθεση, να μάθει μια νέα εργασία παρακολουθώντας έναν άνθρωπο, να προσαρμόσει αυτήν την δεξιότητα σε μια ελαφρώς διαφορετική διάταξη και να βελτιώσει την απόδοσή του με την πάροδο του χρόνου. Στην πράξη, αυτό το σύστημα ουσιαστικά επεκτείνει αυτό που μπορεί να κάνει η Τεχνητή Νοημοσύνη υπό πραγματικούς περιορισμούς.
Στην Humanoid, επιταχύνουμε αυτή τη διαδικασία μέσω τηλεχειρισμού. Στα αρχικά στάδια ανάπτυξης, οι ανθρώπινοι χειριστές καθοδηγούν το ρομπότ σε βασικές εργασίες. Αυτά τα πρακτικά δεδομένα γίνονται η βάση για την εκπαίδευση νέων συμπεριφορών. Με την πάροδο του χρόνου, αυτές οι επιδείξεις τροφοδοτούν τα ολοκληρωμένα μοντέλα μας, βοηθώντας μας να οικοδομήσουμε μια αξιόπιστη αυτονομία.
Από τα στενά συστήματα στην ολοκληρωμένη νοημοσύνη
Τα περισσότερα συστήματα Τεχνητής Νοημοσύνης σήμερα διαπρέπουν σε περιορισμένες εργασίες. Μεμονωμένα, καθένα από αυτά λειτουργεί καλά. Αλλά τα ανθρωποειδή δεν χρειάζονται αποσυνδεδεμένους ειδικούς. Για να ενσωματωθούν με επιτυχία, χρειαζόμαστε συστήματα που μπορούν να συλλογιστούν σε διάφορες μεθόδους και χρονικά πλαίσια.
Ένα ανθρωποειδές μπορεί να λάβει μια σχετικά αόριστη οδηγία — «Πήγαινε να μου φέρεις το κίτρινο κουτί από την αποθήκη απέναντι από το διάδρομο» — και να πρέπει να την αποκωδικοποιήσει σε μια ακολουθία δευτερευουσών εργασιών: να εντοπίσει τον ομιλητή, να πλοηγηθεί σε έναν διάδρομο, να εντοπίσει το σωστό κουτί, να ρυθμίσει τη δύναμη λαβής, να αποφύγει τις συγκρούσεις και, φυσικά, να επιστρέψει με ασφάλεια.
Κάθε μέρος αυτής της ακολουθίας περιλαμβάνει ένα διαφορετικό υποσύστημα — όραση, μετακίνηση, γλώσσα, χειραγώγηση και ανατροφοδότηση. Και η αξιοπιστία του συνόλου εξαρτάται από το πόσο καλά επικοινωνούν αυτά τα μέρη υπό μεταβαλλόμενες συνθήκες.
Η αρθρωτή αρχιτεκτονική είναι ένας τρόπος για να αντιμετωπιστεί αυτή η πρόκληση. Αυτό μας επιτρέπει να επεξεργαστούμε επαναληπτικά υποσυστήματα ανεξάρτητα, επιτυγχάνοντας παράλληλα συντονισμό σε ολόκληρο το σύστημα. Επιπλέον, αυτό μας επιτρέπει να κλιμακώνουμε δυνατότητες σε πολλαπλά περιβάλλοντα χωρίς να χρειάζεται να τα ανακατασκευάσουμε από την αρχή. Έτσι μεταβαίνουμε από κλειστά demos σε απόδοση ανοιχτού κόσμου.
Τα διακυβεύματα είναι τεράστια — και είναι παγκόσμια
Είναι εύκολο να θεωρήσουμε τα ανθρωποειδή ως φουτουριστικά. Αλλά όταν μιλάμε με τους πελάτες μας, η ανάγκη είναι άμεση. Πολλές αποθήκες, γραμμές συναρμολόγησης και άλλοι κάποτε πολυάσχολοι χώροι εργασίας αγωνίζονται τώρα να παραμείνουν στελεχωμένοι.
Αυτές οι ελλείψεις εργατικού δυναμικού αποτελούν δημογραφικά ζητήματα. Στην Ιαπωνία, σχεδόν το 30% του πληθυσμού είναι άνω των 65 ετώνΣτην Ευρώπη, βασικοί τομείς — οι οποίοι έχουν συνδυασμένο μισθοδοσία ύψους 1.7 τρισεκατομμυρίων δολαρίων - είναι δυσκολεύονται να προσλάβουν νεότερους εργαζόμενουςΑυτοί δεν είναι οι ρόλοι που επιθυμούν οι περισσότεροι άνθρωποι, και ολοένα και περισσότερο, όχι οι ρόλοι που είναι διατεθειμένοι να αναλάβουν.
Έχοντας ως βοηθούς και όχι ως αντικαταστάτες, τα ανθρωποειδή μπορούν να αναλάβουν σωματικά απαιτητικές, επαναλαμβανόμενες ή επικίνδυνες εργασίες — μετακίνηση αποθεμάτων, φόρτωση παλετών, χειρισμό μηχανημάτων — χωρίς τον κίνδυνο κόπωσης ή τραυματισμού. Αυτό απελευθερώνει τους ανθρώπους-εργάτες ώστε να επικεντρωθούν σε πιο σύνθετες, δημιουργικές ή διαπροσωπικές πτυχές της εργασίας.
Επιπλέον, αυτό δημιουργεί μακροπρόθεσμη οικονομική ανθεκτικότητα. Όταν η εργασία είναι ασταθής ή μη διαθέσιμη, οι έξυπνες μηχανές μπορούν να βοηθήσουν στη διασφάλιση της συνέχειας — όλα αυτά χωρίς να θυσιάζεται η ασφάλεια, η ποιότητα ή η προσαρμοστικότητα.
Μια άλλη πτυχή που πρέπει να επισημανθεί είναι το κανονιστικό πλαίσιο. Οι περισσότερες ομάδες — ειδικά σε περιοχές με χαλαρή ρύθμιση — περιμένουν να το σκεφτούν αυτό. Ξεκινήσαμε από εκεί. Οι νόμοι περί ασφάλειας και δεδομένων της Ευρώπης είναι από τους αυστηρότερους στον κόσμο, αλλά αντί να τους αντιμετωπίζουμε ως εμπόδια, τους θεωρούμε ανταγωνιστικό μας πλεονέκτημα. Καθώς άλλες αγορές υιοθετούν αυστηρότερους κανονισμούς, θα είμαστε έτοιμοι να τους αντιμετωπίσουμε, ενώ άλλες εταιρείες ενδέχεται να βιαστούν.
Μια νέα κούρσα τεχνητής νοημοσύνης — αλλά όχι αυτή που νομίζετε
Μεγάλο μέρος της σημερινής συζήτησης γύρω από την Τεχνητή Νοημοσύνη επικεντρώνεται στην υπολογιστική ισχύ, τις παραμέτρους και τα δεδομένα εκπαίδευσης. Αλλά η πραγματική ανακάλυψη μπορεί να προέλθει από ένα διαφορετικό όριο: την ενσωμάτωση στον φυσικό κόσμο. Εκεί πρέπει να μάθει η νοημοσύνη να αποδίδει, αντί να απλώς να προβλέπει.
Από αυτή την άποψη, ο αγώνας αφορά το πιο ικανό σύστημα — ένα σύστημα που μπορεί να λειτουργήσει σε δημόσιους χώρους, υπό περιορισμούς ασφαλείας και με τους ανθρώπους ενήμερους. Αυτό το σύστημα, εκτός από το να μαθαίνει από τα δεδομένα, θα μαθαίνει επίσης — και κυρίως — από την πραγματικότητα και θα συνεργάζεται με τους ανθρώπους χωρίς να διαταράσσει τη ροή των πραγμάτων.
Γι' αυτό δεν περιμένουμε μέχρι να ξεκινήσει η ανάπτυξη. Από την αρχή, συνεργαζόμαστε απευθείας με εμπορικούς συνεργάτες για την ενσωμάτωσή μας σε πραγματικά περιβάλλοντα — διασφαλίζοντας ότι το σύστημα βελτιώνεται εκεί που έχει τη μεγαλύτερη σημασία: στην πράξη.
Αυτού του είδους η μάθηση στον πραγματικό κόσμο είναι ακριβώς εκεί που τα στενά συστήματα υστερούν. Ενώ αυτά μας έχουν οδηγήσει μακριά, δεν σχεδιάστηκαν ποτέ για αυτό το είδος πολυπλοκότητας. Τα ανθρωποειδή απαιτούν κάτι άλλο - συντονισμό, ευρωστία και, όπως αναφέρθηκε, την ικανότητα να μαθαίνουν από το απροσδόκητο.
Αυτή είναι η τεράστια ευκαιρία που έχουμε μπροστά μας. Όχι να αυτοματοποιήσουμε τα πάντα, αλλά να κατασκευάσουμε μηχανές που μπορούν να κατανοήσουν, να πλοηγηθούν και να συνεργαστούν με τον ανθρώπινο κόσμο.