Συνδεθείτε μαζί μας

Προώθηση της ενσωματωμένης τεχνητής νοημοσύνης: Πώς το Meta φέρνει την ανθρώπινη αφή και επιδεξιότητα στην τεχνητή νοημοσύνη

Ρομποτική

Προώθηση της ενσωματωμένης τεχνητής νοημοσύνης: Πώς το Meta φέρνει την ανθρώπινη αφή και επιδεξιότητα στην τεχνητή νοημοσύνη

mm

Η τεχνητή νοημοσύνη έχει προχωρήσει πολύ στην οπτική αντίληψη και την επεξεργασία της γλώσσας. Ωστόσο, αυτές οι ικανότητες δεν επαρκούν για την κατασκευή συστημάτων που μπορούν να αλληλεπιδράσουν με τον φυσικό κόσμο. Οι άνθρωποι χειρίζονται αντικείμενα ή κάνουν ελεγχόμενες κινήσεις χρησιμοποιώντας την αίσθηση της αφής. Αισθανόμαστε την υφή, την αίσθηση της θερμοκρασίας και το μετρητή βάρους για να καθοδηγούμε κάθε ενέργεια με ακρίβεια. Αυτή η απτική ανάδραση μας επιτρέπει να χειριζόμαστε εύθραυστα αντικείμενα, να χρησιμοποιούμε εργαλεία με έλεγχο και να εκτελούμε πολύπλοκες εργασίες ομαλά.

Η Meta, γνωστή για το έργο της στην εικονική και επαυξημένη πραγματικότητα, αναλαμβάνει τώρα την πρόκληση της δημιουργίας Τεχνητής Νοημοσύνης που μπορεί να αλληλεπιδρά με τον φυσικό κόσμο όπως ένας άνθρωπος. Μέσω της πρωτοβουλίας FAIR Robotics, η Meta αναπτύσσει εργαλεία και πλαίσια ανοιχτού κώδικα για να βελτιώσει την αίσθηση της αφής και τη φυσική ευελιξία των ρομπότ. Αυτές οι προσπάθειες θα μπορούσαν να οδηγήσουν στην ανάπτυξη ενσωματωμένης Τεχνητής Νοημοσύνης — συστημάτων που όχι μόνο βλέπουν αλλά μπορούν επίσης να αισθάνονται και να χειρίζονται αντικείμενα όπως ακριβώς κάνουν οι άνθρωποι.

Τι είναι το Embodied AI;

Ενσωματωμένη AI συνδυάζει τη φυσική αλληλεπίδραση με την τεχνητή νοημοσύνη, επιτρέποντας στις μηχανές να αισθάνονται, να ανταποκρίνονται και να εμπλέκονται φυσικά με το περιβάλλον τους. Αντί απλώς να «βλέπουν» ή να «ακούνε» εισόδους, επιτρέπει στα συστήματα τεχνητής νοημοσύνης να αισθάνομαι και ενεργώ μέσα τον κόσμο. Σκεφτείτε ένα ρομπότ που μπορεί να αντιληφθεί την πίεση που ασκεί σε ένα αντικείμενο, να προσαρμόσει τη λαβή του και να κινείται με ευελιξία. Η ενσωματωμένη τεχνητή νοημοσύνη μετακινεί την τεχνητή νοημοσύνη από οθόνες και ηχεία στον φυσικό κόσμο, καθιστώντας την ικανή να χειρίζεται αντικείμενα, να εκτελεί εργασίες και να αλληλεπιδρά πιο ουσιαστικά με τους ανθρώπους.

Για παράδειγμα, ένα ρομπότ που έχει κατασκευαστεί με ενσωματωμένη τεχνητή νοημοσύνη θα μπορούσε να βοηθήσει έναν ηλικιωμένο να μαζέψει εύθραυστα αντικείμενα χωρίς να τα καταστρέψει. Στην υγειονομική περίθαλψη, θα μπορούσε να βοηθήσει τους γιατρούς κρατώντας τα όργανα ακριβώς κατά τη διάρκεια της επέμβασης. Αυτή η δυνατότητα εκτείνεται πολύ πέρα ​​από τους ρομποτικούς βραχίονες στα εργαστήρια ή τους αυτοματοποιημένους βραχίονες στα εργοστάσια. πρόκειται για τη δημιουργία μηχανών που κατανοούν και ανταποκρίνονται στο φυσικό τους περιβάλλον σε πραγματικό χρόνο.

Η προσέγγιση του Meta προς την ενσωματωμένη τεχνητή νοημοσύνη

Ο Μέτα εστιάζει σε τρεις βασικές περιοχές να φέρει την ενσωματωμένη Τεχνητή Νοημοσύνη πιο κοντά στην ανθρώπινη αφή. Πρώτον, η εταιρεία αναπτύσσει προηγμένες τεχνολογίες απτικής ανίχνευσης που επιτρέπουν στις μηχανές να ανιχνεύουν πράγματα όπως η πίεση, η υφή και η θερμοκρασία. Δεύτερον, η Meta δημιουργεί μοντέλα αντίληψης αφής που επιτρέπουν στην Τεχνητή Νοημοσύνη να κατανοεί και να αντιδρά σε αυτά τα σήματα. Τέλος, η Meta κατασκευάζει μια πλατφόρμα απτικής ανάπτυξης που ενσωματώνει πολλαπλούς αισθητήρες με αυτά τα μοντέλα αντίληψης, προσφέροντας ένα ολοκληρωμένο σύστημα για την κατασκευή Τεχνητής Νοημοσύνης με δυνατότητα αφής. Δείτε πώς η Meta προωθεί την ενσωματωμένη Τεχνητή Νοημοσύνη σε κάθε έναν από αυτούς τους τομείς.

Meta Digit 360: Αίσθηση αφής σε ανθρώπινο επίπεδο

Ο Meta παρουσίασε Ψηφίο 360 άκρη του δακτύλου, μια τεχνολογία απτικής αίσθησης που έχει σχεδιαστεί για να δίνει στο ενσωματωμένο AI μια ανθρώπινη αίσθηση αφής. Με περισσότερα από 18 χαρακτηριστικά ανίχνευσης, μπορεί να ανιχνεύσει κραδασμούς, θερμότητα, ακόμη και χημικές ουσίες σε επιφάνειες. Εξοπλισμένο με ένα τσιπ AI, το δάχτυλο επεξεργάζεται δεδομένα αφής αμέσως, επιτρέποντας γρήγορες απαντήσεις σε εισόδους όπως η θερμότητα μιας σόμπας ή το αιχμηρό τρύπημα μιας βελόνας. Αυτή η τεχνολογία λειτουργεί ως «περιφερικό νευρικό σύστημα» εντός της ενσωματωμένης τεχνητής νοημοσύνης, προσομοιώνοντας αντανακλαστικές αποκρίσεις παρόμοιες με τις ανθρώπινες αντιδράσεις. Η Meta έχει αναπτύξει αυτό το δάχτυλο με ένα μοναδικό οπτικό σύστημα που περιέχει πάνω από 8 εκατομμύρια taxels που μπορούν να απαθανατίσουν την αφή από κάθε γωνία. Αισθάνεται μικροσκοπικές λεπτομέρειες, σε δυνάμεις τόσο μικρές όσο ένα χιλιοστόνετουτον, δίνοντας στην ενσωματωμένη τεχνητή νοημοσύνη μια καλά συντονισμένη ευαισθησία στο περιβάλλον τους.

Meta Sparsh: The Foundation for Tactile Perception

Το Meta ενισχύει τις δυνατότητες αντίληψης αφής για να βοηθήσει την τεχνητή νοημοσύνη να κατανοήσει και να ανταποκριθεί σε φυσικές αισθήσεις. Πήρε το όνομά του από τη σανσκριτική λέξη που σημαίνει «αφή», Σπάρς λειτουργεί ως «εγκέφαλος αφής» για την ενσωματωμένη τεχνητή νοημοσύνη. Το μοντέλο επιτρέπει στις μηχανές να ερμηνεύουν πολύπλοκα απτικά σήματα όπως η πίεση και η λαβή.

Ένα από τα ξεχωριστά χαρακτηριστικά του Sparsh είναι η ευελιξία του. Τα παραδοσιακά απτικά συστήματα χρησιμοποιούν ξεχωριστά μοντέλα για κάθε εργασία, βασιζόμενα σε μεγάλο βαθμό σε δεδομένα με ετικέτα και συγκεκριμένους αισθητήρες. Ο Sparsh αλλάζει εντελώς αυτήν την προσέγγιση. Ως μοντέλο γενικής χρήσης, προσαρμόζεται σε διάφορους αισθητήρες και εργασίες. Μαθαίνει μοτίβα αφής χρησιμοποιώντας αυτοεποπτευόμενη μάθηση (SSL) σε μια τεράστια βάση δεδομένων με περισσότερες από 460,000 απτικές εικόνες—χωρίς να χρειάζονται δεδομένα με ετικέτα.

Η Meta παρουσίασε επίσης το TacBench, ένα νέο σημείο αναφοράς με έξι εργασίες που βασίζονται στην αφή για την αξιολόγηση των ικανοτήτων του Sparsh. Η Meta ισχυρίζεται ότι η Sparsh ξεπέρασε τα παραδοσιακά μοντέλα κατά 95.1%, ειδικά σε σενάρια χαμηλών δεδομένων. Οι εκδόσεις του Sparsh που βασίζονται στις αρχιτεκτονικές I-JEPA και DINO της Meta έχουν επιδείξει αξιοσημείωτες ικανότητες σε εργασίες όπως η εκτίμηση δύναμης, η ανίχνευση ολίσθησης και ο πολύπλοκος χειρισμός.

Meta Digit Plexus: Μια πλατφόρμα για την ανάπτυξη συστημάτων αφής

Η Meta εισήγαγε το Digit Plexus για να ενσωματώσει τεχνολογίες αίσθησης και μοντέλα απτικής αντίληψης για τη δημιουργία ενός ενσωματωμένου συστήματος AI. Η πλατφόρμα συνδυάζει αισθητήρες δακτύλου και παλάμης σε ένα μόνο ρομποτικό χέρι για να επιτρέψει πιο συντονισμένες αποκρίσεις αφής. Αυτή η ρύθμιση επιτρέπει στο ενσωματωμένο AI να επεξεργάζεται την αισθητηριακή ανάδραση και να προσαρμόζει τις ενέργειές του σε πραγματικό χρόνο, όπως το πώς κινείται και αντιδρά ένα ανθρώπινο χέρι.

Με την τυποποίηση της ανάδρασης αφής σε όλο το χέρι, Digit Plexus ενισχύει την ακρίβεια και τον έλεγχο του ενσωματωμένου AI. Αυτή η εξέλιξη είναι ιδιαίτερα ζωτικής σημασίας σε τομείς όπως η μεταποίηση και η υγειονομική περίθαλψη, όπου ο προσεκτικός χειρισμός είναι απαραίτητος. Η πλατφόρμα συνδέει αισθητήρες όπως το δάχτυλο και το ReSkin με ένα σύστημα ελέγχου, απλοποιώντας τη συλλογή, τον έλεγχο και την ανάλυση δεδομένων—όλα μέσω ενός μόνο καλωδίου.

Η Meta κυκλοφορεί τα σχέδια λογισμικού και υλικού για το Digit Plexus στην κοινότητα ανοιχτού κώδικα. Ο στόχος είναι να προωθηθεί η συνεργασία και να επιταχυνθεί η έρευνα σε ενσωματωμένη τεχνητή νοημοσύνη, οδηγώντας την καινοτομία και την πρόοδο σε αυτούς τους τομείς.

Προώθηση Έρευνας και Ανάπτυξης Ενσωματωμένης ΤΝ

Η Meta προωθεί όχι μόνο την τεχνολογία αλλά και τους πόρους για την προώθηση της ενσωματωμένης έρευνας και ανάπτυξης της τεχνητής νοημοσύνης. Μια βασική πρωτοβουλία είναι η ανάπτυξη σημείων αναφοράς για την αξιολόγηση μοντέλων τεχνητής νοημοσύνης. Ένα τέτοιο σημείο αναφοράς, ΣΥΝΕΡΓΑΤΗΣ (Planning And Reasoning Tasks in HumaN-Robot collaboration), αξιολογεί τον τρόπο με τον οποίο τα μοντέλα τεχνητής νοημοσύνης αλληλεπιδρούν με τους ανθρώπους κατά τις οικιακές εργασίες. Χρησιμοποιώντας τον προσομοιωτή Habitat 3.0, το PARTNR παρέχει ένα ρεαλιστικό περιβάλλον όπου τα ρομπότ βοηθούν σε εργασίες όπως ο καθαρισμός και το μαγείρεμα. Με περισσότερες από 100,000 εργασίες βασισμένες σε γλώσσα, στοχεύει να επιταχύνει την πρόοδο στην ενσωματωμένη τεχνητή νοημοσύνη.

Εκτός από εσωτερικές πρωτοβουλίες, η Meta συνεργάζεται με οργανισμούς όπως GelSight Inc. και Wonik Robotics να επιταχύνει την υιοθέτηση των τεχνολογιών απτικής αίσθησης. Η GelSight θα διανείμει τους αισθητήρες Digit 360, ενώ η Wonik Robotics θα κατασκευάσει το Allegro Hand, το οποίο ενσωματώνει την τεχνολογία Digit Plexus. Καθιστώντας αυτές τις τεχνολογίες διαθέσιμες μέσω πλατφορμών και συνεργασιών ανοιχτού κώδικα, η Meta συμβάλλει στη δημιουργία ενός οικοσυστήματος που θα μπορούσε να οδηγήσει σε καινοτομίες στην υγειονομική περίθαλψη, την κατασκευή και την οικιακή βοήθεια.

Η κατώτατη γραμμή

Το Meta προωθεί την ενσωματωμένη τεχνητή νοημοσύνη, λαμβάνοντας το πέρα ​​από την απλή όραση και τον ήχο για να συμπεριλάβει την αίσθηση της αφής. Με καινοτομίες όπως το Digit 360 και το Sparsh, τα συστήματα AI αποκτούν την ικανότητα να αισθάνονται και να ανταποκρίνονται στο περιβάλλον τους με ακρίβεια. Μοιράζοντας αυτές τις τεχνολογίες με την κοινότητα ανοιχτού κώδικα και συνεργαζόμενη με βασικούς οργανισμούς, η Meta συμβάλλει στην επιτάχυνση της ανάπτυξης της απτικής αίσθησης. Αυτή η πρόοδος θα μπορούσε να οδηγήσει σε καινοτομίες σε τομείς όπως η υγειονομική περίθαλψη, η κατασκευή και η οικιακή βοήθεια, καθιστώντας την τεχνητή νοημοσύνη πιο ικανή και ανταποκρινόμενη στις εργασίες του πραγματικού κόσμου.

Ο Δρ. Tehseen Zia είναι Αναπληρωτής Καθηγητής στο Πανεπιστήμιο COMSATS του Ισλαμαμπάντ, κάτοχος διδακτορικού τίτλου στην τεχνητή νοημοσύνη από το Τεχνολογικό Πανεπιστήμιο της Βιέννης, στην Αυστρία. Με ειδίκευση στην Τεχνητή Νοημοσύνη, τη Μηχανική Μάθηση, την Επιστήμη των Δεδομένων και την Όραση Υπολογιστών, έχει κάνει σημαντικές συνεισφορές με δημοσιεύσεις σε έγκριτα επιστημονικά περιοδικά. Ο Δρ. Tehseen έχει επίσης ηγηθεί διαφόρων βιομηχανικών έργων ως Κύριος Ερευνητής και υπηρέτησε ως Σύμβουλος AI.