στέλεχος Οι ρομποτικοί αναπτύσσουν νέα τεχνική για τα ρομπότ να πιάνουν ανακλαστικά αντικείμενα - Unite.AI
Συνδεθείτε μαζί μας

Ρομποτική

Οι ρομποτικοί αναπτύσσουν νέα τεχνική για τα ρομπότ να πιάνουν ανακλαστικά αντικείμενα

Δημοσιευμένα

 on

Πίστωση: Πανεπιστήμιο Carnegie Mellon

Ο τομέας της ρομποτικής προχωρά με ταχείς ρυθμούς και δεν θα αργήσει η τεχνολογία να φτάσει σε πολλές πτυχές της ζωής μας, συμπεριλαμβανομένης της κουζίνας. Ωστόσο, υπάρχει ένα συγκεκριμένο εμπόδιο που πρέπει να ξεπεράσουν οι ρομποτικοί για αυτούς τους τύπους εφαρμογών: τα ρομπότ δυσκολεύονται πολύ να μαζέψουν διαφανή και αντανακλαστικά αντικείμενα, όπως ένα κύπελλο μέτρησης ή ένα γυαλιστερό μαχαίρι. Αυτό αλλάζει, ωστόσο, με τους ρομποτικούς στο Πανεπιστήμιο Carnegie Mellon (CMU) να αναπτύσσουν μια νέα τεχνική για να ξεπεράσουν αυτό το πρόβλημα. 

Η ομάδα ανέφερε επιτυχία με τη διδασκαλία ρομπότ να μαζεύουν αυτά τα αντικείμενα μέσω μιας νέας τεχνικής που δεν απαιτεί πολύπλοκους αισθητήρες, εξαντλητική εκπαίδευση ή ανθρώπινη καθοδήγηση. Αντίθετα, χρησιμοποίησε μια έγχρωμη κάμερα για να πραγματοποιήσει τις ενέργειες. 

Η έρευνα θα παρουσιαστεί στο Διεθνές Συνέδριο για τη Ρομποτική και τον Αυτοματισμό εικονικό συνέδριο που θα πραγματοποιηθεί αυτό το καλοκαίρι. 

Κάμερες βάθους εναντίον έγχρωμων φωτογραφικών μηχανών

Ο David Held είναι επίκουρος καθηγητής στο Ινστιτούτο Ρομποτικής του CMU. Σύμφωνα με τον Held, οι κάμερες βάθους, οι οποίες καθορίζουν το σχήμα ενός αντικειμένου εκπέμποντας ένα υπέρυθρο φως σε αυτό, είναι χρήσιμες για τον εντοπισμό αδιαφανών αντικειμένων. Ωστόσο, αυτό δεν ισχύει για καθαρά αντικείμενα ή ανακλαστικές επιφάνειες, από τις οποίες το υπέρυθρο φως περνά κατευθείαν ή διασκορπίζεται. Εξαιτίας αυτού, οι κάμερες βάθους δεν μπορούν να υπολογίσουν ακριβή σχήματα. Αυτό σημαίνει ότι το αποτέλεσμα καταλήγει να είναι επίπεδο ή σχήματα γεμάτα με τρύπες για διαφανή και αντανακλαστικά αντικείμενα.

Το πλεονέκτημα μιας έγχρωμης κάμερας είναι ότι μπορεί να δει διαφανή και αντανακλαστικά αντικείμενα, όχι μόνο αδιαφανή. Εκμεταλλευόμενοι αυτό, οι επιστήμονες στο CMU δημιούργησαν ένα σύστημα έγχρωμης κάμερας που είναι ικανό να αναγνωρίζει σχήματα με βάση το χρώμα.

Παρόλο που μια τυπική κάμερα δεν είναι σε θέση να μετρήσει σχήματα όπως μια κάμερα βάθους, οι ερευνητές εκπαίδευσαν το νέο σύστημα να μιμείται το σύστημα βάθους. Αυτό του επέτρεψε να συμπεράνει σιωπηρά σχήματα και να συλλαμβάνει ορισμένα αντικείμενα, και για να επιτευχθεί αυτό, οι εικόνες κάμερας βάθους αδιαφανών αντικειμένων συνδυάστηκαν με τις έγχρωμες εικόνες των ίδιων αντικειμένων. 

Τα ρομπότ χρησιμοποιούν τη μηχανική μάθηση για να αρπάζουν διαφανή αντικείμενα

Πιάνοντας διαφανή και λαμπερά αντικείμενα

Αφού το σύστημα εκπαιδεύτηκε επιτυχώς, στη συνέχεια χρησιμοποιήθηκε σε διαφανή και γυαλιστερά αντικείμενα. Το ρομπότ μπόρεσε να συλλάβει τα δύσκολα αντικείμενα με μεγάλο βαθμό επιτυχίας αφού χρησιμοποίησε αυτές τις εικόνες συν οποιαδήποτε άλλη πληροφορία μπορούσε να εξαχθεί από την κάμερα βάθους.

Ο Held είπε ότι, ενώ το σύστημα δεν λειτουργεί πάντα τέλεια, είναι καλύτερο από οποιοδήποτε άλλο από τα διαθέσιμα σήμερα συστήματα.

«Μερικές φορές μας λείπει», είπε ο Χελντ. «Αλλά ως επί το πλείστον έκανε πολύ καλή δουλειά, πολύ καλύτερα από οποιοδήποτε προηγούμενο σύστημα για να πιάνεις διαφανή ή ανακλαστικά αντικείμενα».

Σύμφωνα με τον Thoms Weng, διδάκτορα στη ρομποτική, το σύστημα είναι ακόμα πιο αποτελεσματικό στο να συλλαμβάνει αδιαφανή αντικείμενα σε σύγκριση με διαφανή ή ανακλαστικά, αλλά είναι πολύ πιο αποτελεσματικό από απλά συστήματα κάμερας βάθους. Ένα άλλο πλεονέκτημα του συστήματος ήταν ότι η τεχνική εκμάθησης για την εκπαίδευσή του ήταν εξαιρετικά αποτελεσματική, καθιστώντας το σύστημα χρωμάτων στο ίδιο επίπεδο με το σύστημα κάμερας βάθους στο μάζεμα αδιαφανών αντικειμένων.

«Το σύστημά μας όχι μόνο μπορεί να συλλάβει μεμονωμένα διαφανή και ανακλαστικά αντικείμενα, αλλά μπορεί επίσης να πιάσει τέτοια αντικείμενα σε ακατάστατους σωρούς», είπε ο Weng. 

Δεν είναι η πρώτη φορά που οι ρομποτικοί προσπάθησαν να ξεπεράσουν αυτήν την πρόκληση. Οι προηγούμενες προσεγγίσεις περιελάμβαναν συστήματα εκπαίδευσης βασισμένα εξ ολοκλήρου σε επαναλαμβανόμενες απόπειρες συλλήψεις, οι οποίες θα μπορούσαν να αριθμούν έως και 800,000 προσπάθειες. Μια άλλη προηγούμενη επιλογή ήταν η ανθρώπινη σήμανση αντικειμένων, η οποία είναι και δαπανηρή και χρονοβόρα.

Οι ρομποτικοί στο CMU βασίστηκαν σε μια εμπορική κάμερα RGB-D ικανή τόσο για έγχρωμες εικόνες (RGB) όσο και για εικόνες βάθους (D). 

 

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις AI παγκοσμίως.