Συνδεθείτε μαζί μας

Εντοπισμός χρήστη εσωτερικού χώρου με χρήση οπτικής αναγνώρισης θέσης

Ηγέτες της σκέψης

Εντοπισμός χρήστη εσωτερικού χώρου με χρήση οπτικής αναγνώρισης θέσης

mm

Η οπτική αναγνώριση θέσης είναι ένας από τους ακρογωνιαίους λίθους του ανάπτυξη όρασης υπολογιστή και ρομποτικής. Το καθήκον των αλγορίθμων VPR είναι να αναγνωρίζουν τις εξεταζόμενες τοποθεσίες με βάση εικόνες. Η τεχνολογία μπορεί να υποστηρίξει τόσο αυτόνομα ρομπότ όσο και το ανθρώπινο δυναμικό, εντοπίζοντας το περιβάλλον και διευκολύνοντας την εκτέλεση των επιθυμητών ενεργειών.

Ερευνητές στο NeuroSYS αξιοποιεί αλγόριθμους υπολογιστικής όρασης ως μέρος της αναπτυγμένης πλατφόρμας AR, Nsflow, επιτρέποντας διαδραστικές οδηγίες εργασίας και πρακτική εκπαίδευση για τον προσδιορισμό των θέσεων των χρηστών κατά την επιτόπια εκπαίδευση. Σε αυτήν την περίπτωση, η χρήση του VPR οδηγεί σε σημαντική επιτάχυνση των διαδικασιών ενσωμάτωσης και εκμάθησης λόγω μειωμένης ανάγκης για προηγούμενη εκπαίδευση και επίβλεψη.

Ο εντοπισμός ενός ατόμου ή η εύρεση του επιθυμητού μέρους χρησιμοποιώντας το GPS είναι ήδη παλιά νέα. Τι να κάνετε όμως όταν το δορυφορικό σύστημα πλοήγησης δεν λειτουργεί; Τα συστήματα εντοπισμού θέσης εσωτερικού χώρου (IPS) έρχονται στη διάσωση. 

Όταν ψάχνετε για βελόνα σε θημωνιά, μπορείτε να χρησιμοποιήσετε διάφορες τεχνικές, όπως φάρους, μαγνητικό εντοπισμό θέσης, μονάδες αδρανειακής μέτρησης (IMU) με επιταχυνσιόμετρα και γυροσκόπια, μέτρηση κίνησης από το τελευταίο γνωστό σημείο, τοποθέτηση βάσει Wi-Fi ή απλά – χρησιμοποιήστε οπτικούς δείκτες. 

Όλες οι παραπάνω μέθοδοι έχουν τα ελαττώματα τους (π.χ. ανάγκη εγκατάστασης δεικτών ή φάρων, IMU που αυξάνει το σφάλμα μέτρησης με την πάροδο του χρόνου και απαιτεί επανατοποθέτηση), υπερκαλύπτοντας τα οφέλη τους. Η λύση που απαντά στο κρίσιμο πρόβλημα – το γενικό που βρίσκεται ο χρήστης με ακρίβεια στα πλησιέστερα λίγα μέτρα – αποδεικνύεται ότι εμπίπτει στην αρμοδιότητα των αλγορίθμων. 

The διαδικασία αναγνώρισης τόπων βασίζεται σε μια διαδικασία δύο βημάτων, δημιουργώντας δύο βάσεις δεδομένων. Αρχικά, ο χώρος στόχος φωτογραφίζεται και ορισμένα αντικείμενα, σημεία-κλειδιά, επισημαίνονται από έναν ανιχνευτή χαρακτηριστικών για τον εντοπισμό χαρακτηριστικών στοιχείων της περιοχής. Στη συνέχεια, τα σημειωμένα σημεία συγκρίνονται με μια εικόνα αναφοράς. Μόλις τα αξιολογούμενα σημεία-κλειδιά θεωρηθούν αρκετά παρόμοια από μια αντιστοίχιση χαρακτηριστικών, η εικόνα θεωρείται ότι εμφανίζει το ίδιο μέρος. 

The βάση δεδομένων εικόνων συνδυάζει εικόνες στόχων τοποθεσιών, σε αυτήν την περίπτωση, χώρων εργασίας, και ένα σύνολο ιδιοτήτων τους, συμπεριλαμβανομένων μοναδικών αναγνωριστικών, ακολουθούμενων από τοπικούς και καθολικούς περιγραφείς. Το άλλο σύνολο, το βάση δεδομένων δωματίου, αντιστοιχίζει μοναδικά σημεία-κλειδιά με συγκεκριμένες περιοχές στον εξεταζόμενο χώρο. 

Χρησιμοποιώντας τα νευρωνικά δίκτυα SuperPoint, SuperGlue και netVLAD από το οπτικό πεδίο αναγνώρισης θέσεων, οι ερευνητές χρησιμοποίησαν την παραπάνω διαδικασία στον εντοπισμό των χρηστών. Τα βαθιά νευρωνικά δίκτυα, SuperPoint και SuperGlue, συνεργάζονται στην ανίχνευση και αντιστοίχιση χαρακτηριστικών, εξάγοντας πληροφορίες από τις βάσεις δεδομένων. 

Οι παγκόσμιοι περιγραφείς μπαίνουν στη σκηνή

Η διαδικασία απαιτεί σφαιρικούς περιγραφείς, που χρησιμεύουν ως φορείς που διακρίνουν τον τόπο, προσδιορίζοντας περιοχές με τρόπο που να μην παρουσιάζει ασάφειες. Για να εκπληρώσουν τον ρόλο τους, τα διανύσματα θα πρέπει να είναι φωτιστικά και αγνωστικά από την άποψη - ανεξάρτητα από την προοπτική και τις συνθήκες φωτισμού, οι καθολικοί περιγραφείς δεν πρέπει να αφήνουν καμία αμφιβολία όταν διακρίνουν μέρη σε διάφορες εικόνες. 

Επιπλέον, τα μεταβλητά αντικείμενα που υπάρχουν στην περιοχή ενδιαφέροντος δεν πρέπει να δεσμεύονται από καθολικούς περιγραφείς ως χαρακτηριστικά που διακρίνουν μέρη. Αντικείμενα όπως έπιπλα και εξοπλισμός είναι επιρρεπή σε αλλαγές (ανακατασκευή, αποσυναρμολόγηση), που σημαίνει ότι δεν μπορούν να καθορίσουν περιοχές μέσω της παρουσίας τους. 

Λειτουργεί με υπολογιστή αναγνώριση τόπου βασίζεται σε μόνιμα στοιχεία εξεταζόμενων τοποθεσιών, όπως πόρτες, παράθυρα, σκάλες και άλλα διακριτικά στοιχεία μακράς διάρκειας. Κατά τη διάρκεια της εν λόγω έρευνας χρησιμοποιήθηκε το βαθύ νευρωνικό δίκτυο NetVLAD για υπολογισμούς, παρουσιάζοντας, ως αποτέλεσμα, διανύσματα που πληρούν τις καθορισμένες απαιτήσεις. Στη διαδικασία αντιστοίχισης καθολικών περιγραφικών, επεξεργάζονται εικόνες των πιο όμοιων διανυσμάτων, ακολουθώντας τους υπολογισμούς της απόστασης μεταξύ κάθε χαρακτηριστικού σημείου αγκύρωσης. 

Κατά την επεξεργασία δύο βάσεων δεδομένων – της βάσης δεδομένων του δωματίου και της άλλης, που περιέχει βασικά σημεία και καθολικούς περιγραφείς – το σύστημα ασχολείται με τα χαρακτηριστικά των εικόνων. Αφού εκτελέσει τις ομοιότητες και την εκτίμηση των μικρότερων αποστάσεων, το δεύτερο νευρωνικό δίκτυο, το SuperGlue, προσδιορίζει εικόνες τοποθεσίας. Το σύστημα που χρησιμοποιεί VPR επιτρέπει την τοπική προσαρμογή του χρήστη με βάση, εν συντομία, τον αριθμό των αντιστοιχιζόμενων βασικών σημείων. 

Οι αλγόριθμοι βρήκαν εφαρμογή στο Πλατφόρμα AI & AR, βοηθώντας τους χρήστες να εκτελούν εκπαίδευση εξοπλισμένες με έξυπνα γυαλιά. Το VPR επιτρέπει τον εντοπισμό των εκπαιδευόμενων στον χώρο εργασίας, λανσάροντας κατάλληλα εκπαιδευτικά σεμινάρια και οδηγούς που έχουν ανατεθεί σε συγκεκριμένα σημεία, βελτιώνοντας την ασφάλεια και μειώνοντας την ανάγκη για άμεση επίβλεψη. 

Έργο συγχρηματοδοτούμενο από πόρους της Ευρωπαϊκής Ένωσης στο πλαίσιο των Ευρωπαϊκών Ταμείων Περιφερειακής Ανάπτυξης ως μέρος του Επιχειρησιακού Προγράμματος Έξυπνης Ανάπτυξης. Έργο που υλοποιήθηκε ως μέρος του Εθνικού Κέντρου Έρευνας και Ανάπτυξης: Fast Track.

Η Jowita Kessler είναι λάτρης της τεχνολογίας με έδρα την Πολωνία, που εργάζεται ως ειδικός μάρκετινγκ περιεχομένου στη NeuroSYS. Καταναγκαστικός αναγνώστης και συγγραφέας, αφοσιωμένος στο σβήσιμο του φραγμού μεταξύ ανθρωπιστικών επιστημών και τεχνολογίας. Ιδιωτικά: ονειροπόλος και νυχτοβάτης, λάτρης των γατών και των νυχτερίδων.