Επαυξημένη πραγματικότητα

Προσομοιωμένη Κίνηση Ματιών Βοηθά στην Εκπαίδευση του Metaverse

Published March 16, 2022

Updated April 5, 2026

Alex McFarland

Οι μηχανικοί υπολογιστών στο Πανεπιστήμιο Duke έχουν αναπτύξει εικονικά μάτια που μπορούν να προσομοιώσουν τον τρόπο με τον οποίο οι άνθρωποι βλέπουν τον κόσμο. Τα εικονικά μάτια είναι τόσο ακριβή που μπορούν να χρησιμοποιηθούν για την εκπαίδευση προγραμμάτων εικονικής πραγματικότητας και επαυξημένης πραγματικότητας. Θα αποδειχθούν απίστευτα ωφέλιμα για τους développers που επιθυμούν να δημιουργήσουν εφαρμογές στο metaverse.

Τα αποτελέσματα θα παρουσιαστούν στις 4-6 Μαΐου στη Διεθνή Διάσκεψη για την Επεξεργασία Πληροφοριών σε Δίκτυα Αισθήσεων (PSN).

Τα νέα εικονικά μάτια ονομάζονται EyeSyn.

Εκπαίδευση Αλγορίθμων για Λειτουργία Όπως τα Μάτια

Η Maria Gorlatova είναι καθηγήτρια Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών στο Πανεπιστήμιο Duke.

“Εάν σας ενδιαφέρει να ανακαλύψετε αν ένας άνθρωπος διαβάζει ένα κόμικ ή προηγμένο λογοτεχνικό έργο μόνο με το να κοιτάξετε τα μάτια του, μπορείτε να το κάνετε,” είπε η Gorlatova.

“Αλλά η εκπαίδευση τέτοιου αλγορίθμου απαιτεί δεδομένα από εκατοντάδες ανθρώπους που φορούν headsets για ώρες,” συνέχισε η Gorlatova. “Θέλαμε να αναπτύξουμε λογισμικό που όχι μόνο μειώνει τις ανησυχίες για την ιδιωτικότητα που συνοδεύουν τη συλλογή αυτού του είδους δεδομένων, αλλά επίσης επιτρέπει σε μικρότερες εταιρείες που δεν έχουν αυτά τα επίπεδα πόρων να μπαίνουν στο παιχνίδι του metaverse.”

Τα ανθρώπινα μάτια μπορούν να κάνουν πολλά πράγματα, όπως να δείχνουν αν είμαστε βορεμένοι ή ενθουσιασμένοι, πού εστιάζεται η προσοχή μας, ή αν είμαστε ειδικοί σε μια δεδομένη εργασία.

“Πού προτιμάτε να εστιάσετε την όρασή σας λέει πολλά για σας ως άτομο,” είπε η Gorlatova. “Μπορεί να αποκαλύψει ανεπίσημα σεξουαλικά και φυλετικά προκαταλήψεις, ενδιαφέροντα που δεν θέλουμε οι άλλοι να γνωρίζουν, και πληροφορίες που μπορεί να μην γνωρίζουμε ούτε εμείς οι ίδιοι.”

Τα δεδομένα κίνησης των ματιών είναι εξαιρετικά χρήσιμα για τις εταιρείες που κατασκευάζουν πλατφόρμες και λογισμικό στο metaverse. Μπορούν να επιτρέψουν στους développers να προσαρμόσουν το περιεχόμενο στις απαντήσεις συμμετοχής ή να μειώσουν την ανάλυση στην περιφερειακή όραση, το οποίο μπορεί να σώσει υπολογιστική ισχύ.

Η ομάδα των επιστημόνων υπολογιστών, η οποία περιελάμβανε τον πρώην μεταδιδακτορικό συνεργάτη Guohao Lan και τον τρέχοντα φοιτητή διδακτορικού Tim Scargill, έθεσε ως στόχο να αναπτύξει τα εικονικά μάτια για να μιμηθούν τον τρόπο με τον οποίο ένας μέσος άνθρωπος ανταποκρίνεται σε διάφορους ερεθισμούς ήχου. Για να το κάνουν αυτό, εξέτασαν τη βιβλιογραφία της γνωστικής επιστήμης που διερευνά τον τρόπο με τον οποίο οι άνθρωποι βλέπουν τον κόσμο και επεξεργάζονται εικονικές πληροφορίες.

Ο Lan είναι τώρα καθηγητής στο Πανεπιστήμιο Τεχνολογίας Delft στην Ολλανδία.

“Εάν δώσετε στο EyeSyn πολλά διαφορετικά εισαγωγικά στοιχεία και το εκτελέσετε αρκετές φορές, θα δημιουργήσετε ένα σύνολο δεδομένων συνθετικών κινήσεων ματιών που είναι αρκετά μεγάλο για να εκπαιδεύσετε einen (αλγόριθμο μάθησης) ταξινομητή για ένα νέο πρόγραμμα,” είπε η Gorlatova.

Δοκιμή του Συστήματος

Οι ερευνητές δοκιμάσαν την ακρίβεια των συνθετικών ματιών με δημόσια διαθέσιμα δεδομένα. Τα μάτια πρώτα αναλύθηκαν βίντεο του Δρ Anthony Fauci να απευθύνεται στο κοινό κατά τη διάρκεια συνεντεύξεων τύπου. Η ομάδα συνέκρινε τα δεδομένα με δεδομένα από τις κινήσεις ματιών πραγματικών θεατών. Επίσης, συνέκρινε ένα εικονικό σύνολο δεδομένων των συνθετικών ματιών που κοιτάζουν τέχνη με πραγματικά σύνολα δεδομένων που συλλέχθηκαν από ανθρώπους που κοιτάζουν μια εικονική πινακοθήκη τέχνης. Τα αποτελέσματα έδειξαν ότι το EyeSyn μπορεί να προσεγγίσει στενά τα διακριτά μοτίβα των πραγματικών σημάτων ματιών και να προσομοιώσει τους διαφορετικούς τρόπους με τους οποίους αντιδρά τα μάτια των ανθρώπων.

Η Gorlatova λέει ότι αυτά τα αποτελέσματα δείχνουν ότι τα εικονικά μάτια είναι αρκετά καλά για τις εταιρείες να τα χρησιμοποιήσουν ως βάση για την εκπαίδευση νέων πλατφόρμων και λογισμικού metaverse.

“Τα συνθετικά δεδομένα μόνα τους δεν είναι τέλεια, αλλά είναι ένα καλό σημείο εκκίνησης,” είπε η Gorlatova. “Οι μικρότερες εταιρείες μπορούν να τα χρησιμοποιήσουν αντί να ξοδεύουν χρόνο και χρήματα για να δημιουργήσουν τα δικά τους πραγματικά σύνολα δεδομένων (με ανθρώπινους υποκειμένους). Και επειδή η προσωποποίηση των αλγορίθμων μπορεί να γίνει σε τοπικά συστήματα, οι άνθρωποι δεν πρέπει να ανησυχούν ότι τα δεδομένα κίνησης ματιών τους θα γίνουν μέρος μιας μεγάλης βάσης δεδομένων.”

Alex McFarland

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.