Connect with us

Ερευνητές Χρησιμοποιούν Τον AI Για Την Ερεύνα Της Διαφοράς Μεταξύ Ανακλώσεων και Πρωτότυπων Εικονών

Τεχνητή νοημοσύνη

Ερευνητές Χρησιμοποιούν Τον AI Για Την Ερεύνα Της Διαφοράς Μεταξύ Ανακλώσεων και Πρωτότυπων Εικονών

mm

Ερευνητές στο Πανεπιστήμιο Κορνέλ最近 χρησιμοποίησαν συστήματα μηχανικής μάθησης για να ερευνήσουν πώς οι ανακλάσεις των εικονών διαφέρουν από τις πρωτότυπες εικόνες. Όπως αναφέρθηκε από το ScienceDaily, οι αλγόριθμοι που δημιουργήθηκαν από την ομάδα των ερευνητών βρήκαν ότι υπήρχαν χαρακτηριστικά, διαφορές από την πρωτότυπη εικόνα, που μια εικόνα είχε ανακλαστεί ή είχε γυριστεί.

Ο αναπληρωτής καθηγητής πληροφορικής στο Cornell Tech, Noah Snavely, ήταν ο старший συγγραφέας της μελέτης. Σύμφωνα με τον Snavely, το ερευνητικό πρόγραμμα ξεκίνησε όταν οι ερευνητές ενδιαφέρθηκαν από το πώς οι εικόνες ήταν διαφορετικές σε σαφείς και λεπτές τρόπους όταν ανακλούνταν. Ο Snavely εξήγησε ότι ακόμη και τα πράγματα που φαίνονται πολύ συμμετρικά στην πρώτη ματιά μπορούν συνήθως να διακριθούν ως ανακλάσεις όταν μελετώνται. “Είμαι ενθουσιασμένος με τις ανακαλύψεις που μπορείτε να κάνετε με νέους τρόπους απόκτησης πληροφοριών”, είπε ο Snavely, σύμφωνα με το ScienceDaily.

Οι ερευνητές επικεντρώθηκαν σε εικόνες ανθρώπων, χρησιμοποιώντας τις για να εκπαιδεύσουν τους αλγόριθμους τους. Αυτό έγινε γιατί τα πρόσωπα δεν φαίνονται σαφώς ασύμμετρα. Όταν εκπαιδεύτηκαν με δεδομένα που διάκρινε τις ανακλασμένες εικόνες από τις πρωτότυπες εικόνες, ο AI επιτύγχασε ακρίβεια μεταξύ 60% και 90% σε διάφορους τύπους εικόνων.

Πολλοί από τους οπτικούς δείκτες μιας ανακλασμένης εικόνας που ο AI έμαθε είναι πολύ λεπτοί και δύσκολοι για τους ανθρώπους να διακρίνουν όταν κοιτάζουν τις ανακλασμένες εικόνες. Για να ερμηνεύσουν καλύτερα τα χαρακτηριστικά που ο AI χρησιμοποιούσε για να διακρίνει τις ανακλασμένες εικόνες από τις πρωτότυπες εικόνες, οι ερευνητές δημιούργησαν ένα heatmap. Το heatmap έδειξε περιοχές της εικόνας που ο AI επικεντρωνόταν. Σύμφωνα με τους ερευνητές, ένας από τους πιο κοινούς δείκτες που ο AI χρησιμοποιούσε για να διακρίνει τις ανακλασμένες εικόνες ήταν ο текст. Αυτό ήταν αναμενόμενο και οι ερευνητές αφαίρεσαν τις εικόνες που περιείχαν κείμενο από τα δεδομένα εκπαίδευσής τους για να λάβουν μια καλύτερη ιδέα για τις πιο λεπτές διαφορές μεταξύ ανακλασμένων και πρωτότυπων εικόνων.

Μετά την αφαίρεση των εικόνων που περιείχαν κείμενο από το σύνολο εκπαίδευσης, οι ερευνητές βρήκαν ότι ο AI επικεντρωνόταν σε χαρακτηριστικά των εικόνων όπως τα κουμπιά των πουκάμισων, τα κινητά τηλέφωνα, τα ρολόγια και τα πρόσωπα. Κάποια από αυτά τα χαρακτηριστικά έχουν σαφείς και αξιόπιστους κανόνες που ο AI μπορεί να επικεντρωθεί σε αυτά, όπως το γεγονός ότι οι άνθρωποι συχνά κρατούν τα κινητά τηλέφωνα στο δεξί χέρι τους και ότι τα κουμπιά των πουκάμισων είναι συχνά στο αριστερό μέρος. Ωστόσο, τα χαρακτηριστικά του προσώπου είναι τυπικά πολύ συμμετρικά με μικρές διαφορές που είναι δύσκολο για τον ανθρώπινο παρατηρητή να τις ανιχνεύσει.

Οι ερευνητές δημιούργησαν ένα άλλο heatmap που έδειξε τις περιοχές του προσώπου που ο AI επικεντρωνόταν. Ο AI συχνά χρησιμοποιούσε τα μάτια, τα μαλλιά και τις γενιές των ανθρώπων για να ανιχνεύσει τις ανακλασμένες εικόνες. Για λόγους που δεν είναι σαφείς, οι άνθρωποι συχνά κοιτάζουν ελαφρώς προς τα αριστερά όταν τους λαμβάνουν φωτογραφίες. Όσο για το γιατί τα μαλλιά και οι γενιές είναι δείκτες ανακλασμένων εικόνων, οι ερευνητές δεν είναι σίγουροι αλλά θεωρούν ότι η δεξιότητα ενός ατόμου μπορεί να αποκαλυφθεί από τον τρόπο που ξυρίζει ή χτενίζει. Ενώ αυτοί οι δείκτες possono είναι αναξιόπιστοι, συνδυάζοντας πολλαπλούς δείκτες μαζί οι ερευνητές μπορούν να επιτύχουν μεγαλύτερη εμπιστοσύνη και ακρίβεια.

Περισσότερη έρευνα σε αυτές τις γραμμές θα πρέπει να διεξαχθεί, αλλά αν τα ευρήματα είναι συνεπή και αξιόπιστα, τότε μπορεί να βοηθήσει τους ερευνητές να βρουν πιο αποτελεσματικούς τρόπους εκπαίδευσης αλγορίθμων μηχανικής μάθησης. Η AI οπτικής αναγνώρισης συχνά εκπαιδεύεται χρησιμοποιώντας ανακλάσεις εικόνων, καθώς είναι ένας αποτελεσματικός και γρήγορος τρόπος για να αυξήσει την ποσότητα των διαθέσιμων δεδομένων εκπαίδευσης. Είναι δυνατό ότι η ανάλυση του πώς οι ανακλασμένες εικόνες διαφέρουν μπορεί να βοηθήσει τους ερευνητές μηχανικής μάθησης να κατανοήσουν καλύτερα τις προκαταλήψεις που υπάρχουν στα μοντέλα μηχανικής μάθησης που μπορεί να προκαλέσουν λάθη στην ταξινόμηση εικόνων.

Όπως ο Snavely ήταν αναφερθεί από το ScienceDaily:

“Αυτό οδηγεί σε ένα ανοικτό ερώτημα για την κοινότητα της οπτικής αναγνώρισης, το οποίο είναι, πότε είναι εντάξει να κάνετε αυτό το γύρισμα για να αυξήσετε το σύνολο δεδομένων σας, και πότε δεν είναι εντάξει; Ελπίζω ότι αυτό θα κάνει τους ανθρώπους να σκεφτούν περισσότερο για αυτά τα ερωτήματα και να αρχίσουν να αναπτύσσουν εργαλεία για να κατανοήσουν πώς προκαλεί προκαταλήψεις τον αλγόριθμο.”

Blogger και προγραμματιστής με ειδικότητες στα Machine Learning και Deep Learning θέματα. Ο Daniel ελπίζει να βοηθήσει τους άλλους να χρησιμοποιήσουν τη δύναμη του AI για κοινωνικό καλό.