Τεχνητή νοημοσύνη

Μελέτη Δείχνει ότι τα Μοντέλα AI Δεν Αντιστοιχούν στη.Visual Processing του Ανθρώπου

mm

Μια νέα μελέτη από το Πανεπιστήμιο Γιορκ δείχνει ότι τα βαθιά συννευρωνικά νευρωνικά δίκτυα (DCNNs) δεν αντιστοιχούν στη visual processing του ανθρώπου χρησιμοποιώντας την αίσθηση της μορφής. Σύμφωνα με τον Καθηγητή Τζέιμς Έλντερ, συν-συγγραφέα της μελέτης, αυτό μπορεί να έχει σοβαρές και επικίνδυνες πραγματικές επιπτώσεις για τις εφαρμογές του AI.

Η νέα μελέτη με τίτλο “Deep learning models fail to capture the configural nature of human shape perception” δημοσιεύθηκε στο περιοδικό Cell Press iScience.

Ήταν μια συνεργατική μελέτη από τον Έλντερ, ο οποίος κατέχει την Έδρα Ερευνών του Γιορκ στην Ανθρώπινη και Υπολογιστική Όραση, καθώς και τη θέση του Συν-Διευθυντή του Κέντρου του Γιορκ για το AI & την Κοινωνία, και τον Καθηγητή Νίκολας Μπέικερ, ο οποίος είναι βοηθός καθηγητής ψυχολογίας και πρώην μεταδιδάκτορας του προγράμματος VISTA στο Γιορκ.

Νέα Οπτικά Ερεθίσματα “Φρανκενστάιν”

Η ομάδα βασίστηκε σε νέα οπτικά ερεθίσματα που ονομάζονται “Φρανκενστάιν”, τα οποία τους βοήθησαν να εξερευνήσουν πώς και ο ανθρώπινος εγκέφαλος και τα DCNNs επεξεργάζονται ολιστικές, μορφολογικές ιδιότητες αντικειμένων.

“Τα Φρανκενστάιν είναι απλά αντικείμενα που έχουν ληφθεί από τμήματα και ξανασυναρμολογηθεί λάθος”, λέει ο Έλντερ. “Ως αποτέλεσμα, έχουν όλα τα σωστά τοπικά χαρακτηριστικά, αλλά στις λάθος θέσεις.”

Η μελέτη βρήκε ότι τα DCNNs δεν είναι μπερδεμένα από τα Φρανκενστάιν όπως το ανθρώπινο οπτικό σύστημα. Αυτό αποκαλύπτει μια αδιαφορία για μορφολογικές ιδιότητες αντικειμένων.

“Τα αποτελέσματά μας εξηγούν γιατί τα βαθιά μοντέλα AI αποτυγχάνουν υπό ορισμένες συνθήκες και δείχνουν την ανάγκη να ληφθούν υπόψη εργασίες πέρα από την αναγνώριση αντικειμένων για να κατανοηθεί η οπτική επεξεργασία στον εγκέφαλο”, συνεχίζει ο Έλντερ. “Τα βαθιά μοντέλα αυτά έχουν την τάση να λύνουν σύντομες διαδρομές όταν λύνουν σύνθετες εργασίες αναγνώρισης. Ενώ αυτές οι συντομες διαδρομές μπορεί να λειτουργούν σε πολλές περιπτώσεις, μπορεί να είναι επικίνδυνες σε ορισμένες από τις πραγματικές εφαρμογές AI που εργαζόμαστε τώρα με τους εταίρους μας της βιομηχανίας και της κυβέρνησης.”

Εικόνα: Πανεπιστήμιο Γιορκ

Πραγματικές Επιπτώσεις

Ο Έλντερ λέει ότι μια από αυτές τις εφαρμογές είναι τα συστήματα ασφαλείας βίντεο κυκλοφορίας.

“Τα αντικείμενα σε μια πολυσύχναστη σκηνή κυκλοφορίας — τα οχήματα, τα ποδήλατα και οι πεζοί — εμποδίζουν ο ένας τον άλλον και φτάνουν στο μάτι του οδηγού ως ένα μπέρδεμα από αποσυνδεδεμένα τμήματα”, λέει. “Ο εγκέφαλος χρειάζεται να ομαδοποιήσει σωστά αυτά τα τμήματα για να αναγνωρίσει τις σωστές κατηγορίες και θέσεις των αντικειμένων. Ένα σύστημα AI για την παρακολούθηση της ασφάλειας της κυκλοφορίας που είναι σε θέση να αντιλαμβάνεται μόνο τα τμήματα ξεχωριστά θα αποτύχει σε αυτή την εργασία, πιθανότατα να μην καταλαβαίνει τους κινδύνους για τους ευάλωτους χρήστες της οδού.”

Οι ερευνητές επίσης λένε ότι οι τροποποιήσεις στην εκπαίδευση και την αρχιτεκτονική που στοχεύουν στο να κάνουν τα δίκτυα πιο παρόμοια με τον εγκέφαλο δεν πέτυχαν την επεξεργασία μορφής. Κανένα από τα δίκτυα δεν μπόρεσε να προβλέψει με ακρίβεια τις κρίσεις αντικειμένων του ανθρώπου από δοκιμή σε δοκιμή.

“Υποθέτουμε ότι για να αντιστοιχίσουν την μορφολογική ευαισθησία του ανθρώπου, τα δίκτυα πρέπει να εκπαιδευτούν για να λύσουν ένα ευρύτερο φάσμα εργασιών αντικειμένων πέρα από την αναγνώριση κατηγοριών”, συμπεραίνει ο Έλντερ

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.