Τεχνητή νοημοσύνη

Υπολογιστής Ικανός να Αναγνωρίσει 200 Είδη Πουλιών από Μια Φωτογραφία

Published November 4, 2019

Updated April 27, 2026

Alex McFarland

Ερευνητές από το Πανεπιστήμιο Duke χρησιμοποίησαν τη μηχανική μάθηση για να εκπαιδεύσουν έναν υπολογιστή να αναγνωρίσει μέχρι και 200 διαφορετικά είδη πουλιών. Ο υπολογιστής απαιτεί μόνο μια φωτογραφία για να ολοκληρώσει τη διαδικασία αναγνώρισης. Για έναν άνθρωπο, συχνά απαιτούνται χρόνια παρατήρησης πουλιών για να μπορέσει να αναγνωρίσει τα διαφορετικά είδη μεταξύ τους.

Η έρευνα πραγματοποιήθηκε από τον Chaofan Chen, φοιτητή διδακτορικού στο τμήμα πληροφορικής του Duke, μαζί με τον προπτυχιακό Oscar Li. Επίσης, εργάστηκαν πάνω σε αυτήν μέλη της ομάδας του Prediction Analysis Lab, υπό τη διεύθυνση της καθηγήτριας Cynthia Rudin.

Η Τεχνητή Νοημοσύνη Εμφανίζει τον Τρόπο Σκέψης της

Ενώ η διαδικασία αναγνώρισης είναι εντυπωσιακή, υπάρχει ένα πιο σημαντικό аспект της εξέλιξης. Η Τεχνητή Νοημοσύνη είναι σε θέση να δείξει τον τρόπο σκέψης της, επιτρέποντας ακόμη και σε έναν ανειδίκηστο παρατηρητή πουλιών να κατανοήσει τη διαδικασία.

Το βαθύ νευρωνικό δίκτυο, ή οι αλγόριθμοι που βασίζονται στη λειτουργία του εγκεφάλου, εκπαιδεύτηκαν με 11.788 φωτογραφίες. Οι φωτογραφίες περιελάμβαναν 200 διαφορετικά είδη πουλιών, συμπεριλαμβανομένων όλων, από πάπια μέχρι κολοκύθες.

Η ομάδα των ερευνητών δεν χρειαζόταν να εκπαιδεύσει συγκεκριμένα το δίκτυο για να αναγνωρίσει ράμφη ή πτερά φτερών. Αντίθετα, το δίκτυο είναι σε θέση να λάβει μια φωτογραφία ενός πουλιού και να αναγνωρίσει ορισμένα μοτίβα στην εικόνα. Μετά, μπορεί να πάρει αυτά τα μοτίβα και να αναγνωρίσει προηγούμενα μοτίβα που đã συναντήσει σε τυπικά χαρακτηριστικά ειδών.

Σύμφωνα με την ομάδα, το δίκτυο δημιουργεί μια σειρά από θερμικές χάρτες που αναγνωρίζουν ορισμένα χαρακτηριστικά. Για παράδειγμα, μπορεί να διακρίνει μεταξύ ενός κοινού ποταμού και ενός καλυμμένου ποταμού, μαζί με διαφορετικά χαρακτηριστικά όπως μια μασκαρεμένη κεφαλή και μια κίτρινη κοιλιά. Μετά, δείχνει ότι αυτά τα χαρακτηριστικά οδήγησαν στην αναγνώριση.

Σε Αντιθεση με Άλλα Συστήματα

Το νευρωνικό δίκτυο ήταν σε θέση να αναγνωρίσει το σωστό είδος μέχρι το 84% των περιπτώσεων. Αυτό είναι παρόμοιο με κάποια από τα καλύτερα συστήματα. Η διαφορά είναι ότι αυτά τα συστήματα δεν εξηγούν τη διαδικασία σκέψης όπως αυτό.

Σύμφωνα με την Rudin, το πιο επαναστατικό аспект αυτού του έργου είναι ότι παρέχει οπτικοποίηση για το τι βλέπουν τα βαθιά νευρωνικά δίκτυα όταν κοιτάζουν μια εικόνα.

Αυτή η τεχνολογία χρησιμοποιείται επίσης τώρα σε ιστοσελίδες κοινωνικών μέσων, για να αναγνωρίσει υπόπτους εγκληματίες σε κάμερες επιτήρησης και να βοηθήσει τα αυτονομικά οχήματα να αναγνωρίσουν σηματοδοτικά και πεζούς.

Το λογισμικό βαθιάς μάθησης συχνά δεν απαιτεί να προγραμματιστεί ρητά για να μάθει από δεδομένα, το οποίο δεν είναι ο caso για το παραδοσιακό λογισμικό. Ωστόσο, η διαδικασία δεν είναι πάντα σαφής ή εμφανής,所以 είναι συχνά δύσκολο να εξηγηθεί πώς οι αλγόριθμοι “σκέφτονται” όταν ταξινομούν μια εικόνα.

Στο Μέλλον

Η Rudin και άλλοι εργάζονται τώρα σε νέα μοντέλα βαθιάς μάθησης για την Τεχνητή Νοημοσύνη,推進 την περιοχή. Τα νέα μοντέλα μπορούν να εξηγήσουν τον λόγο και τη διαδικασία αναγνώρισης. Αυτό βοηθά τους ερευνητές να δουν από την αρχή μέχρι το τέλος και κάνει πιο εύκολο να αναγνωριστεί ο λόγος πίσω από ένα λάθος ή πρόβλημα.

Η Rudin και η ομάδα της θα εργαστούν στην χρήση του αλγορίθμου στον ιατρικό τομέα. Μπορεί να αναγνωρίσει ορισμένες προβληματικές περιοχές μέσα σε ιατρικές εικόνες όπως μαμμογράφοι. Αυτό θα βοηθήσει τους ιατρικούς επαγγελματίες να ανιχνεύσουν όγκους, πυκνώσεις και άλλα σημάδια καρκίνου του μαστού.

Σύμφωνα με την Rudin, το δίκτυο μιμείται τον τρόπο που οι γιατροί κάνουν μια διάγνωση.

“Είναι μια περίπτωση-βασισμένη λογική,” είπε η Rudin. “Ελπίζουμε ότι μπορούμε να εξηγήσουμε καλύτερα στους γιατρούς ή τους ασθενείς γιατί η εικόνα τους ταξινομήθηκε από το δίκτυο ως είτε κακοήθης ή καλοήθης.”

Η ομάδα θα παρουσιάσει μια εργασία που περιλαμβάνει την έρευνά τους στη Συνέδριο για την Επεξεργασία Πληροφοριών Νευρωνικών Συστημάτων (NeurlIPS2019) στο Βανκούβερ στις 12 Δεκεμβρίου.

Η μελέτη περιλαμβάνει επίσης συγγραφείς Daniel Tao και Alina Barnerr του Duke και Jonathan Su στο MIT Lincoln Laboratory.

Alex McFarland

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.