στέλεχος CSET: Η Κίνα ηγείται του κόσμου στην έρευνα παρακολούθησης όρασης υπολογιστή - Unite.AI
Συνδεθείτε μαζί μας

Επιτήρηση

CSET: Η Κίνα ηγείται του κόσμου στην έρευνα παρακολούθησης όρασης υπολογιστών

mm

Δημοσιευμένα

 on

Μια νέα έκθεση από το Κέντρο για την Ασφάλεια και την Αναδυόμενη Τεχνολογία (CSET) διαπίστωσε ότι ο ερευνητικός τομέας της Κίνας παράγει «δυσανάλογο μερίδιο» έρευνας σε τρεις βασικές τεχνολογίες επιτήρησης που σχετίζονται με την τεχνητή νοημοσύνη και ότι η γενικότερη συμβολή του ΚΚΚ στις τεχνολογίες όρασης υπολογιστών αυξάνεται με τον ίδιο ρυθμό, και κυρίως ξεπερνώντας τα δυτικά ποσοστά δημοσίευσης.

Το ξεκάθαρο προβάδισμα της Κίνας σε ερευνητικές πρωτοβουλίες σε πιο αμφιλεγόμενους υποτομείς της έρευνας για την όραση υπολογιστών, που σχετίζονται κυρίως με την επιτήρηση. Πηγή: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Το ξεκάθαρο προβάδισμα της Κίνας σε ερευνητικές πρωτοβουλίες σε πιο αμφιλεγόμενους υποτομείς της έρευνας για την όραση υπολογιστών, που σχετίζονται κυρίως με την επιτήρηση. Πηγή: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Οι τρεις βασικοί τομείς στους οποίους η Κίνα έχει τεράστιο προβάδισμα είναι η εκ νέου ταυτοποίηση προσώπων (REID), η καταμέτρηση πλήθους και η ανίχνευση πλαστογράφησης (δηλαδή τεχνολογίες που στοχεύουν να αποκαλύψουν τις προσπάθειες ανατροπής των τεχνολογιών ταυτοποίησης).

Επιπλέον, όπως υποδεικνύεται στο παραπάνω γράφημα, η ερευνητική κοινότητα της Κίνας δημοσιεύει ένα σημαντικά υψηλότερο ποσοστό εγγράφων σχετικά με εργασίες όρασης υπολογιστή που αντιμετωπίζουν τον άνθρωπο, οι οποίες, υποστηρίζει το έγγραφο, αντιπροσωπεύουν τεχνολογίες υποστήριξης για ευρύτερες λύσεις επιτήρησης που χρησιμοποιούν μηχανική μάθηση. Αυτές οι εργασίες περιλαμβάνουν την αναγνώριση συναισθημάτων, την αναγνώριση προσώπου και την αναγνώριση ενεργειών.

Οι συγγραφείς σχολιάζουν:

«Αυτοί οι αλγόριθμοι εφαρμόζονται συχνά για καλοήθεις, εμπορικές χρήσεις, όπως η επισήμανση ατόμων σε φωτογραφίες των μέσων κοινωνικής δικτύωσης. Αλλά η πρόοδος στην όραση υπολογιστών θα μπορούσε επίσης να εξουσιοδοτήσει ορισμένες κυβερνήσεις να χρησιμοποιούν τεχνολογία επιτήρησης για κατασταλτικούς σκοπούς».

Σε μια λιγότερο απαίσια σημείωση, οι συγγραφείς ανακάλυψαν ότι οι εργασίες που σχετίζονται με την οπτική επιτήρηση αντιπροσωπεύουν λιγότερο από το 10% του συνόλου της έρευνας για την όραση υπολογιστή που πραγματοποιήθηκε κατά την περίοδο της μελέτης και ότι η ευρύτερη δόση της έρευνας κατανέμεται αρκετά ομοιόμορφα στις χώρες.

Ωστόσο, η κυριαρχία της Κίνας είναι σαφής, υποστηρίζουν οι ερευνητές*:

«Ερευνητές με κινεζικές θεσμικές σχέσεις ήταν υπεύθυνοι για περισσότερο από το ένα τρίτο των δημοσιεύσεων τόσο στην έρευνα όρασης υπολογιστή όσο και στην έρευνα οπτικής επιτήρησης.

«Αυτό κάνει την Κίνα μακράν την πιο παραγωγική χώρα και στους δύο τομείς. Το μερίδιο των Κινέζων ερευνητών στην παγκόσμια έρευνα οπτικής επιτήρησης αυξάνεται με παρόμοιο ρυθμό με το μερίδιό τους στην έρευνα όρασης υπολογιστή».

Το νέο αναφέρουν, Με τίτλο Τάσεις στην Έρευνα AI για την Οπτική Παρακολούθηση Πληθυσμών, αντιπροσωπεύει την εφαρμογή των προσεγγίσεων της Επεξεργασίας Φυσικής Γλώσσας (NLP) σε ένα σύνολο δεδομένων δημοσιευμένων εργασιών που καλύπτουν τα έτη 2015-2019 και είναι γραμμένο από τους Ashwin Acharya, Max Langenkamp και James Dunham.

Προκατάληψη Αγγλικής Γλώσσας

Οι συντάκτες της εργασίας παρατηρούν ότι η μελέτη τους αγγίζει μόνο αγγλόφωνες επιστημονικές εργασίες και ότι η επέκτασή της σε μη αγγλόφωνες δημοσιεύσεις θα μπορούσε να αποκαλύψει ένα βαθύτερο παγόβουνο ακαδημαϊκών προσπαθειών από την Κίνα σε αυτούς τους τομείς. Επιπλέον, οι ερευνητές πιστεύουν ότι η αύξηση των δεδομένων με βοηθητικές πληροφορίες, όπως δεδομένα διπλωμάτων ευρεσιτεχνίας, ανάπτυξη κάμερας και σχετικές κυβερνητικές πολιτικές, θα μπορούσε να αυξήσει αυτό το στατιστικό προβάδισμα.

Φυσικά, το έγγραφο παραδέχεται, η ανάλυση δημόσιων και ανοιχτά δημοσιευμένων εργασιών δεν μπορεί να λογοδοτήσει για ιδιωτική εταιρική ή κρατική έρευνα, και διαβαθμισμένη έρευνα, αλλά είναι ένας λειτουργικός δείκτης της δραστηριότητας του κλάδου ελλείψει αυτών των κρυφών σημείων δεδομένων.

Αρχιτεκτονική και Δεδομένα

Οι συγγραφείς άντλησαν βασικά δεδομένα με εκπαίδευση α SciREX Μοντέλο εξαγωγής πληροφοριών σε επίπεδο εγγράφου σε δεδομένα από Papers With Code, με το πλαίσιο να εξάγει τη συνάφεια των εγγράφων με τον εντοπισμό αναφορών σε εργασίες που σχετίζονται με την όραση υπολογιστή, και ιδιαίτερα σε έργα και πρωτοβουλίες με επίκεντρο την επιτήρηση.

Στη συνέχεια, το μοντέλο εφαρμόστηκε σε ένα συγκεντρωτικό σώμα επιστημονικής βιβλιογραφίας CSET που περιείχε περισσότερες από 100 εκατομμύρια μεμονωμένες δημοσιεύσεις σε έξι ακαδημαϊκά σύνολα δεδομένων. Οι πλατφόρμες δημοσίευσης που συμμετείχαν ήταν οι Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv και Papers With Code.

Εκπαιδεύτηκε στις προεκτυπώσεις Arxiv, α SciBERT Στη συνέχεια, ο ταξινομητής επιφορτίστηκε με την αναγνώριση των εγγράφων όρασης υπολογιστή σε όλο το σώμα.

Το γεγονός ότι οι SciREX και SciBERT εκπαιδεύονται σε έγγραφα της αγγλικής γλώσσας εμπόδισε τους ερευνητές να επεκτείνουν την εμβέλεια της μελέτης πέρα ​​από τα αγγλικά. Για αυτό, οι ερευνητές σχολιάζουν: «Αυτό σημαίνει ότι σε εθνικές συγκρίσεις υποτιμά την παραγωγή μη αγγλικής έρευνας, και συγκεκριμένα, πιθανότατα υποεκπροσωπεί το μερίδιο της Κίνας στην παγκόσμια έρευνα».

Ευρήματα

Στον τομέα της οπτικής επιτήρησης, η μελέτη διαπιστώνει ότι η αναγνώριση προσώπου ήταν η πιο επαναλαμβανόμενη εργασία, η οποία εμφανίστηκε σε περισσότερες από χίλιες εργασίες για το έτος 2019. Ωστόσο, οι συγγραφείς σημειώνουν ότι η καταμέτρηση πλήθους και η αναγνώριση πλαστογράφησης προσώπου είναι «ταχέως αναπτυσσόμενα» πεδία της καταδίωξης.

Από την εργασία, οι πιο συχνά επαναλαμβανόμενες εργασίες εξατομικεύτηκαν για τα έτη που μελετήθηκαν. Η αναφερόμενη πηγή είναι το «CSET merged corpus. Αποτελέσματα δημιουργήθηκαν 22 Ιουλίου 2021'

Από την εργασία, οι πιο συχνά επαναλαμβανόμενες εργασίες εξατομικεύτηκαν για τα έτη που μελετήθηκαν. Η αναφερόμενη πηγή είναι «Το CSET συγχωνευμένο σώμα. Αποτελέσματα δημιουργήθηκαν 22 Ιουλίου 2021'

Οι συντάκτες της εργασίας θεωρούν ότι ακόμη και οι φαινομενικά πιο «ουδέτερες» και λιγότερο πολιτικά εμπρηστικές επιδιώξεις υπολογιστικής όρασης που σχετίζονται με την παρακολούθηση μπορούν επίσης να συμβάλουν στα κατασταλτικά συστήματα ελέγχου. Για την «Αναγνώριση δράσης», παρατηρούν ότι αυτό μπορεί να χρησιμοποιηθεί για τον εντοπισμό της «ανώμαλης συμπεριφοράς» σε πολυσύχναστους δημόσιους χώρους. για πλαστογράφηση προσώπου, σχολιάζουν «Ενώ μερικές φορές χρησιμοποιείται σε βιομετρικά συστήματα σύνδεσης ή για την αποτροπή απάτης, μπορεί επίσης να εμποδίσει δημοσιογράφους και ακτιβιστές να κρύψουν την ταυτότητά τους»; και όσον αφορά την αναγνώριση συναισθημάτων, η εφημερίδα σχολιάζει ότι «Εκτός από τους μη προσανατολισμένους στην ασφάλεια και εμπορικούς σκοπούς του, ορισμένοι ερευνητές, εταιρείες και κυβερνητικές υπηρεσίες προτείνουν την εφαρμογή αναγνώρισης συναισθημάτων για τον εντοπισμό απειλών για την ασφάλεια σε πολυσύχναστους δημόσιους χώρους».

Σε γενικές γραμμές, τα ευρήματα φαίνεται να δείχνουν ότι η Κίνα ενδιαφέρεται υπεράνω του μέσου όρου για την έρευνα όρασης υπολογιστών, σε σύγκριση με τον παγκόσμιο μέσο όρο.

Οι συντάκτες συμπεραίνουν:

«[Το] μερίδιο τόσο της όρασης υπολογιστή όσο και της οπτικής επιτήρησης από την Κίνα αυξήθηκε με την πάροδο του χρόνου. Οι Ηνωμένες Πολιτείες, μαζί με τους συμμάχους και τους εταίρους τους, δημοσίευσαν παρόμοια ποσότητα έρευνας σε αυτούς τους τομείς όπως η Κίνα δημοσίευσε μόνη της. Ωστόσο, το μερίδιο αυτών των άλλων περιοχών στην παγκόσμια έρευνα παρακολούθησης ήταν σταθερό ή μειώθηκε, ενώ η Κίνα αυξανόταν».

 

*Η τολμηρή έμφαση των συγγραφέων της εργασίας.

Πρώτη δημοσίευση 6 Ιανουαρίου 2022.