Überwachung
CSET: China ist weltweit führend in der Computer-Vision-Überwachungsforschung

In einem neuen Bericht des Center for Security and Emerging Technology (CSET) wurde festgestellt, dass Chinas Forschungssektor „einen unverhältnismäßigen Anteil“ an der Forschung zu drei zentralen KI-bezogenen Überwachungstechnologien produziert und dass der allgemeinere Beitrag der KPCh zu Computer-Vision-Technologien zunimmt mit der gleichen Geschwindigkeit und übertraf insbesondere die westlichen Veröffentlichungsraten.

Chinas klarer Vorsprung bei Forschungsinitiativen in umstritteneren Teilbereichen der Computer-Vision-Forschung, vor allem im Zusammenhang mit Überwachung. Quelle: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf
Die drei Schlüsselbereiche, in denen China einen großen Vorsprung hat, sind Personen-Re-Identifizierung (REID), Menschenmengenzählung und Spoofing-Erkennung (also Technologien, die darauf abzielen, Versuche zur Untergrabung von Identifizierungstechnologien aufzudecken).
Darüber hinaus veröffentlicht die chinesische Forschungsgemeinschaft, wie aus der obigen Grafik hervorgeht, einen deutlich höheren Prozentsatz an Arbeiten zu Computer-Vision-Aufgaben mit Blick auf den Menschen, die, wie in der Arbeit argumentiert wird, unterstützende Technologien für umfassendere Überwachungslösungen darstellen, die maschinelles Lernen nutzen. Zu diesen Aufgaben gehören Emotionserkennung, Gesichtserkennung und Aktionserkennung.
Die Autoren kommentieren:
„Diese Algorithmen werden häufig für harmlose, kommerzielle Zwecke eingesetzt, beispielsweise zum Markieren von Personen auf Social-Media-Fotos. Aber Fortschritte in der Bildverarbeitung könnten einige Regierungen auch dazu befähigen, Überwachungstechnologie für repressive Zwecke einzusetzen.“
Weniger unheimlich ist, dass die Autoren herausgefunden haben, dass Arbeiten im Zusammenhang mit visueller Überwachung weniger als 10 % aller im Untersuchungszeitraum durchgeführten Computer-Vision-Forschung ausmachen und dass der breitere Teil der Forschung ziemlich gleichmäßig über die Länder verteilt ist.
Die Dominanz Chinas sei jedoch klar, behaupten die Forscher*:
„Forscher mit Verbindungen zu chinesischen Institutionen waren für mehr als ein Drittel der Veröffentlichungen sowohl in der Computer-Vision- als auch in der visuellen Überwachungsforschung verantwortlich.“
„Damit ist China in beiden Bereichen das mit Abstand produktivste Land.“ „Der Anteil chinesischer Forscher an der weltweiten visuellen Überwachungsforschung wächst ähnlich schnell wie ihr Anteil an der Computer-Vision-Forschung.“
The new berichten, Betitelt Trends in der KI-Forschung zur visuellen Überwachung von Populationenstellt die Anwendung von NLP-Ansätzen (Natural Language Processing) auf einen Datensatz veröffentlichter Arbeiten aus den Jahren 2015–2019 dar und wurde von Ashwin Acharya, Max Langenkamp und James Dunham verfasst.
Voreingenommenheit in der englischen Sprache
Die Autoren des Papiers stellen fest, dass ihre Studie nur englischsprachige wissenschaftliche Arbeiten berührt und dass die Ausweitung auf nicht-anglophone Veröffentlichungen einen tieferen Eisberg akademischer Bemühungen aus China in diesen Bereichen aufdecken könnte. Darüber hinaus glauben die Forscher, dass die Anreicherung der Daten mit Zusatzinformationen wie Patentdaten, Kameraeinsatz und einschlägigen Regierungsrichtlinien diesen statistischen Vorsprung vergrößern könnte.
Natürlich räumt das Papier ein, dass die Analyse öffentlicher und offen veröffentlichter Papiere private Unternehmens- oder Staatsforschung und geheime Forschung nicht berücksichtigen kann, sondern ein brauchbarer Index für die Branchenaktivität ist, wenn diese versteckten Datenpunkte fehlen.
Architektur und Daten
Die Autoren leiteten Kerndaten durch Training von a ab SciREX Informationsextraktionsmodell auf Dokumentebene für Daten aus Papers With Code, wobei das Framework die Relevanz von Papieren durch die Identifizierung von Verweisen auf Aufgaben im Zusammenhang mit Computer Vision und insbesondere auf überwachungsorientierte Projekte und Initiativen ableitet.
Das Modell wurde dann auf einen aggregierten CSET-Bestand an wissenschaftlicher Literatur angewendet, der mehr als 100 Millionen Einzelpublikationen in sechs akademischen Datensätzen umfasste. Die beteiligten Veröffentlichungsplattformen waren Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv und Papers With Code.
Geschult auf Arxiv-Preprints, a SciBERT Der Klassifikator wurde dann damit beauftragt, Computer-Vision-Papiere im gesamten Korpus zu identifizieren.
Die Tatsache, dass SciREX und SciBERT auf englischsprachige Dokumente geschult sind, hinderte die Forscher daran, die Reichweite der Studie über die englische Sprache hinaus auszudehnen. Dazu kommentieren die Forscher: „Das bedeutet, dass es im nationalen Vergleich die nicht-englische Forschungsleistung unterschätzt und insbesondere Chinas Anteil an der weltweiten Forschung wahrscheinlich unterrepräsentiert.“
Befund
Die Studie stellt fest, dass die Gesichtserkennung im Bereich der visuellen Überwachung die am häufigsten vorkommende Aufgabe war und im Jahr 2019 in mehr als tausend Veröffentlichungen auftauchte. Die Autoren weisen jedoch darauf hin, dass die Erkennung von Menschenmengen und die Erkennung von Gesichtsfälschungen „schnell wachsende“ Bereiche sind der Verfolgung.

Aus der Arbeit wurden die am häufigsten wiederkehrenden Aufgaben für die untersuchten Jahre ermittelt. Zitierte Quelle ist 'CSET zusammengeführtes Korpus. Ergebnisse generiert am 22. Juli 2021'
Die Autoren des Papiers sind der Ansicht, dass selbst scheinbar „neutralere“ und weniger politisch aufrührerische Computer-Vision-Aktivitäten im Zusammenhang mit Überwachung ebenfalls zu repressiven Kontrollsystemen beitragen können. Was die „Aktionserkennung“ betrifft, stellen sie fest, dass damit „abnormales Verhalten“ in überfüllten öffentlichen Räumen identifiziert werden kann; wegen Gesichtsfälschung, kommentieren sie „Obwohl es manchmal in biometrischen Anmeldesystemen oder zur Verhinderung von Betrug verwendet wird, kann es auch Journalisten und Aktivisten daran hindern, ihre Identität zu verbergen.“; und in Bezug auf die Emotionserkennung wird dies in dem Artikel kommentiert „Zusätzlich zu seinen nicht sicherheitsorientierten und kommerziellen Zwecken schlagen einige Forscher, Firmen und Regierungsbehörden den Einsatz der Emotionserkennung vor, um Sicherheitsbedrohungen in überfüllten öffentlichen Bereichen zu erkennen.“.
Generell scheinen die Ergebnisse zu zeigen, dass China im Vergleich zum weltweiten Durchschnitt ein überdurchschnittlich großes Interesse an Computer-Vision-Forschung hat.
Die Autoren folgern:
„[Der] Anteil von Computer Vision und visueller Überwachung aus China nahm im Laufe der Zeit zu.“ Die Vereinigten Staaten haben zusammen mit ihren Verbündeten und Partnern in diesen Bereichen ähnlich viele Forschungsergebnisse veröffentlicht wie China allein. Allerdings blieb der Anteil dieser anderen Regionen an der globalen Überwachungsforschung stabil oder ging zurück, während der Anteil Chinas wuchs.“
*Kühne Hervorhebung durch die Autoren des Artikels.
Erstveröffentlichung am 6. Januar 2022.