Övervakning
CSET: Kina leder världen inom datorseendeövervakningsforskning

En ny rapport från Center for Security and Emerging Technology (CSET) har funnit att Kinas forskningssektor producerar ‘en oproportionerligt stor andel’ av forskning inom tre kärnområden för AI-relaterad övervakningsteknologi, och att KKP:s mer allmänna bidrag till datorseende-teknologier växer i samma takt, och märkbart överträffar västerländska publiceringsfrekvenser.

Kinas tydliga ledning inom forskningsinitiativ inom mer kontroversiella underområden av datorseende-forskning, främst relaterad till övervakning. Källa: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf
De tre nyckelområdena där Kina har en massiv ledning är personomidentifiering (REID), folksamling och spoofing-detektering (dvs. tekniker som syftar till att avslöja försök att undergräva identifikationsteknologier).
Dessutom, som visas i grafen ovan, publicerar Kinas forskarsamhälle en betydligt högre procentuell andel artiklar om människo-orienterade datorseende-uppgifter som, enligt artikeln, representerar stödteknologier för bredare övervakningslösningar som använder maskinlärande. Dessa uppgifter inkluderar känsligendekning, ansiktsigenkänning och åtgärdsigenkänning.
Författarna kommenterar:
‘Dessa algoritmer tillämpas ofta för harmlösa, kommersiella ändamål, såsom att markera individer i sociala mediefoton. Men framsteg inom datorseende kan också ge vissa regeringar möjlighet att använda övervakningsteknologi för repressiva ändamål.’
På ett mindre illavarslande sätt har författarna funnit att artiklar relaterade till visuell övervakning utgör under 10% av all datorseende-forskning som utfördes under studieperioden, och att den bredare delen av forskningen är ganska jämnt fördelad över länder.
Men Kinas dominans är tydlig, hävdar forskarna*:
‘Forskare med kinesiska institutionella tillhörigheter var ansvariga för mer än en tredjedel av publikationerna inom både datorseende och visuell övervakningsforskning.
‘Detta gör Kina till långt den mest produktiva nationen inom båda områdena. Kinesiska forskares andel av den globala visuella övervakningsforskningen växer i en liknande takt som deras andel av datorseende-forskning.’
Den nya rapporten, med titeln Trender i AI-forskning för visuell övervakning av befolkningar, representerar tillämpningen av Natural Language Processing (NLP)-metoder på en dataset med publicerade artiklar som täcker åren 2015-2019, och är skriven av Ashwin Acharya, Max Langenkamp och James Dunham.
Engelskspråkig bias
Författarna till artikeln observerar att deras studie endast berör engelskspråkiga vetenskapliga artiklar, och att en utvidgning till icke-anglofona publikationer kan avslöja en djupare isberg av akademiskt företag från Kina inom dessa sektorer. Dessutom tror forskarna att tillägg av data med hjälp av tilläggsinformation, såsom patentdata, kameradistribution och relevanta regeringspolitik, kan öka denna statistiska ledning.
Naturligtvis medger artikeln att analys av offentliga och öppet publicerade artiklar inte kan ta hänsyn till privat företags- eller statlig forskning, och klassificerad forskning, men det är ett fungerande index för sektorns aktivitet i avsaknad av dessa dolda datapunkter.
Arkitektur och data
Författarna härleddes kärndata genom att träna en SciREX-dokumentnivåinformationsextraktionsmodell på data från Papers With Code, med ramverket som härleddes relevansen av artiklar genom att identifiera referenser till uppgifter relaterade till datorseende, och särskilt till övervakningscentrerade projekt och initiativ.
Modellen tillämpades sedan på en sammanställd CSET-kropp av vetenskaplig litteratur som innehåller mer än 100 miljoner enskilda publikationer över sex akademiska dataset. Publiceringsplattformarna som var inblandade var Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv och Papers With Code.
Tränad på Arxiv-preprint, en SciBERT-klassificerare tilldelades sedan uppgiften att identifiera datorseende-artiklar över hela corpus.
Det faktum att SciREX och SciBERT är tränade på engelskspråkiga dokument förhindrade forskarna från att utöka studiens räckvidd bortom engelska. Om detta kommenterar forskarna: ‘Detta innebär att i nationella jämförelser underskattar det icke-engelska forskningsutbudet, och i synnerhet underskattar det sannolikt Kinas andel av världens forskning.’
Resultat
Inom den visuella övervakningssektorn finner studien att ansiktsigenkänning var den vanligaste uppgiften, som förekom i mer än tusen artiklar för året 2019. Men författarna noterar att folksamling och ansikts-spoofing-igenkänning är ‘snabbt växande’ områden.

Från artikeln, de vanligaste uppgifterna identifierade för de studerade åren. Citerad källa är ‘CSET sammanfogad korpus. Resultat genererat den 22 juli 2021’
Författarna till artikeln anser att även de tydligen mer ‘neutrala’ och mindre politiskt laddade datorseende-aktiviteterna relaterade till övervakning också kan bidra till repressiva kontrollsystem. För ‘åtgärdsigenkänning’ observerar de att detta kan användas för att identifiera ‘avvikande beteende’ i trånga offentliga utrymmen; för ansikts-spoofing kommenterar de ‘Medan det ibland används i biometrisk inloggning eller för att förhindra bedrägeri, kan det också förhindra journalister och aktivister från att dölja sin identitet’; och med avseende på känsligendekning kommenterar artikeln att ‘Förutom dess icke-säkerhetsinriktade och kommersiella syften, föreslår vissa forskare, företag och regeringsorgan att tillämpa känsligendekning för att identifiera säkerhetshot i trånga offentliga områden’.
I allmänhet verkar resultaten visa att Kina är ovanligt intresserat av datorseende-forskning, jämfört med det globala genomsnittet.

Författarna slutsats:
‘[Den] andel av både datorseende och visuell övervakning från Kina ökade över tiden. USA, tillsammans med dess allierade och partners, publicerade en liknande mängd forskning inom dessa områden som Kina publicerade ensam. Men dessa andra regioners andel av den globala övervakningsforskningen var stabil eller minskade medan Kinas växte.’
*Författarnas egna fetstil.
Publicerad första gången den 6 januari 2022.












