stub CSET: Kina leder verden inden for computersynsovervågningsforskning - Unite.AI
Følg os

Overvågning

CSET: Kina er førende i verden inden for computersynsovervågningsforskning

mm

Udgivet

 on

En ny rapport fra Center for Security and Emerging Technology (CSET) har fundet ud af, at Kinas forskningssektor producerer 'en uforholdsmæssig stor andel' af forskningen i tre kerne AI-relaterede overvågningsteknologier, og at CCP's mere generelle bidrag til computervisionsteknologier vokser. i samme takt og især overhaling af vestlige udgivelsesrater.

Kinas klare forspring inden for forskningsinitiativer inden for mere kontroversielle undersektorer af computersynsforskning, primært relateret til overvågning. Kilde: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Kinas klare forspring inden for forskningsinitiativer inden for mere kontroversielle undersektorer af computersynsforskning, primært relateret til overvågning. Kilde: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

De tre nøgleområder, hvor Kina har et massivt forspring, er person re-identification (REID), crowdcounting og spoofing-detektion (dvs. teknologier, der har til formål at afsløre forsøg på at undergrave identifikationsteknologier).

Derudover udgiver Kinas forskningsmiljø, som angivet i grafen ovenfor, en markant højere procentdel af artikler om menneskevendte computersynsopgaver, som, hævder papiret, repræsenterer understøttende teknologier til bredere overvågningsløsninger, der bruger maskinlæring. Disse opgaver omfatter følelsesgenkendelse, ansigtsgenkendelse og handlingsgenkendelse.

Forfatterne kommenterer:

"Disse algoritmer anvendes ofte til godartede, kommercielle formål, såsom tagging af personer i sociale medier-billeder. Men fremskridt inden for computersyn kunne også give nogle regeringer mulighed for at bruge overvågningsteknologi til undertrykkende formål.'

På en mindre uhyggelig bemærkning har forfatterne fundet ud af, at papirer relateret til visuel overvågning tegner sig for under 10 % af al computersynsforskning udført i undersøgelsesperioden, og at den bredere del af forskningen er ret jævnt fordelt på tværs af lande.

Kinas dominans er dog klar, hævder forskerne*:

'Forskere med kinesiske institutionelle tilhørsforhold var ansvarlige for mere end en tredjedel af publikationerne inden for både computersyn og visuel overvågningsforskning.

»Dette gør Kina til det klart mest produktive land i begge områder. Kinesiske forskeres andel af global visuel overvågningsforskning vokser i samme hastighed som deres andel af computersynsforskning.'

Den nye indberette, med titlen Tendenser i AI-forskning til visuel overvågning af befolkninger, repræsenterer anvendelsen af ​​Natural Language Processing (NLP) tilgange til et datasæt af publicerede artikler, der dækker årene 2015-2019, og er skrevet af Ashwin Acharya, Max Langenkamp og James Dunham.

Engelsk sprogbias

Forfatterne af papiret bemærker, at deres undersøgelse kun berører engelsksprogede videnskabelige artikler, og at en udvidelse af den til ikke-anglofoniske publikationer kunne afsløre et dybere isbjerg af akademisk bestræbelse fra Kina i disse sektorer. Yderligere mener forskerne, at en forøgelse af dataene med supplerende information, såsom patentdata, kameraudrulning og relevante regeringspolitikker, kan øge dette statistiske forspring.

Naturligvis indrømmer papiret, at analyser af offentlige og åbent offentliggjorte artikler ikke kan redegøre for privat virksomheds- eller statsforskning og klassificeret forskning, men er et brugbart indeks for sektoraktivitet i fravær af disse skjulte datapunkter.

Arkitektur og data

Forfatterne udledte kernedata ved at træne en SciREX informationsudtrækningsmodel på dokumentniveau på data fra Papers With Code, med rammen, der udleder papirernes relevans ved at identificere referencer til opgaver relateret til computersyn, og især til overvågningscentrerede projekter og initiativer.

Modellen blev derefter anvendt på en aggregeret CSET-samling af videnskabelig litteratur indeholdende mere end 100 millioner individuelle publikationer på tværs af seks akademiske datasæt. De involverede publiceringsplatforme var Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv og Papers With Code.

Uddannet i Arxiv fortryk, en SciBERT klassificerer fik derefter til opgave at identificere computervisionspapirer på tværs af korpuset.

Det faktum, at SciREX og SciBERT er uddannet i engelsksprogede dokumenter, forhindrede forskerne i at udvide undersøgelsens rækkevidde ud over engelsk. Herom kommenterer forskerne: "Det betyder, at det i nationale sammenligninger undervurderer ikke-engelsk forskningsoutput, og især underrepræsenterer det sandsynligvis Kinas andel af verdensforskningen."

Fund

Inden for sektoren for visuel overvågning finder undersøgelsen, at ansigtsgenkendelse var den mest tilbagevendende opgave, som dukkede op i mere end tusinde aviser for året 2019. Forfatterne bemærker dog, at crowdcounting og ansigtsspoofing-genkendelse er 'hurtigt voksende' felter af forfølgelse.

Fra papiret er de hyppigst tilbagevendende opgaver individuelt for de undersøgte år. Citeret kilde er 'CSET fusioneret korpus. Resultater genereret 22. juli 2021'

Fra papiret er de hyppigst tilbagevendende opgaver individuelt for de undersøgte år. Citeret kilde er 'CSET fusionerede korpus. Resultater genereret 22. juli 2021'

Forfatterne af papiret mener, at selv de tilsyneladende mere 'neutrale' og mindre politisk brandfarlige computersynsaktiviteter i forbindelse med overvågning også kan bidrage til undertrykkende kontrolsystemer. For 'Action recognition' bemærker de, at dette kan bruges til at identificere 'unormal adfærd' i overfyldte offentlige rum; for ansigtsspoofing, kommenterer de "Selvom det nogle gange bruges i biometriske login-systemer eller for at forhindre svindel, kan det også forhindre journalister og aktivister i at skjule deres identitet"; og med hensyn til følelsesgenkendelse, kommenterer avisen det "Ud over dets ikke-sikkerhedsorienterede og kommercielle formål foreslår nogle forskere, firmaer og statslige agenturer at anvende følelsesgenkendelse til at identificere sikkerhedstrusler i overfyldte offentlige områder".

Generelt synes resultaterne at vise, at Kina er over gennemsnittet interesseret i computersynsforskning sammenlignet med det globale gennemsnit.

Forfatterne konkluderer:

"Andelen af ​​både computersyn og visuel overvågning fra Kina steg over tid. USA offentliggjorde sammen med sine allierede og partnere en lignende mængde forskning på disse områder, som Kina offentliggjorde alene. Disse andre regioners andel af den globale overvågningsforskning var imidlertid stabil eller faldet, mens Kinas voksede.'

 

*Avisforfatternes dristige fremhævelse.

Først offentliggjort 6. januar 2022.