peň CSET: Čína vedie svet vo výskume počítačového videnia – Unite.AI
Spojte sa s nami

dohľad

CSET: Čína vedie svet vo výskume počítačového videnia

mm

uverejnené

 on

Nová správa Centra pre bezpečnosť a nové technológie (CSET) zistila, že čínsky výskumný sektor produkuje „neúmerný podiel“ výskumu troch základných technológií sledovania súvisiacich s AI a že všeobecnejší prínos ČKS k technológiám počítačového videnia rastie. rovnakou rýchlosťou a najmä predbiehajúc západnú mieru zverejňovania.

Jasné vedúce postavenie Číny vo výskumných iniciatívach v kontroverznejších pododvetviach výskumu počítačového videnia, ktoré súvisia najmä s dohľadom. Zdroj: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Jasné vedúce postavenie Číny vo výskumných iniciatívach v kontroverznejších pododvetviach výskumu počítačového videnia, ktoré súvisia najmä s dohľadom. Zdroj: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Tri kľúčové oblasti, v ktorých má Čína obrovské prvenstvo, sú opätovná identifikácia osôb (REID), počítanie davu a detekcia spoofingu (tj technológie, ktorých cieľom je odhaliť pokusy o podvrhnutie identifikačných technológií).

Okrem toho, ako je uvedené v grafe vyššie, čínska výskumná komunita publikuje výrazne vyššie percento prác o úlohách počítačového videnia, ktorým čelí človek, čo podľa článku predstavuje podporné technológie pre širšie riešenia sledovania, ktoré využívajú strojové učenie. Tieto úlohy zahŕňajú rozpoznávanie emócií, rozpoznávanie tváre a rozpoznávanie akcií.

Autori komentujú:

„Tieto algoritmy sa často používajú na benígne komerčné účely, ako je označovanie jednotlivcov na fotografiách sociálnych médií. Ale pokrok v oblasti počítačového videnia by tiež mohol oprávniť niektoré vlády, aby používali sledovacie technológie na represívne účely.“

Menej zlovestnou poznámkou je, že autori zistili, že práce súvisiace s vizuálnym dohľadom tvoria menej ako 10 % všetkých výskumov počítačového videnia, ktoré sa uskutočnili v sledovanom období, a že širšia časť výskumu je celkom rovnomerne rozdelená medzi krajiny.

Avšak dominancia Číny je jasná, tvrdia vedci*:

„Výskumníci s čínskymi inštitucionálnymi vzťahmi boli zodpovední za viac ako tretinu publikácií v oblasti počítačového videnia a výskumu vizuálneho dohľadu.

„To robí z Číny zďaleka najplodnejšiu krajinu v oboch oblastiach. Podiel čínskych výskumníkov na globálnom výskume vizuálneho dohľadu rastie podobným tempom ako ich podiel na výskume počítačového videnia.“

Nový správy, s názvom Trendy vo výskume AI pre vizuálny dohľad nad populáciami, predstavuje aplikáciu prístupov spracovania prirodzeného jazyka (NLP) na súbor údajov publikovaných prác pokrývajúcich roky 2015-2019 a napísali ho Ashwin Acharya, Max Langenkamp a James Dunham.

Zaujatosť anglického jazyka

Autori článku poznamenávajú, že ich štúdia sa dotýka iba vedeckých prác v anglickom jazyku a že jej rozšírenie na neanglofónne publikácie by mohlo odhaliť hlbší ľadovec akademického úsilia z Číny v týchto sektoroch. Vedci sa ďalej domnievajú, že rozšírenie údajov o pomocné informácie, ako sú patentové údaje, nasadenie kamier a príslušné vládne politiky, by mohlo zvýšiť tento štatistický náskok.

Prirodzene, tento dokument pripúšťa, že analýza verejných a otvorene publikovaných článkov nemôže zodpovedať za súkromný podnikový alebo štátny výskum a klasifikovaný výskum, ale je funkčným indexom sektorovej aktivity bez týchto skrytých údajových bodov.

Architektúra a dáta

Autori odvodili základné údaje tréningom a SciREX model extrakcie informácií na úrovni dokumentu o údajoch z Papers With Code, s rámcom odvodzujúcim relevantnosť dokumentov identifikáciou odkazov na úlohy súvisiace s počítačovým videním a najmä na projekty a iniciatívy zamerané na dohľad.

Model bol potom aplikovaný na agregovaný súbor odbornej literatúry CSET obsahujúci viac ako 100 miliónov individuálnych publikácií v šiestich akademických súboroch údajov. Zapojené publikačné platformy boli Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv a Papers With Code.

Vyškolený na Arxiv preprints, a SciBERT klasifikátor mal potom za úlohu identifikovať papiere počítačového videnia v celom korpuse.

Skutočnosť, že SciREX a SciBERT sú vyškolení na dokumentoch v anglickom jazyku, zabránila výskumníkom rozšíriť dosah štúdie za hranice angličtiny. K tomu vedci komentujú: "To znamená, že v národných porovnaniach podceňuje neanglické výstupy výskumu a najmä pravdepodobne nedostatočne reprezentuje podiel Číny na svetovom výskume."

Findings

V rámci sektora vizuálneho dohľadu štúdia zistila, že rozpoznávanie tvárí bolo najčastejšie sa opakujúcou úlohou, ktorá sa objavila vo viac ako tisícke článkov za rok 2019. Autori však poznamenávajú, že počítanie ľudí a rozpoznávanie falšovania tvárí sú „rýchlo rastúce“ oblasti. prenasledovania.

Z príspevku sú najčastejšie opakujúce sa úlohy rozčlenené za sledované roky. Citovaný zdroj je 'CSET merged corpus. Výsledky vygenerované 22. júla 2021'

Z príspevku sú najčastejšie opakujúce sa úlohy rozčlenené za sledované roky. Citovaný zdroj je 'CSET zlúčený korpus. Výsledky vygenerované 22. júla 2021'

Autori článku sa domnievajú, že dokonca aj zjavne „neutrálnejšie“ a politicky menej poburujúce snahy o počítačové videnie súvisiace so sledovaním môžu tiež prispieť k represívnym kontrolným systémom. V prípade „rozpoznania činnosti“ poznamenávajú, že to možno použiť na identifikáciu „nenormálneho správania“ v preplnených verejných priestoroch; za spoofing tváre, komentujú „Aj keď sa niekedy používa v biometrických prihlasovacích systémoch alebo na predchádzanie podvodom, môže tiež zabrániť novinárom a aktivistom skrývať svoju identitu“; a pokiaľ ide o rozpoznávanie emócií, noviny to komentujú „Okrem svojich komerčných účelov, ktoré nie sú zamerané na bezpečnosť, niektorí výskumníci, firmy a vládne agentúry navrhujú použiť rozpoznávanie emócií na identifikáciu bezpečnostných hrozieb v preplnených verejných priestoroch“.

Vo všeobecnosti sa zdá, že zistenia ukazujú, že Čína má v porovnaní s celosvetovým priemerom nadpriemerný záujem o výskum počítačového videnia.

Autori uzatvárajú:

„[Podiel] počítačového videnia a vizuálneho sledovania z Číny sa časom zvýšil. Spojené štáty americké spolu so svojimi spojencami a partnermi zverejnili v týchto oblastiach podobné množstvo výskumov, aké publikovala samotná Čína. Podiel týchto ostatných regiónov na výskume globálneho dohľadu bol však stabilný alebo klesal, zatiaľ čo podiel Číny rástol.“

 

*Odvážne zdôraznenie autorov príspevku.

Prvýkrát uverejnené 6. januára 2022.