Dohled
CSET: Čína vede svět ve výzkumu počítačového vidění pro dohled

Nová zpráva ze Center for Security and Emerging Technology (CSET) zjistila, že výzkumný sektor Číny produkuje ‘nepoměrnou část’ výzkumu tří základních technologií souvisejících s umělou inteligencí pro dohled, a že obecnější příspěvek Číny k technologiím počítačového vidění roste stejnou rychlostí a výrazně překonává západní tempo publikací.

Čína má jasnou převahu ve výzkumných iniciativách do více kontroverzních sub-sektorů počítačového vidění, zejména souvisejících s dohledem. Source: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf
Tři klíčové oblasti, ve kterých Čína má obrovskou převahu, jsou identifikace osob (REID), počítání davu a detekce podvodu (tj. technologie, které mají za cíl odhalit pokusy o obcházení identifikačních technologií).
Navíc, jak je uvedeno v grafu výše, výzkumná komunita Číny publikuje výrazně vyšší procento článků o úkolech počítačového vidění zaměřených na člověka, které, podle názoru autorů, představují podpůrné technologie pro širší řešení dohledu, která využívají strojové učení. Tyto úkoly zahrnují rozpoznávání emocí, rozpoznávání obličeje a rozpoznávání akce.
Autoři komentují:
‘Tyto algoritmy jsou často používány pro benigní, komerční účely, jako je označování jednotlivců na sociálních médiích. Ale pokrok v počítačovém vidění by mohl také umožnit některým vládám používat technologie dohledu pro represivní účely.’
V méně závažném tónu autoři zjistili, že články související s vizuálním dohledem představují méně než 10 % všech výzkumů počítačového vidění provedených v období studie, a že širší část výzkumu je poměrně rovnoměrně rozložena mezi zeměmi.
Nicméně, dominance Číny je zřejmá, tvrdí výzkumníci*:
‘Výzkumníci s čínskými institucionálními afiliacemi byli odpovědní za více než jednu třetinu publikací v obou oblastech počítačového vidění a vizuálního dohledu. ‘
‘To činí Čínu daleko nejproduktivnější zemí v obou oblastech. Podíl čínských výzkumníků na globálním vizuálním dohledu roste podobnou rychlostí jako jejich podíl na výzkumu počítačového vidění.’
Nová zpráva, nazvaná Trendy ve výzkumu AI pro vizuální dohled nad populacemi, představuje aplikaci přístupů zpracování přirozeného jazyka (NLP) na dataset publikovaných článků pokrývajících roky 2015-2019, a je napsána Ashwinem Acharyou, Maxem Langenkampem a Jamesem Dunhamem.
Anglický jazykový bias
Autoři studie poznamenávají, že jejich studie se dotýká pouze anglicky psaných vědeckých článků, a že rozšíření na neanglicky psané publikace by mohlo odhalit hlubší ledovec akademických snah z Číny v těchto sektorech. Kromě toho výzkumníci věří, že doplnění dat o další informace, jako jsou patentová data, nasazení kamer a příslušné vládní politiky, by mohlo zvýšit tento statistický náskok.
Přirozeně, studie připouští, že analýza veřejně dostupných a otevřeně publikovaných článků nemůže zohlednit soukromý firemní nebo státní výzkum a klasifikovaný výzkum, ale je to použitelný index sektorové aktivity v nepřítomnosti těchto skrytých datových bodů.
Architektura a data
Autoři odvodili základní data tím, že trénovali SciREX model extrakce informací na úrovni dokumentu na datech z Papers With Code, s rámcem, který odvozuje relevanci článků identifikací odkazů na úkoly související s počítačovým viděním, a zejména na projekty a iniciativy související s dohledem.
Model byl poté aplikován na agregovanou CSET sbírku vědecké literatury obsahující více než 100 milionů jednotlivých publikací napříč šesti akademickými datovými sadami. Publikační platformy, které byly zapojeny, byly Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv a Papers With Code.
Trénovaný na Arxiv preprintrách, SciBERT klasifikátor byl poté pověřen identifikací článků o počítačovém vidění v celém korpusu.
Fakt, že SciREX a SciBERT jsou trénovány na anglicky psaných dokumentech, zabránil výzkumníkům v rozšíření dosahu studie za hranice angličtiny. K tomu autoři komentují: ‘To znamená, že v národních srovnáních podceňuje neanglický výstup výzkumu a zejména pravděpodobně podceňuje Čínu podíl na světovém výzkumu.’
Zjištění
V sektoru vizuálního dohledu studie zjistila, že rozpoznávání obličeje bylo nejčastěji se opakujícím úkolem, který se objevil v více než tisících článcích pro rok 2019. Nicméně, autoři poznamenávají, že počítání davu a rozpoznávání podvodu jsou ‘rychle rostoucí’ oblasti výzkumu.

Z článku, nejčastěji se opakující úkoly identifikované pro studované roky. Cited zdroj je ‘CSET merged corpus. Results generated July 22, 2021’
Autoři článku se domnívají, že i zdánlivě ‘neutrální’ a méně politicky závažné výzkumné úsilí v oblasti počítačového vidění souvisejícího s dohledem může také přispět k represivním kontrolním systémům. Pro ‘rozpoznávání akce’ poznamenávají, že toto lze použít k identifikaci ‘abnormálního chování’ v přeplněných veřejných prostorech; pro rozpoznávání podvodu komentují ‘Zatímco někdy použité v biometrických systémech přihlášení nebo k prevenci podvodu, může také zabránit novinářům a aktivistům skrýt svou identitu’; a pokud jde o rozpoznávání emocí, článek komentuje, že ‘Kromě jeho nebezpečných a komerčních účelů, někteří výzkumníci, firmy a vládní agentury navrhují aplikovat rozpoznávání emocí k identifikaci bezpečnostních hrozeb v přeplněných veřejných prostorech’.
Obecně, zjištění se zdají ukazovat, že Čína je nadprůměrně intéressována o výzkum počítačového vidění ve srovnání se světovým průměrem.

Autoři závěrem říkají:
‘[Čína] podíl na počítačovém vidění a vizuálním dohledu se zvýšil over time. Spojené státy, spolu se svými spojenci a partnery, publikovaly podobné množství výzkumu v těchto oblastech jako Čína publikovala sama. Nicméně, podíl těchto ostatních regionů na globálním výzkumu dohledu byl stabilní nebo klesal, zatímco Čína rostla.’
*Autoři článku kladou důraz.
Poprvé publikováno 6. ledna 2022.












