Наблюдение
CSET: Китай лидирует в исследованиях компьютерного зрения

В новом отчете Центра безопасности и новых технологий (CSET) установлено, что исследовательский сектор Китая производит «непропорционально большую долю» исследований по трем основным технологиям наблюдения, связанным с ИИ, и что более общий вклад КПК в технологии компьютерного зрения растет такими же темпами и заметно опережает западные показатели по объему публикаций.

Китай занимает явное лидерство в исследовательских инициативах в наиболее спорных подсекторах исследований компьютерного зрения, в основном связанных с наблюдением. Источник: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf.
Три ключевые области, в которых Китай лидирует, — это повторная идентификация личности (REID), подсчет толпы и обнаружение спуфинга (т. е. технологий, направленных на выявление попыток подрыва технологий идентификации).
Кроме того, как показано на графике выше, китайское исследовательское сообщество публикует заметно более высокий процент статей по задачам компьютерного зрения, ориентированным на человека. В статье утверждается, что эти технологии представляют собой вспомогательные для более широких решений в области видеонаблюдения, использующих машинное обучение. К таким задачам относятся распознавание эмоций, лиц и действий.
Авторы комментируют:
«Эти алгоритмы часто применяются в невинных коммерческих целях, например, для отметки людей на фотографиях в социальных сетях. Однако прогресс в области компьютерного зрения может также дать некоторым правительствам возможность использовать технологии слежки в репрессивных целях».
С другой стороны, авторы обнаружили, что работы, связанные с визуальным наблюдением, составляют менее 10% всех исследований компьютерного зрения, проведенных за исследуемый период, и что более широкий транш исследований довольно равномерно распределен по странам.
Однако исследователи утверждают*, что доминирование Китая очевидно:
«Исследователи, связанные с китайскими институтами, написали более трети публикаций как по компьютерному зрению, так и по исследованиям в области визуального наблюдения.
«Это делает Китай самой плодовитой страной в обеих областях. Доля китайских исследователей в глобальных исследованиях в области визуального наблюдения растёт примерно такими же темпами, как и их доля в исследованиях в области компьютерного зрения».
Новый докладе, Под названием Тенденции в исследованиях ИИ для визуального наблюдения за населением, представляет собой применение подходов обработки естественного языка (NLP) к набору данных опубликованных статей, охватывающих 2015–2019 годы, и написано Эшвином Ачарья, Максом Лангенкампом и Джеймсом Данэмом.
Предвзятость английского языка
Авторы статьи отмечают, что их исследование касается только научных работ на английском языке, и что распространение его на неанглоязычные публикации может выявить более глубокий айсберг академических усилий Китая в этих секторах. Кроме того, исследователи считают, что дополнение данных вспомогательной информацией, такой как данные о патентах, развертывание камер и соответствующая политика правительства, может увеличить это статистическое опережение.
Естественно, газета допускает, что анализ публичных и открытых статей не может учитывать частные корпоративные или государственные исследования, а также секретные исследования, но является рабочим индексом отраслевой активности в отсутствие этих скрытых точек данных.
Архитектура и данные
Авторы получили основные данные путем обучения СайРЕКС модель извлечения информации на уровне документа на основе данных из Papers With Code с платформой, определяющей релевантность документов путем определения ссылок на задачи, связанные с компьютерным зрением, и, в частности, на проекты и инициативы, ориентированные на наблюдение.
Затем модель была применена к объединенному массиву научной литературы CSET, содержащему более 100 миллионов отдельных публикаций в шести академических наборах данных. В качестве издательских платформ использовались Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv и Papers With Code.
Обучался на препринтах Arxiv, СциБЕРТ Затем классификатору было поручено идентифицировать документы компьютерного зрения по всему корпусу.
Тот факт, что SciREX и SciBERT обучаются на документах на английском языке, помешал исследователям расширить охват исследования за пределы английского языка. По этому поводу исследователи комментируют: «Это означает, что при сравнении на национальном уровне он недооценивает объем неанглоязычных научных исследований и, в частности, он, вероятно, занижает долю Китая в мировых исследованиях».
Результаты
Исследование показало, что в секторе визуального наблюдения распознавание лиц было наиболее часто встречающейся задачей, которая упоминалась в более чем тысяче статей за 2019 год. Однако авторы отмечают, что подсчет толпы и распознавание подмены лиц являются «быстрорастущими» областями исследований.

Из статьи наиболее часто повторяющиеся задачи выделены за изучаемые годы. Цитируемый источник «Объединённый корпус CSET. Результаты получены 22 июля 2021 г.»
Авторы статьи считают, что даже, казалось бы, более «нейтральные» и менее политически провокационные направления компьютерного зрения, связанные с наблюдением, также могут способствовать развитию репрессивных систем контроля. В отношении «Распознавания действий» они отмечают, что это может быть использовано для выявления «ненормального поведения» в многолюдных общественных местах; в отношении подмены лиц они комментируют: «Хотя это иногда используется в биометрических системах входа в систему или для предотвращения мошенничества, это также может помешать журналистам и активистам скрыть свою личность».; а что касается распознавания эмоций, в документе отмечается, что «Помимо коммерческих целей, не связанных с безопасностью, некоторые исследователи, компании и государственные учреждения предлагают применять распознавание эмоций для выявления угроз безопасности в многолюдных общественных местах»..
В целом результаты показывают, что интерес Китая к исследованиям в области компьютерного зрения выше среднего по сравнению со средним мировым показателем.

Авторы заключают:
«Доля как компьютерного зрения, так и визуального наблюдения, проводимого Китаем, со временем увеличивалась. Соединённые Штаты вместе со своими союзниками и партнёрами опубликовали в этих областях примерно столько же исследований, сколько Китай опубликовал в одиночку. Однако доля этих регионов в исследованиях глобального наблюдения оставалась стабильной или снижалась, в то время как доля Китая росла».
*Жирное выделение авторов статьи.
Впервые опубликовано 6 января 2022 г.












