заглушки CSET: Китай лидирует в исследованиях компьютерного зрения - Unite.AI
Свяжитесь с нами:

наблюдение

CSET: Китай лидирует в исследованиях компьютерного зрения

mm

опубликованный

 on

В новом отчете Центра безопасности и новых технологий (CSET) говорится, что исследовательский сектор Китая производит «непропорционально большую долю» исследований по трем основным технологиям наблюдения, связанным с искусственным интеллектом, и что более общий вклад КПК в технологии компьютерного зрения растет. такими же темпами, заметно обгоняя западные темпы публикаций.

Явное лидерство Китая в исследовательских инициативах в более противоречивых подсекторах исследований в области компьютерного зрения, в основном связанных с наблюдением. Источник: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf.

Явное лидерство Китая в исследовательских инициативах в более противоречивых подсекторах исследований в области компьютерного зрения, в основном связанных с наблюдением. Источник: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf.

Три ключевые области, в которых Китай лидирует, — это повторная идентификация личности (REID), подсчет толпы и обнаружение спуфинга (т. е. технологий, направленных на выявление попыток подрыва технологий идентификации).

Кроме того, как показано на графике выше, исследовательское сообщество Китая публикует заметно более высокий процент статей по задачам компьютерного зрения, с которыми сталкивается человек, которые, как утверждается в документе, представляют собой вспомогательные технологии для более широких решений наблюдения, использующих машинное обучение. Эти задачи включают распознавание эмоций, распознавание лиц и распознавание действий.

Авторы комментируют:

«Эти алгоритмы часто применяются в безобидных коммерческих целях, например, для пометки людей на фотографиях в социальных сетях. Но прогресс в области компьютерного зрения также может позволить некоторым правительствам использовать технологии наблюдения в репрессивных целях».

С другой стороны, авторы обнаружили, что работы, связанные с визуальным наблюдением, составляют менее 10% всех исследований компьютерного зрения, проведенных за исследуемый период, и что более широкий транш исследований довольно равномерно распределен по странам.

Однако доминирование Китая очевидно, считают исследователи*:

«Исследователи, связанные с китайскими институтами, написали более трети публикаций как по компьютерному зрению, так и по исследованиям в области визуального наблюдения.

«Это делает Китай, безусловно, самой плодовитой страной в обеих областях. Доля китайских исследователей в глобальных исследованиях визуального наблюдения растет такими же темпами, как и их доля в исследованиях компьютерного зрения».

Новый отчету, Под названием Тенденции в исследованиях ИИ для визуального наблюдения за населением, представляет собой применение подходов обработки естественного языка (NLP) к набору данных опубликованных статей, охватывающих 2015–2019 годы, и написано Эшвином Ачарья, Максом Лангенкампом и Джеймсом Данэмом.

Предвзятость английского языка

Авторы статьи отмечают, что их исследование касается только научных работ на английском языке, и что распространение его на неанглоязычные публикации может выявить более глубокий айсберг академических усилий Китая в этих секторах. Кроме того, исследователи считают, что дополнение данных вспомогательной информацией, такой как данные о патентах, развертывание камер и соответствующая политика правительства, может увеличить это статистическое опережение.

Естественно, газета допускает, что анализ публичных и открытых статей не может учитывать частные корпоративные или государственные исследования, а также секретные исследования, но является рабочим индексом отраслевой активности в отсутствие этих скрытых точек данных.

Архитектура и данные

Авторы получили основные данные путем обучения СайРЕКС модель извлечения информации на уровне документа на основе данных из Papers With Code с платформой, определяющей релевантность документов путем определения ссылок на задачи, связанные с компьютерным зрением, и, в частности, на проекты и инициативы, ориентированные на наблюдение.

Затем модель была применена к объединенному массиву научной литературы CSET, содержащему более 100 миллионов отдельных публикаций в шести академических наборах данных. В качестве издательских платформ использовались Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv и Papers With Code.

Обучался на препринтах Arxiv, СциБЕРТ Затем классификатору было поручено идентифицировать документы компьютерного зрения по всему корпусу.

Тот факт, что SciREX и SciBERT обучаются на документах на английском языке, помешал исследователям расширить охват исследования за пределы английского языка. По этому поводу исследователи комментируют: «Это означает, что в национальных сравнениях он недооценивает неанглоязычные результаты исследований, и, в частности, он, вероятно, недооценивает долю Китая в мировых исследованиях».

Результаты

Исследование показало, что в секторе визуального наблюдения распознавание лиц было наиболее часто повторяющейся задачей, появившейся в более чем тысяче статей за 2019 год. Однако авторы отмечают, что подсчет толпы и распознавание лиц являются «быстрорастущими» областями. преследования.

Из статьи наиболее часто повторяющиеся задачи выделены за изучаемые годы. Цитируемый источник: «Объединенный корпус CSET. Результаты получены 22 июля 2021 г.

Из статьи наиболее часто повторяющиеся задачи выделены за изучаемые годы. Цитируемый источник «Объединенный корпус CSET. Результаты получены 22 июля 2021 г.

Авторы статьи считают, что даже внешне более «нейтральные» и менее политически подстрекательские занятия компьютерным зрением, связанные со слежкой, также могут способствовать репрессивным системам контроля. Что касается «распознавания действий», они отмечают, что это можно использовать для выявления «аномального поведения» в людных общественных местах; за подделку лица они комментируют «Хотя он иногда используется в системах биометрического входа или для предотвращения мошенничества, он также может помешать журналистам и активистам скрыть свою личность».; а что касается распознавания эмоций, в документе отмечается, что «В дополнение к его коммерческим целям, не связанным с безопасностью, некоторые исследователи, фирмы и государственные учреждения предлагают применять распознавание эмоций для выявления угроз безопасности в людных общественных местах»..

В целом результаты показывают, что интерес Китая к исследованиям в области компьютерного зрения выше среднего по сравнению со средним мировым показателем.

Авторы заключают:

«[Доля] как компьютерного зрения, так и визуального наблюдения из Китая со временем увеличивалась. Соединенные Штаты вместе со своими союзниками и партнерами опубликовали столько же исследований в этих областях, сколько Китай опубликовал в одиночку. Однако доля этих других регионов в исследованиях глобального эпиднадзора оставалась стабильной или снижалась, в то время как доля Китая росла».

 

*Выделение авторов статьи жирным шрифтом.

Впервые опубликовано 6 января 2022 г.