заглушки CSET: Китай лідирує у світі в дослідженнях комп’ютерного бачення - Unite.AI
Зв'язатися з нами

Спостереження

CSET: Китай лідирує у світі в дослідженнях комп’ютерного бачення

mm

опублікований

 on

У новому звіті Центру безпеки та нових технологій (CSET) виявлено, що дослідницький сектор Китаю проводить «непропорційну частку» досліджень трьох основних технологій спостереження, пов’язаних зі штучним інтелектом, і що більш загальний внесок КПК у технології комп’ютерного бачення зростає. з тією ж швидкістю, і значно випереджаючи західні темпи публікації.

Чітке лідерство Китаю в дослідницьких ініціативах у більш суперечливих підсекторах досліджень комп’ютерного зору, головним чином пов’язаних із спостереженням. Джерело: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Чітке лідерство Китаю в дослідницьких ініціативах у більш суперечливих підсекторах досліджень комп’ютерного зору, головним чином пов’язаних із спостереженням. Джерело: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Три ключові сфери, в яких Китай має величезне лідерство, це повторна ідентифікація особи (REID), підрахунок натовпу та виявлення спуфінгу (тобто технології, спрямовані на викриття спроб підірвати технології ідентифікації).

Крім того, як показано на графіку вище, дослідницьке співтовариство Китаю публікує помітно вищий відсоток робіт про завдання комп’ютерного зору людини, які, як стверджується в статті, представляють допоміжні технології для більш широких рішень спостереження, які використовують машинне навчання. Ці завдання включають розпізнавання емоцій, розпізнавання облич і розпізнавання дій.

Автори коментують:

«Ці алгоритми часто застосовуються для доброякісних комерційних цілей, таких як позначення людей на фотографіях у соціальних мережах. Але розвиток комп’ютерного зору може також дати можливість деяким урядам використовувати технологію стеження для репресивних цілей».

На менш зловісній ноті автори виявили, що статті, пов’язані з візуальним спостереженням, становлять менше 10% усіх досліджень комп’ютерного зору, проведених у досліджуваний період, і що ширша частина досліджень досить рівномірно розподілена по країнах.

Проте домінування Китаю є очевидним, стверджують дослідники*:

«Дослідники, пов’язані з китайськими інституціями, відповідальні за більше ніж одну третину публікацій у дослідженнях комп’ютерного зору та візуального спостереження.

«Це робить Китай, безперечно, найпліднішою країною в обох сферах. Частка китайських дослідників у глобальних дослідженнях візуального спостереження зростає з такою ж швидкістю, як і їхня частка досліджень комп’ютерного зору».

Новий звітом, Під назвою Тенденції досліджень ШІ для візуального спостереження за населенням, представляє застосування підходів обробки природної мови (NLP) до набору даних опублікованих документів за 2015-2019 роки, і написаний Ашвіном Ачар’єю, Максом Лангенкампом і Джеймсом Данемом.

Упередження англійської мови

Автори статті відзначають, що їх дослідження стосується лише англомовних наукових статей, і що поширення його на неангломовні публікації може виявити глибший айсберг академічних зусиль Китаю в цих секторах. Крім того, дослідники вважають, що доповнення даних допоміжною інформацією, такою як патентні дані, розгортання камер і відповідна урядова політика, може збільшити це статистичне перевагу.

Природно, документ визнає, що аналіз публічних і відкрито опублікованих документів не може включати приватні корпоративні чи державні дослідження та секретні дослідження, але є працездатним індексом діяльності сектора за відсутності цих прихованих точок даних.

Архітектура та дані

Автори отримали основні дані шляхом навчання a SciREX модель вилучення інформації на рівні документа на основі даних із документів із кодом, де структура визначає релевантність документів шляхом ідентифікації посилань на завдання, пов’язані з комп’ютерним зором, і зокрема на проекти та ініціативи, орієнтовані на спостереження.

Потім модель було застосовано до зведеного корпусу наукової літератури CSET, що містить понад 100 мільйонів окремих публікацій у шести академічних наборах даних. Видавничими платформами були Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv і Papers With Code.

Навчався на препринтах Arxiv, a SciBERT потім класифікатору було доручено ідентифікувати документи комп’ютерного зору в корпусі.

Той факт, що SciREX і SciBERT навчаються на англомовних документах, не дозволив дослідникам розширити охоплення дослідження за межі англійської мови. Про це дослідники коментують: «Це означає, що в національних порівняннях він недооцінює результати неанглійських досліджень, і, зокрема, він, ймовірно, недооцінює частку Китаю у світових дослідженнях».

Результати

У секторі візуального спостереження дослідження виявило, що розпізнавання облич було найпоширенішим завданням, яке з’являлося в більш ніж тисячі статей за 2019 рік. Однак автори відзначають, що підрахунок натовпу та розпізнавання облич є «швидко зростаючими» сферами. переслідування.

З роботи, найбільш часто повторювані завдання, окремі для досліджуваних років. Джерело, яке цитується, — об’єднаний корпус CSET. Результати згенеровано 22 липня 2021 року

З роботи, найбільш часто повторювані завдання, окремі для досліджуваних років. Цитується джерело 'Об'єднаний корпус CSET. Результати згенеровано 22 липня 2021 року

Автори статті вважають, що навіть очевидно більш «нейтральні» та менш політично запальні заняття комп’ютерним баченням, пов’язані зі спостереженням, також можуть сприяти репресивним системам контролю. Для «розпізнавання дій» вони відзначають, що це можна використовувати для визначення «ненормальної поведінки» в людних громадських місцях; за підробку обличчя, коментують вони «Хоч іноді використовується в біометричних системах входу або для запобігання шахрайству, він також може завадити журналістам і активістам приховувати свою особу»; і що стосується розпізнавання емоцій, то в статті це коментується «На додаток до не орієнтованих на безпеку та комерційних цілей, деякі дослідники, фірми та урядові установи пропонують застосовувати розпізнавання емоцій для виявлення загроз безпеці в людних громадських місцях»..

Загалом отримані дані свідчать про те, що Китай зацікавлений у дослідженнях комп’ютерного зору вище середнього порівняно із середнім глобальним показником.

Автори роблять висновок:

«Частка як комп’ютерного зору, так і візуального спостереження з Китаю з часом зросла. Сполучені Штати разом зі своїми союзниками та партнерами опублікували стільки ж досліджень у цих сферах, скільки опублікував один Китай. Однак частка цих інших регіонів у глобальних дослідженнях епіднагляду була стабільною або знизилася, тоді як частка Китаю зростала».

 

*Жирне виділення авторів статті.

Вперше опубліковано 6 січня 2022 р.