Vigilancia

CSET: China lidera el mundo en investigación de vigilancia de visión por computadora

Published January 6, 2022

Updated April 28, 2026

Martin Anderson

Un nuevo informe del Centro para la Seguridad y la Tecnología Emergente (CSET) ha encontrado que el sector de investigación de China produce ‘una parte desproporcionada’ de investigación en tres tecnologías de vigilancia relacionadas con la inteligencia artificial, y que la contribución más general del PCCh a las tecnologías de visión por computadora está creciendo a la misma tasa, y notablemente superando las tasas de publicación occidentales.

La clara ventaja de China en iniciativas de investigación en subsectores más controvertidos de la investigación de visión por computadora, principalmente relacionados con la vigilancia. Fuente: https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf

Las tres áreas clave en las que China tiene una gran ventaja son la reidentificación de personas (REID), el recuento de multitudes y la detección de suplantación (es decir, tecnologías que apuntan a exponer intentos de subvertir tecnologías de identificación).

Además, como se indica en el gráfico anterior, la comunidad de investigación de China publica un porcentaje notablemente más alto de artículos sobre tareas de visión por computadora orientadas a humanos, que, según el documento, representan tecnologías de apoyo para soluciones de vigilancia más amplias que utilizan aprendizaje automático. Estas tareas incluyen el reconocimiento de emociones, el reconocimiento de rostros y el reconocimiento de acciones.

Los autores comentan:

‘Estos algoritmos a menudo se aplican para usos benignos, comerciales, como etiquetar a individuos en fotos de redes sociales. Pero el progreso en la visión por computadora también podría empoderar a algunos gobiernos para utilizar tecnología de vigilancia para fines represivos.’

En una nota menos siniestra, los autores han encontrado que los artículos relacionados con la vigilancia visual representan menos del 10% de toda la investigación de visión por computadora realizada en el período de estudio, y que la investigación más amplia está bastante distribuida entre países.

Sin embargo, la dominancia de China es clara, sostienen los investigadores*:

‘Los investigadores con afiliaciones institucionales chinas fueron responsables de más de un tercio de las publicaciones en investigación de visión por computadora y vigilancia visual.

‘Esto hace que China sea de lejos el país más prolífico en ambas áreas. La participación de los investigadores chinos en la investigación de vigilancia visual a nivel mundial está creciendo a una tasa similar a su participación en la investigación de visión por computadora.’

El nuevo informe, titulado Tendencias en la investigación de IA para la vigilancia visual de poblaciones, representa la aplicación de enfoques de Procesamiento de Lenguaje Natural (NLP) a un conjunto de datos de artículos publicados que cubren los años 2015-2019, y está escrito por Ashwin Acharya, Max Langenkamp y James Dunham.

Sesgo del idioma inglés

Los autores del documento observan que su estudio solo toca artículos científicos en inglés, y que extenderlo a publicaciones no angloparlantes podría revelar un iceberg más profundo de esfuerzo académico de China en estos sectores. Además, los investigadores creen que aumentar los datos con información auxiliar, como datos de patentes, despliegue de cámaras y políticas gubernamentales pertinentes, podría aumentar esta ventaja estadística.

Naturalmente, el documento concede que analizar artículos públicos y abiertamente publicados no puede dar cuenta de la investigación privada corporativa o estatal, y la investigación clasificada, pero es un índice viable de la actividad del sector en ausencia de estos puntos de datos ocultos.

Arquitectura y datos

Los autores derivaron los datos básicos mediante el entrenamiento de un modelo de extracción de información a nivel de documento SciREX en datos de Papers With Code, con el marco que deriva la relevancia de los artículos identificando referencias a tareas relacionadas con la visión por computadora, y particularmente a proyectos y iniciativas centrados en la vigilancia.

El modelo se aplicó entonces a un cuerpo de literatura académica agregada de CSET que contiene más de 100 millones de publicaciones individuales en seis conjuntos de datos académicos. Las plataformas de publicación involucradas fueron Dimensions, Web of Science, Microsoft Academic Graph, China National Knowledge Infrastructure, arXiv y Papers With Code.

Entrenado en preimpresos de Arxiv, un SciBERT clasificador se encargó de identificar artículos de visión por computadora en todo el corpus.

El hecho de que SciREX y SciBERT estén entrenados en documentos en inglés impidió que los investigadores extendieran el alcance del estudio más allá del inglés. De esto, los investigadores comentan: ‘Esto significa que en comparaciones nacionales subestima la producción de investigación no inglesa, y en particular probablemente subrepresenta la participación de China en la investigación mundial.’

Hallazgos

Dentro del sector de vigilancia visual, el estudio encuentra que el reconocimiento de rostros fue la tarea más recurrente, apareciendo en más de mil artículos para el año 2019. Sin embargo, los autores señalan que el recuento de multitudes y el reconocimiento de suplantación de rostros son ‘campos de búsqueda en rápido crecimiento’.

Del documento, las tareas más frecuentemente recurrentes identificadas para los años estudiados. Fuente citada es ‘CSET merged corpus. Results generated July 22, 2021’

Los autores del documento consideran que incluso las aparentemente más ‘neutras’ y menos políticamente incendiarias persecuciones de visión por computadora relacionadas con la vigilancia también pueden contribuir a sistemas de control represivo. Para ‘Reconocimiento de acciones’, observan que esto se puede utilizar para identificar ‘comportamiento anormal’ en espacios públicos concurridos; para el reconocimiento de suplantación de rostros, comentan ‘Aunque a veces se utiliza en sistemas de inicio de sesión biométrico o para prevenir el fraude, también puede evitar que periodistas y activistas oculten su identidad’; y con respecto al reconocimiento de emociones, el documento comenta que ‘Además de sus propósitos no orientados a la seguridad y comerciales, algunos investigadores, empresas y agencias gubernamentales proponen aplicar el reconocimiento de emociones para identificar amenazas de seguridad en áreas públicas concurridas’.

En general, los hallazgos parecen mostrar que China está por encima de la media interesada en la investigación de visión por computadora, en comparación con el promedio mundial.

Los autores concluyen:

‘[La] participación de China en la visión por computadora y la vigilancia visual aumentó con el tiempo. Estados Unidos, junto con sus aliados y socios, publicaron una cantidad similar de investigación en estas áreas que China publicó sola. Sin embargo, la participación de estas otras regiones en la investigación de vigilancia fue estable o disminuyó, mientras que la de China creció.’

*El énfasis en negrita de los autores del documento.

Publicado por primera vez el 6 de enero de 2022.