talón Determinación del alcance de la videovigilancia a través de los datos de Google Street View - Unite.AI
Contáctanos

Vigilancia

Determinación del alcance de la videovigilancia a través de los datos de Google Street View

mm
Actualizado on

La cobertura continua de Google Street View de las calles del mundo representa posiblemente el registro visual más completo, consistente y coherente de la sociedad global, con la excepción de los países que imponer prohibiciones en los vehículos itinerantes de recopilación de datos del gigante de las búsquedas.

Como contribuyente a la generación de ingresos de la infraestructura de Google Maps, el panóptico de Google Street View es una rica fuente de datos para el análisis de aprendizaje automático. Además de su propensión a capturar involuntariamente actos delictivos, se ha utilizado para estimar el ingreso regional de la calidad del coche en las imágenes de Google Street View, evaluar zonas verdes en entornos urbanos, identificar postes de servicios públicos, clasificar edificios y estimación la composición demográfica de los barrios estadounidenses, entre muchas otras iniciativas.

Estadísticas limitadas sobre la difusión de cámaras de vigilancia en los Estados Unidos

A pesar del amplio uso de los datos de Google Maps para iniciativas de aprendizaje automático con conciencia social, hay muy pocos conjuntos de datos basados ​​en Street View que incluyan ejemplos etiquetados de cámaras de vigilancia. El Conjunto de datos Mapillary Vistas se encuentra entre el pequeño número disponible que ofrece esta funcionalidad, aunque incluye menos de 20 cámaras de video públicas etiquetadas en los Estados Unidos.

Gran parte de la infraestructura de videovigilancia en los EE. UU. solo se cruza con el estado cuando las autoridades exigen imágenes corroborantes después de incidentes locales que pueden haber sido grabados. Más allá de las regulaciones de zonificación, y en el contexto de leyes de privacidad permisivas que hacen poco para abordar la vigilancia privada de espacios públicos, existe sin marco administrativo federal que puede proporcionar estadísticas concretas sobre la cantidad de cámaras orientadas al público en los EE. UU.

Los datos anecdóticos y las encuestas limitadas sostienen que la difusión de las cámaras de video en los EE. UU. puede ser a la par de china, pero no es fácil de probar.

Identificación de cámaras de video en imágenes de Google Street View

Teniendo en cuenta este déficit en los datos disponibles, los investigadores de la Universidad de Stanford han llevó a cabo un estudio en la prevalencia, frecuencia y distribución de las cámaras de video orientadas al público que se pueden identificar en las imágenes de Google Street View.

Los investigadores crearon un marco de detección de cámaras que evaluó 1.6 millones de imágenes de Google Street View en 10 ciudades importantes de EE. UU. y otras seis ciudades importantes de Asia y Europa.

En orden descendente de densidad de cámaras, Boston encabeza la lista de ciudades estadounidenses examinadas en la investigación, con una densidad reciente o actual de 0.63 y un número total de cámaras de 1,600. A pesar de esto, la ciudad de Nueva York tiene muchas más cámaras (10,100 2105.01764) dispersas en un área mayor. Fuente: https://arxiv.org/pdf/XNUMX.pdf

En orden descendente de densidad de cámaras, Boston encabeza la lista de ciudades estadounidenses examinadas en la investigación, con una densidad reciente o actual de 0.63 y un número total de cámaras de 1,600. A pesar de esto, la ciudad de Nueva York tiene muchas más cámaras (10,100 XNUMX) dispersas en un área mayor. Fuente: https://arxiv.org/pdf/2105.01764.pdf

De las ciudades de EE. UU., se descubrió que Boston tiene la mayor densidad de cámaras identificadas, mientras que la ciudad de Nueva York tiene la mayor número de cámaras a 10,100, repartidas en una distancia mayor. En Asia, Tokio tiene unas 21,700 cámaras estimadas masivas, pero Seúl tiene una cantidad menor de cámaras (13,900) concentradas mucho más densamente. Aunque se identificaron 13,000 cámaras para las imágenes de Street View de Londres, París supera esto tanto en términos de ubicaciones identificadas (13,00) como en densidad de cobertura.

Los investigadores observan que la densidad de cámaras varía mucho entre los barrios y zonas de las ciudades.

Densidad de cámaras de vigilancia en ciudades de EE. UU., según una investigación de Stanford en 2021

Entre otros factores limitantes para la precisión de la encuesta (a la que llegaremos), los investigadores observaron que las cámaras en áreas residenciales son tres veces más difíciles de identificar que las ubicadas en parques públicos, áreas industriales y zonas de uso mixto, presumiblemente porque el efecto 'disuasorio' es cada vez más objetable o controvertido en las zonas residenciales, lo que hace más probables las ubicaciones camufladas o discretas.

Teniendo en cuenta las ciudades estudiadas en Europa y Asia, Seúl ocupa el primer lugar como el entorno urbano más vigilado, con París no muy lejos.

Densidad de cámaras de vigilancia en ciudades de EE. UU., Asia y Europa, según una investigación de Stanford.

Cuando una zona tiene una mayoría definida por el censo de residentes étnicos o minoritarios, la frecuencia de colocación de cámaras aumenta notablemente, incluso con todos los factores atenuantes tomados en cuenta por los investigadores de Stanford.

La frecuencia de las cámaras de vigilancia aumenta en proporción directa al aumento de la demografía de las minorías en un vecindario, según la investigación de Stanford.

La frecuencia de las cámaras de vigilancia aumenta en proporción directa al aumento de la demografía de las minorías en un vecindario, según la investigación de Stanford.

La investigación se llevó a cabo en dos períodos de tiempo, 2011-2015 y 2016-2020. Aunque los datos muestran un crecimiento constante y, a veces, anómalo de la colocación de cámaras de vigilancia durante el período de nueve años, los investigadores sugieren que esta proliferación de cámaras de vigilancia puede haber alcanzado una "meseta temporal".

Metodología

Los investigadores compilaron inicialmente dos conjuntos de datos de las imágenes de Street View, uno de los cuales no presentaba ubicaciones de cámaras de video, y generaron máscaras de segmentación para estos. Se entrenó un modelo de segmentación en estos conjuntos de datos contra un conjunto de datos de validación (de San Francisco; consulte 'Factores limitantes' a continuación).

Luego, el modelo de salida se ejecutó con imágenes aleatorias de Street View, con todas las detecciones positivas de la cámara confirmadas por humanos y se eliminaron los falsos positivos.

A la izquierda, la imagen sin procesar de Google Street View. A continuación, la máscara de segmentación adaptada. En tercer lugar, una identificación de cámara derivada algorítmicamente. Correcto, una ubicación verificada por humanos.

A la izquierda, la imagen sin procesar de Google Street View. A continuación, la máscara de segmentación adaptada. En tercer lugar, una identificación de cámara derivada algorítmicamente. Correcto, una ubicación verificada por humanos.

Por último, el marco calculó el campo de visión de los ángulos de cámara involucrados para estimar el alcance de la cobertura, comparándolo con las huellas de los edificios involucrados y las especificaciones de la red vial.

Otros datos que contribuyeron a esta matriz incluyeron las especificaciones de construcción de OpenStreetMap y el uso de mapas del censo de EE. UU. para garantizar que el estudio se limitara a los límites administrativos de cada ciudad. Además, el proyecto utilizó datos de ubicación de cámaras de San Francisco de un estudio por la Electronic Frontier Foundation (EFF), con las imágenes de Google Street View a las que se accede a través del API estática.

Los investigadores estimaron la cobertura calculando el campo de visión de las cámaras de Google Street View contra los datos de OpenStreetMap.

Los investigadores estimaron la cobertura calculando el campo de visión de las cámaras de Google Street View contra los datos de OpenStreetMap.

Factores limitantes

Los investigadores reconocen una serie de factores limitantes que deben tenerse en cuenta al revisar los resultados.

En primer lugar, que las cámaras identificadas por el sistema de aprendizaje automático fueron posteriormente verificadas o negadas por revisión humana, y que esta revisión es un proceso falible.

En segundo lugar, el estudio estuvo limitado por la resolución disponible de las imágenes de Street View, lo que restringió a los investigadores a identificar las cámaras ubicadas dentro de los treinta metros de POV. Esto no solo significa que algunas cámaras pueden haber sido 'inventadas' a través de una resolución limitada, sino también que muchas fuera de este ámbito (como cámaras de alto nivel, ubicaciones ocultas y microcámaras en los accesorios del timbre) probablemente no hayan sido identificadas.

Finalmente, estimar el recuerdo del modelo específico de la ciudad puede ser un factor limitante en la precisión de los resultados, ya que la ciudad de San Francisco, donde la frecuencia de las cámaras de vigilancia ya se había etiquetado en un trabajo anterior de la EFF, se aplicó a otras jurisdicciones para hacer la estudio factible.