toco Determinando a extensão da vigilância por vídeo por meio dos dados do Google Street View - Unite.AI
Entre em contato

Vigilância

Determinando a extensão da vigilância por vídeo por meio dos dados do Google Street View

mm
Atualização do on

A cobertura contínua do Google Street View das ruas do mundo representa possivelmente o registro visual mais completo, consistente e coerente da sociedade global, com exceção dos países que impor proibições nos veículos itinerantes de coleta de dados do gigante das buscas.

Como contribuidor de geração de receita para a infraestrutura do Google Maps, o panóptico do Google Street View é um rico conjunto de dados para análise de aprendizado de máquina. Além de sua propensão para capturar involuntariamente atos criminosos, tem sido usado para estimar renda regional da qualidade do carro nas imagens do Google Street View, avaliar vegetação em ambientes urbanos, identificar postes de utilidade, classificar edifícios e estimativa a composição demográfica dos bairros americanos, entre muitas outras iniciativas.

Estatísticas limitadas sobre a difusão de câmeras de vigilância nos Estados Unidos

Apesar do amplo uso dos dados do Google Maps para iniciativas de aprendizado de máquina socialmente conscientes, há muito poucos conjuntos de dados baseados no Street View que incluem exemplos rotulados de câmeras de vigilância. O Conjunto de dados Mapillary Vistas está entre o pequeno número disponível que oferece essa funcionalidade, embora inclua menos de 20 câmeras de vídeo públicas rotuladas nos Estados Unidos.

Grande parte da infra-estrutura de vigilância por vídeo nos EUA só cruza o estado quando as autoridades exigem imagens corroborantes após incidentes locais que podem ter sido gravados. Além dos regulamentos de zoneamento e no contexto de leis de privacidade permissivas que pouco fazem para abordar a vigilância privada de espaços públicos, há sem estrutura administrativa federal que podem fornecer estatísticas concretas sobre o número de câmeras voltadas para o público nos EUA.

Dados anedóticos e pesquisas limitadas afirmam que a difusão de câmeras de vídeo nos EUA pode ser em pé de igualdade com a China, mas não é fácil provar.

Identificando câmeras de vídeo nas imagens do Google Street View

Considerando essa escassez de dados disponíveis, pesquisadores da Universidade de Stanford realizou um estudo na prevalência, frequência e distribuição das câmeras de vídeo voltadas para o público que podem ser identificadas nas imagens do Google Street View.

Os pesquisadores criaram uma estrutura de detecção de câmera que avaliou 1.6 milhão de imagens do Google Street View em 10 grandes cidades dos EUA e outras seis grandes cidades na Ásia e na Europa.

Em ordem decrescente de densidade de câmeras, Boston encabeça a lista de cidades dos EUA examinadas na pesquisa, com uma densidade recente ou atual de 0.63 e um número total de câmeras de 1,600. Apesar disso, a cidade de Nova York tem muito mais câmeras (10,100) espalhadas por uma área maior. Fonte: https://arxiv.org/pdf/2105.01764.pdf

Em ordem decrescente de densidade de câmeras, Boston encabeça a lista de cidades dos EUA examinadas na pesquisa, com uma densidade recente ou atual de 0.63 e um número total de câmeras de 1,600. Apesar disso, a cidade de Nova York tem muito mais câmeras (10,100) espalhadas por uma área maior. Fonte: https://arxiv.org/pdf/2105.01764.pdf

Das cidades dos Estados Unidos, Boston foi considerada a de maior densidade de câmeras identificadas, enquanto a cidade de Nova York tem o maior número de câmeras em 10,100, espalhadas por uma distância maior. Na Ásia, Tóquio tem 21,700 câmeras estimadas, mas Seul tem um número menor de câmeras (13,900) concentradas de forma muito mais densa. Embora 13,000 câmeras tenham sido identificadas para imagens do Street View de Londres, Paris supera isso em termos de posicionamentos identificados (13,00) e densidade de cobertura.

Os pesquisadores observam que a densidade das câmeras varia muito entre os bairros e zonas das cidades.

Densidade de câmeras de vigilância em cidades dos EUA, de acordo com pesquisa de Stanford em 2021

Entre outros fatores limitantes para a precisão da pesquisa (aos quais chegaremos), os pesquisadores observam que as câmeras em áreas residenciais são três vezes mais difíceis de identificar do que aquelas colocadas em parques públicos, áreas industriais e zonas de uso misto – presumivelmente porque o efeito 'dissuasivo' é cada vez mais censurável ou controverso em zonas residenciais, tornando mais prováveis ​​as colocações camufladas ou discretas.

Levando em consideração as cidades estudadas na Europa e na Ásia, Seul ocupa o primeiro lugar como o ambiente urbano mais vigiado, com Paris não muito atrás.

Densidade de câmeras de vigilância em cidades nos EUA, Ásia e Europa, de acordo com a pesquisa de Stanford.

Onde uma zona tem uma maioria de residentes étnicos ou minoritários definidos pelo censo, a frequência de colocação de câmeras aumenta notavelmente, mesmo com todos os fatores atenuantes levados em consideração pelos pesquisadores de Stanford.

A frequência das câmeras de vigilância aumenta em proporção direta ao aumento da demografia minoritária em um bairro, de acordo com a pesquisa de Stanford.

A frequência das câmeras de vigilância aumenta em proporção direta ao aumento da demografia minoritária em um bairro, de acordo com a pesquisa de Stanford.

A pesquisa foi realizada em dois períodos de tempo, 2011-2015 e 2016-2020. Embora os dados mostrem um crescimento consistente e às vezes aberrante da colocação de câmeras de vigilância ao longo do período de nove anos, os pesquisadores sugerem que essa proliferação de câmeras de vigilância pode ter atingido um 'platô temporário'.

Metodologia

Os pesquisadores inicialmente compilaram dois conjuntos de dados das imagens do Street View, um dos quais não apresentava posicionamentos de câmeras de vídeo, e geraram máscaras de segmentação para eles. Um modelo de segmentação foi treinado nesses conjuntos de dados em relação a um conjunto de dados de validação (de São Francisco – consulte 'Fatores limitantes' abaixo).

Em seguida, o modelo de saída foi executado em imagens aleatórias do Street View, com todas as detecções positivas de câmeras confirmadas por humanos e os falsos positivos removidos.

À esquerda, a imagem bruta do Google Street View. Em seguida, a máscara de segmentação adaptada. Em terceiro lugar, uma identificação de câmera derivada de algoritmos. Certo, uma veiculação verificada por humanos.

À esquerda, a imagem bruta do Google Street View. Em seguida, a máscara de segmentação adaptada. Em terceiro lugar, uma identificação de câmera derivada de algoritmos. Certo, uma veiculação verificada por humanos.

Por fim, o framework calculou o campo de visão dos ângulos de câmera envolvidos para estimar a extensão da cobertura, comparando com as pegadas dos edifícios envolvidos e as especificações da rede viária.

Outros dados que contribuíram para esta matriz incluíram especificações de construção do OpenStreetMap e o uso de mapas do censo dos EUA para garantir que o estudo fosse restrito aos limites administrativos de cada cidade. Além disso, o projeto usou dados de localização de câmeras de San Francisco de um estudo pela Electronic Frontier Foundation (EFF), com as imagens do Google Street View acessadas pelo API estática.

Os pesquisadores estimaram a cobertura calculando o campo de visão das câmeras do Google Street View em relação aos dados do OpenStreetMap.

Os pesquisadores estimaram a cobertura calculando o campo de visão das câmeras do Google Street View em relação aos dados do OpenStreetMap.

Fatores limitantes

Os pesquisadores admitem uma série de fatores limitantes que devem ser considerados ao revisar os resultados.

Em primeiro lugar, que as câmeras identificadas pelo sistema de aprendizado de máquina foram todas posteriormente verificadas ou negadas por revisão humana e que essa revisão é um processo falível.

Em segundo lugar, o estudo foi limitado pela resolução disponível das imagens do Street View, o que restringiu os pesquisadores a identificar as câmeras colocadas a trinta metros do POV. Isso não significa apenas que algumas câmeras podem ter sido 'inventadas' por meio de resolução limitada, mas também que muitas fora desse alcance (como câmeras de alto nível, posicionamentos obscuros e microcâmeras em acessórios de campainha) provavelmente não foram identificadas.

Por fim, estimar a recordação do modelo específico da cidade pode ser um fator limitante na precisão dos resultados, uma vez que a cidade de São Francisco, onde a frequência das câmeras de vigilância já havia sido rotulada em trabalhos anteriores da EFF, foi aplicada a outras jurisdições para fazer o estudo viável.