Surveillance

Détermination de l'étendue de la vidéosurveillance à l'aide des données de Google Street View

Publié 12 mai 2021

Le kit de préparation mis à jour le 9 juillet, 2021

Martin Anderson

La couverture continue des rues du monde par Google Street View représente probablement l'enregistrement visuel le plus complet, le plus cohérent et le plus cohérent de la société mondiale, à l'exception des pays qui imposer des interdictions sur les véhicules mobiles de collecte de données du géant de la recherche.

En tant que contributeur financier à l'infrastructure de Google Maps, le panoptique Google Street View constitue une mine de données pour l'analyse par apprentissage automatique. Outre sa propension à détecter involontairement des actes criminels, il a été utilisé pour estimer le revenu régional de la qualité des voitures dans les images Google Street View, évaluer la verdure en milieu urbain, identifier les poteaux électriques, classer les bâtiments et estimation la composition démographique des quartiers américains, parmi de nombreuses autres initiatives.

Statistiques limitées sur la diffusion des caméras de surveillance aux États-Unis

Malgré l'utilisation généralisée des données de Google Maps pour des initiatives d'apprentissage automatique socialement responsables, il existe très peu d'ensembles de données basés sur Street View qui incluent des exemples étiquetés de caméras de surveillance. Jeu de données Mapillary Vistas fait partie du petit nombre disponible qui offre cette fonctionnalité, bien qu'il comprenne moins de 20 caméras vidéo publiques étiquetées aux États-Unis.

Une grande partie de l'infrastructure de vidéosurveillance aux États-Unis ne croise l'État que lorsque les autorités exigent des images corroborantes après des incidents locaux qui ont pu être enregistrés. Au-delà des réglementations de zonage et dans le contexte de lois permissives sur la protection de la vie privée qui ne traitent guère de la surveillance privée des espaces publics, il existe pas de cadre administratif fédéral qui peuvent fournir des statistiques précises sur le nombre de caméras orientées vers le public aux États-Unis.

Des données anecdotiques et des enquêtes limitées soutiennent que la diffusion des caméras vidéo aux États-Unis pourrait être à égalité avec la Chine, mais ce n’est pas facile à prouver.

Identification des caméras vidéo dans les images Google Street View

Compte tenu de ce manque de données disponibles, des chercheurs de l'université de Stanford ont a mené une étude dans la prévalence, la fréquence et la distribution des caméras vidéo destinées au public qui peuvent être identifiées dans les images de Google Street View.

Les chercheurs ont créé un cadre de détection de caméra qui a évalué 1.6 million d'images Google Street View dans 10 grandes villes américaines et six autres grandes villes d'Asie et d'Europe.

Par ordre décroissant de densité de caméras, Boston arrive en tête de la liste des villes américaines examinées dans la recherche, avec une densité récente ou actuelle de 0.63 et un nombre total de caméras de 1,600 10,100. Malgré cela, New York a beaucoup plus de caméras (XNUMX XNUMX) dispersées sur une plus grande surface. Source : https://arxiv.org/pdf/2105.01764.pdf

Parmi les villes américaines, Boston s'est avérée avoir le plus haut densité de caméras identifiées, tandis que la ville de New York a le plus haut nombre de caméras à 10,100 21,700, réparties sur une plus grande distance. En Asie, Tokyo compte environ 13,900 13,000 caméras estimées, mais Séoul a un plus petit nombre de caméras (13,00 XNUMX) concentrées de manière beaucoup plus dense. Bien que XNUMX XNUMX caméras aient été identifiées pour les images Street View de Londres, Paris bat ce chiffre à la fois en termes d'emplacements identifiés (XNUMX XNUMX) et de densité de couverture.

Les chercheurs observent que la densité des caméras varie considérablement entre les quartiers et les zones des villes.

Parmi les autres facteurs limitant la précision de l'enquête (sur lesquels nous reviendrons), les chercheurs observent que les caméras dans les zones résidentielles sont trois fois plus difficiles à identifier que celles placées dans les parcs publics, les zones industrielles et les zones à usage mixte – probablement parce que l'effet « dissuasif » est de plus en plus répréhensible ou controversé dans les zones résidentielles, ce qui rend les placements camouflés ou discrets plus probables.

Si l'on considère les villes étudiées en Europe et en Asie, Séoul occupe la première place de l'environnement urbain le plus surveillé, Paris n'étant pas loin derrière.

Densité des caméras de surveillance dans les villes des États-Unis, d'Asie et d'Europe, selon une étude de Stanford.

Lorsqu'une zone compte une majorité de résidents ethniques ou minoritaires définie par le recensement, la fréquence des placements de caméras augmente considérablement, même avec tous les facteurs atténuants pris en compte par les chercheurs de Stanford.

Selon la recherche de Stanford, la fréquence des caméras de surveillance augmente en proportion directe avec l'augmentation de la démographie des minorités dans un quartier.

L'étude a été menée sur deux périodes : 2011-2015 et 2016-2020. Bien que les données montrent une croissance constante, et parfois aberrante, du nombre de caméras de surveillance installées sur cette période de neuf ans, les chercheurs suggèrent que cette prolifération pourrait avoir atteint un « plateau temporaire ».

Méthodologie

Les chercheurs ont d'abord compilé deux jeux de données d'images Street View, dont l'un ne présentait pas de placement de caméra vidéo, et ont généré des masques de segmentation pour ces jeux. Un modèle de segmentation a été entraîné sur ces jeux de données par rapport à un jeu de données de validation (de San Francisco – voir « Facteurs limitatifs » ci-dessous).

Ensuite, le modèle de sortie a été exécuté sur des images Street View aléatoires, avec toutes les détections de caméra positives confirmées par des humains et les faux positifs supprimés.

A gauche, l'image brute de Google Street View. Ensuite, le masque de segmentation adapté. Troisièmement, une identification de caméra dérivée de manière algorithmique. À droite, un placement vérifié par l'homme.

Enfin, le cadre a calculé le champ de vision des angles de caméra impliqués afin d'estimer l'étendue de la couverture, comparée aux empreintes des bâtiments concernés et aux spécifications du réseau routier.

D'autres données contributives à cette matrice comprenaient les spécifications de construction d'OpenStreetMap et l'utilisation de cartes de recensement américaines pour s'assurer que l'étude était limitée aux limites administratives de chaque ville. De plus, le projet a utilisé les données de localisation des caméras de San Francisco à partir d'un étude par l'Electronic Frontier Foundation (EFF), avec les images Google Street View accessibles via le API statique.

Les chercheurs ont estimé la couverture en calculant le champ de vision des caméras Google Street View par rapport aux données d'OpenStreetMap.

Des facteurs limitants

Les chercheurs concèdent un certain nombre de facteurs limitants qui devraient être pris en compte lors de l'examen des résultats.

Premièrement, que les caméras identifiées par le système d'apprentissage automatique ont toutes été vérifiées ou annulées par la suite par un examen humain, et que cet examen est un processus faillible.

Deuxièmement, l'étude était limitée par la résolution disponible des images Street View, ce qui a limité les chercheurs à l'identification des caméras placées à moins de trente mètres du point de vue. Cela signifie non seulement que certaines caméras ont pu être « inventées » grâce à une résolution limitée, mais aussi que de nombreuses caméras extérieures à ce champ (comme les caméras en hauteur, les emplacements cachés et les micro-caméras intégrées aux sonnettes) n'ont probablement pas été identifiées.

Enfin, l'estimation du rappel du modèle spécifique à la ville peut être un facteur limitant dans l'exactitude des résultats, puisque la ville de San Francisco, où la fréquence des caméras de surveillance avait déjà été étiquetée dans des travaux antérieurs de l'EFF, a été appliquée à d'autres juridictions pour rendre le étude faisable.

Martin Anderson

Rédacteur en apprentissage automatique, spécialiste du domaine de la synthèse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.
Site personnel : martinanderson.ai
Contact [email protected]
Twitter : @manders_ai

Unite.AI

Détermination de l'étendue de la vidéosurveillance à l'aide des données de Google Street View

Statistiques limitées sur la diffusion des caméras de surveillance aux États-Unis

Identification des caméras vidéo dans les images Google Street View

Méthodologie

Des facteurs limitants

Tu peux aimer