Suivez nous sur

Identifier l'abus de téléphone portable des conducteurs avec des filtres polarisants et la reconnaissance d'objets

Surveillance

Identifier l'abus de téléphone portable des conducteurs avec des filtres polarisants et la reconnaissance d'objets

mm

Des chercheurs au Royaume-Uni ont proposé un système en bordure de route pour automatiser la détection de l'utilisation illégale du téléphone mobile parmi les conducteurs, en utilisant des filtres photo-optiques classiques et une capture infrarouge. Selon la qualité de l'équipement de capture, le système a démontré un taux de précision allant jusqu'à 95.81 % lors d'essais en conditions réelles.

L'un des modèles des chercheurs en action. La zone du pare-brise est d'abord identifiée et isolée en tant que zone de chalandise pour une recherche assistée par IA d'images d'un téléphone mobile. Le système est conçu pour ignorer les téléphones portables montés et rechercher les appareils activement tenus par le conducteur. Source : https://www.youtube.com/watch?v=PErIUr3Cxvg

Un des modèles des chercheurs en action. La zone du pare-brise est d'abord identifiée et isolée comme zone de captage pour une recherche assistée par IA d'images de téléphones portables. Le système est conçu pour ignorer les téléphones portables fixés et rechercher les appareils activement tenus par le conducteur. Source : https://www.youtube.com/watch?v=PErIUr3Cxvg

L'espace Une étude est intitulé Identification des violations d'utilisation du téléphone par le conducteur via la détection d'objets à la pointe de la technologie avec suivi, et vient de la School of Computing de l'Université de Newcastle.

Surmonter la réflectivité des pare-brise

Les approches antérieures de détection de l'utilisation des appareils mobiles parmi les conducteurs ont été entravées par la réflectivité élevée des pare-brise pendant les heures de lumière du jour, exacerbée lorsque les réflexions de groupes de gros nuages ​​obscurcissent davantage l'intérieur du véhicule. De tels cas ne peuvent pas être traités de manière réaliste avec des sources de lumière infrarouge, car la quantité d'éclairage infrarouge nécessaire pour pénétrer la lumière naturelle du jour nécessiterait beaucoup de ressources.

Par conséquent, les chercheurs de Newcastle proposent l'astuce la plus ancienne du livre (datant de 1812) pour éliminer les reflets d'une surface de verre perçue - un outil physique bon marché. filtre polarisant qui pourraient être attachés à des caméras de surveillance routière, calibrés une fois, et permettre ensuite un regard clair sur l'intérieur des véhicules.

Ci-dessus, une vue non filtrée d'un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf

Ci-dessus, une vue non filtrée d'un pare-brise de voiture. Ci-dessous, la même vue avec un filtre polarisant physique attaché à la caméra. Source : https://arxiv.org/pdf/2109.02119.pdf

Avec le passage populaire des caméras dédiées aux capteurs mobiles, la présence du filtre polarisant dans la culture populaire s'est largement réduite à son inclusion dans des lunettes de soleil de qualité raisonnable, où le porteur peut observer ses propriétés antireflet en inclinant son point de vue ou en changeant son point de vue sur l'objet réfléchissant.

La lumière du soleil est diffusée par les molécules d'oxygène et d'azote, la lumière bleue étant plus largement diffusée que les autres longueurs d'onde, faisant du bleu la couleur native d'un ciel clair pendant la journée. La lumière bleue est polarisée et une linéaire ou circulaire lentille polarisée peut éliminer efficacement cette lumière polarisée, supprimant les reflets dans le processus.

Le journal reconnaît que les pare-brise fumés pourraient entraver ou même déjouer cette méthode de vision à l'intérieur de la voiture. Cependant, puisque c'est limité par la loi britannique, avec des réglementations variant selon les États aux États-Unis, le document ne considère pas cela comme un obstacle principal.

YOLO

Le système proposé par le document est destiné à être intégré dans les infrastructures civiques, telles que les caméras de surveillance routière installées par le gouvernement. Conscients des obstacles possibles au niveau des coûts, les chercheurs ont testé diverses configurations de système de reconnaissance d'objets sur une variété d'équipements de capture de niveaux de qualité et proposent un scénario à coût minimal dans lequel des filtres polarisants bon marché pourraient être ajoutés aux caméras existantes, avec tous les autres aspects de la système à distance.

Quatre frameworks de reconnaissance d'objets ont été testés : You-Only-Look-Once (YOLO) variantes 3 et 4 ; SSD réseau de base ; R-CNN plus rapideEt CentreNet. Lors des tests, les résultats les plus précis ont été obtenus avec YOLO V3, en utilisant un flux de travail en deux étapes qui localise d'abord la zone du pare-brise, puis recherche un appareil mobile dans cet espace.

Cependant, la nécessité d'exécuter la vidéo sur deux réseaux entraîne une fréquence d'images moins qu'optimale de 13.15 ips, par rapport à 30 ips plus proches sur le système plus simple. La qualité des résultats dépend de l'équipement d'entrée, et les chercheurs ont constaté que lorsque l'entrée était divisée entre les caméras bas de gamme et l'équipement de meilleure qualité, un taux de précision de près de 96 % était possible sur le meilleur kit et de 74.35 % sur le moins cher. appareils photo.

Limiter les infractions reconnues

En plus de rendre le système économiquement viable, les chercheurs souhaitent développer un système entièrement automatisé avec un minimum de surveillance humaine nécessaire, et le système a été conçu pour infliger automatiquement des amendes. Cependant, étant donné que les lois sur l'utilisation du téléphone portable au volant deviennent de plus en plus sévères dans le monde, avec des sanctions pouvant dépasser de simples amendes ou des déductions de points de permis (c'est-à-dire au Royaume-Uni), il semble probable qu'une vérification humaine occasionnelle resterait un facteur dans le déploiement de un tel système.

Malgré l'utilisation du flux optique et d'autres méthodes pour prendre en compte l'intégralité du contenu vidéo, les algorithmes de reconnaissance d'objets tels que YOLO considèrent chaque image comme une « histoire complète » et l'image suivante comme un projet ultérieur. Par conséquent, un système de cette nature doit être empêché d'infliger (par exemple) 128 amendes distinctes pour 128 images de vidéo infractionnelles.

Pour éviter cela, le système intègre l'algorithme de suivi d'objet TRI profond, qui ajoute un « ID d'incident » unique à chaque reconnaissance d'infraction et garantit que l'ID n'est pas dupliqué dans plusieurs images au sein d'une même séquence de capture.

Gestion de la surveillance nocturne

Pour les conditions nocturnes, les chercheurs utilisent par défaut la capture infrarouge, comme utilisé dans les projets de recherche précédents portant sur le même défi. Ils ont testé des longueurs d'onde IR de 850 et 730 nanomètres et ont constaté que les meilleurs détails étaient capturés avec 730 nm.

Le document soutient qu'une enquête plus approfondie est nécessaire pour déterminer dans quelle mesure la capture infrarouge pourrait être utilisée pendant les conditions diurnes.

Date

Pour la version plus économique du système en une seule étape, les chercheurs ont utilisé 2,235 XNUMX images de plaques d'immatriculation du Ensemble de données Google Open Images, et 2150 images de téléphone portable stock et sur mesure. Puisqu'il était nécessaire d'inclure des images de téléphones tenus par des conducteurs, 1,700 XNUMX des images de téléphones ont été prises spécifiquement pour le projet.

Le système en deux étapes nécessitait l'annotation de 487 pare-brise, utilisés pour former la première étape du processus, en plus des données utilisées dans le processus en une étape.

Comme il n'y avait pas d'accès à l'infrastructure officielle de surveillance routière, toutes les images ont été prises par des volontaires pour se rapprocher de conditions similaires.

Compromis

Les résultats finaux offrent une gamme de normes de précision qui devraient être compensées par le coût de mise en œuvre, avec des équipements de capture et des résultats de traitement supérieurs offrant la plus grande précision, et sans doute une précision « acceptable » pouvant être obtenue par une modernisation peu coûteuse des équipements de surveillance urbaine existants.

Le pipeline "en une seule étape" moins cher atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus bas (c'est-à-dire l'installation d'un filtre polarisant bon marché), tandis que le système en deux étapes plus complexe (qui isole la zone du pare-brise avant de rechercher un appareil mobile tenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu'aux nouvelles infrastructures, en fonction du budget disponible.

Le pipeline « en une seule étape », plus économique, atteint une précision proche de 75 %, avec les coûts de mise en œuvre les plus faibles (c.-à-d. l'installation d'un filtre polarisant bon marché). Le système plus complexe en deux étapes (qui isole la zone du pare-brise avant de rechercher un appareil mobile tenu par le conducteur) atteint des taux de précision plus élevés, mais peut ne convenir qu'aux nouvelles infrastructures, selon le budget disponible. Dans les deux cas, la qualité de l'équipement de capture est une variable supplémentaire.

Comme indiqué ci-dessus, la perception des chercheurs quant à la viabilité du projet semble être fondée sur l’hypothèse selon laquelle le système devrait fonctionner de manière entièrement autonome – une exigence discutable.

Jetez un œil à la vidéo officielle du projet ci-dessous pour plus de détails sur la mise en œuvre et les approches utilisées.

 

Rédacteur en apprentissage automatique, spécialiste du domaine de la synthèse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.
Site personnel : martinanderson.ai
Contact [email protected]
Twitter : @manders_ai