Intelligence Artificielle
L'IA prédit les points chauds des accidents à partir de l'imagerie satellite et des données GPS

Des chercheurs du MIT et du Centre d'intelligence artificielle du Qatar ont développé un système d'apprentissage automatique qui analyse les images satellite haute résolution, les coordonnées GPS et les données historiques d'accidents afin de cartographier les sections potentielles des réseaux routiers sujettes aux accidents, prédisant ainsi avec succès les « points chauds » des accidents. où aucune autre donnée ou méthode antérieure ne les indiquerait.

Au milieu à droite, des points chauds prédictifs d'accidents émergent de la collecte de trois sources de données. Les zones mises en évidence dans les cercles sont des prédictions à « risque élevé » qui n'ont en fait aucun historique d'accidents. Source : https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf
Le système offre des prédictions audacieuses pour les zones d'un réseau routier qui sont susceptibles de devenir des points noirs d'accidents, même lorsque ces zones n'ont aucun historique d'accidents. En testant le système sur des données couvrant quatre ans, les chercheurs ont découvert que leurs prédictions pour ces zones de risque d'accident potentiel «sans antécédent» étaient confirmées par les événements des années suivantes.
Les nouveau papier est appelé Déduire des cartes haute résolution des risques d'accidents de la circulation à partir d'images satellite et de trajectoires GPS. Les auteurs prédisent des utilisations de la nouvelle architecture au-delà de la prédiction des accidents, en supposant qu'elle pourrait être appliquée aux cartes ou systèmes de risque d'urgence 911 pour prédire la probabilité de la demande de taxis et de fournisseurs de covoiturage.
Des efforts similaires antérieurs ont tenté de créer des prédicteurs d'incidents similaires à partir de cartes à faible résolution avec un biais élevé, ou bien de tirer parti de la fréquence des accidents comme clé, ce qui a conduit à des prévisions à variance élevée et inexactes. Au lieu de cela, le nouveau projet, qui couvre quatre grandes villes américaines totalisant 7,488 XNUMX kilomètres carrés, surpasse ces schémas antérieurs en rassemblant des formes de données plus diverses.
Données rares
Le problème auquel sont confrontés les chercheurs est la rareté des données - des volumes très élevés d'accidents seront inévitablement remarqués et traités sans avoir besoin d'analyses automatiques, mais des corrélations plus subtilement dangereuses sont difficiles à identifier.
Les anciens systèmes de prévision des accidents se concentrent sur Estimation de Monte-Carlo de données historiques sur les accidents et ne peut fournir aucun mécanisme de prévision efficace lorsque ces données font défaut. Par conséquent, la nouvelle recherche étudie des sections de réseau routier avec des modèles de trafic similaires, une apparence visuelle similaire et une structure similaire, en déduisant une disposition aux accidents basée sur ces caractéristiques.
C'est un « tir dans le noir » qui semble avoir mis au jour des indicateurs d'accidents fondamentaux, qui pourraient être utilisés dans la conception de nouveaux réseaux routiers.

Estimation de la densité du noyau (KDE) a été utilisé pour mettre en évidence les points chauds des accidents de la circulation historiques, sans prédire les futurs emplacements des accidents. Dans l'image en haut à gauche, nous voyons où KDE a prédit les accidents dans la région de la boîte bleue, par rapport à l'endroit où les accidents sont généralement localisés (adjacents). En bas à droite, une comparaison de l'échec de la prédiction de KDE avec la prédiction précise (boîte bleue) du système MIT.
Les auteurs notent que les données de trajectoire GPS fournissent des informations sur le flux, la vitesse et la densité du trafic, tandis que l'imagerie satellitaire de la zone ajoute des informations sur la disposition des voies et le nombre de voies, ainsi que sur l'existence d'une bande d'arrêt d'urgence et la présence de piétons.
Auteur collaborateur Amin Sadeghi, du Qatar Computing Research Institute (QCRI) commenté "Notre modèle peut être généralisé d'une ville à l'autre en combinant plusieurs indices provenant de sources de données apparemment sans rapport. C'est une étape vers l'IA générale, car notre modèle peut prédire les cartes de collision dans des territoires inexplorés. et a poursuivi "Le modèle peut être utilisé pour déduire une carte des accidents utile même en l'absence de données historiques sur les accidents, ce qui pourrait se traduire par une utilisation positive pour la planification urbaine et l'élaboration des politiques en comparant des scénarios imaginaires".

L'architecture du système de prévision du trafic génère une carte des risques d'accident à une résolution de 5 mètres, ce qui, selon les auteurs, est essentiel pour distinguer les différents risques entre l'autoroute et les routes résidentielles adjacentes.
Le projet a été évalué sur les collisions et les données latérales couvrant une période comprise entre 2017 et 18. Des prévisions ont ensuite été faites pour 2019 et 2020, avec plusieurs emplacements «à haut risque» émergeant même en l'absence de données historiques qui le prédiraient normalement.
Obtenir une généralisation utile
Surapprentissage est un risque critique dans un système alimenté par des données rares, même lorsque, comme dans ce cas, il existe deux sources supplémentaires de données à l'appui. Lorsqu'une incidence est faible, des hypothèses excessives peuvent être tirées de trop peu d'exemples, conduisant à un algorithme qui s'attend à une bande très particulière et étroite de circonstances possibles, et qui ne parviendra pas à identifier des probabilités plus larges.
Par conséquent, lors de la formation du modèle, les chercheurs ont "abandonné" au hasard chaque source d'entrée avec une probabilité de 20 %, de sorte que les zones avec moins (ou pas) de données sur les accidents peuvent être considérées comme le modèle s'entraîne vers la généralisation, et pour que des sources de données parallèles puissent agir comme un substitut représentatif des informations manquantes pour toute étude particulière d'une intersection ou d'un tronçon de route.
Évaluation
Le modèle a été testé sur un ensemble de données comprenant près de 7,500 1,872 km de zone urbaine à Boston, Los Angeles, Chicago et New York. L'ensemble de données a été organisé sous la forme de 2 2 tuiles de XNUMX km x XNUMX km, chacune contenant des images satellite de MapBox, avec segmentation routière masquée via les données d'OpenStreetMap. L'imagerie de base et les cartes de segmentation ont une résolution de 0.625 mètre.
Les données GPS se présentent sous la forme d'un ensemble de données propriétaires collectées entre 2015 et 17 dans les quatre villes, totalisant 7.6 millions de kilomètres de trajectoires GPS à un taux d'échantillonnage d'une seconde.
Le projet exploite également 4.2 millions d'enregistrements couvrant la période 2016-2020 dans le Ensemble de données sur les accidents aux États-Unis. Chaque enregistrement comprend des horodatages et d'autres métadonnées.
Les deux premières années de données historiques ont été introduites dans le modèle, et les deux dernières années ont été utilisées pour la formation et l'évaluation, permettant aux chercheurs d'établir la précision du système sur deux ans dans un court laps de temps.
Le système a été testé avec et sans données historiques, et s'est avéré capable de capturer avec succès la répartition des risques sous-jacents dans tous les cas, améliorant notamment les méthodes antérieures basées sur KDE (voir ci-dessus).
Routes vers l'avant
Les auteurs soutiennent que leur système peut être appliqué à d'autres pays avec peu de modifications architecturales, même dans des endroits où les données sur les accidents ne sont pas disponibles. De plus, les auteurs proposent leur recherche comme complément possible à la conception de l'urbanisme pour les nouveaux développements urbains.
L'auteur principal Songtao He a commenté le nouveau travail :
"En capturant la distribution des risques sous-jacents qui détermine la probabilité de futurs accidents à tous les endroits, et sans aucune donnée historique, nous pouvons trouver des itinéraires plus sûrs, permettre aux compagnies d'assurance automobile de fournir des plans d'assurance personnalisés basés sur les trajectoires de conduite des clients, aider les urbanistes à concevoir des routes plus sûres, et même prévoir de futurs accidents.
Bien que le document indique que le code du système a été publié sur GitHub, le lien vers le code n'est pas actif, ne peut actuellement pas être trouvé par une recherche et sera probablement inclus dans une révision ultérieure.
Selon Songtao He, la recherche a le potentiel d'être intégrée dans les applications de trafic GPS et les planificateurs d'itinéraire populaires au niveau des consommateurs :
"Si les gens peuvent utiliser la carte des risques pour identifier les segments de route potentiellement à haut risque, ils peuvent prendre des mesures à l'avance pour réduire le risque de trajets qu'ils effectuent. Des applications comme Waze et Apple Maps ont des outils de fonctionnalité d'incident, mais nous essayons de devancer les plantages - avant qu'ils ne se produisent »,