Connect with us

Artificiell intelligens

AI förutsäger olycksplatser från satellitbilder och GPS-data

mm

Forskare från MIT och Qatar Center for Artificial Intelligence har utvecklat ett maskinlärningssystem som analyserar högupplösta satellitbilder, GPS-koordinater och historiska krockdata för att kartlägga potentiella olycksdrabbade vägavsnitt, och har med framgång förutspått olycksplatser där inga andra data eller tidigare metoder skulle indikera dem.

Mitt till höger, förutsägbara olycksplatser uppstår från att kombinera tre källor av data. Områden som markerats med cirklar är 'högrisk'-förutsägelser som faktiskt inte har någon historisk olyckshistoria.

Mitt till höger, förutsägbara olycksplatser uppstår från att kombinera tre källor av data. Områden som markerats med cirklar är ‘högrisk’-förutsägelser som faktiskt inte har någon historisk olyckshistoria. Source: https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf

Systemet erbjuder djärva förutsägelser för områden i ett vägnät som sannolikt kommer att bli olycksplatser, även där områdena inte har någon historik av olyckor. När systemet testades över data som täckte fyra år, fann forskarna att deras förutsägelser för dessa ‘inga historiska data’-potentiella olyckszoner bekräftades av händelser i efterföljande år.

Den nya artikeln heter Inferring high-resolution traffic accident risk maps based on satellite imagery and GPS trajectories. Författarna förutser användningar för den nya arkitekturen utöver olycksförutsägelse, och hypoteserar att den kan tillämpas på 911-akutriskkartor eller system för att förutsäga efterfrågan på taxi och samåkningstjänster.

Tidigare liknande insatser har försökt att skapa liknande incidentförutsägare från lågupplösta kartor med hög bias, eller att utnyttja olycksfrekvens som en nyckel, vilket ledde till hög varians och ofullständiga förutsägelser. Istället överträffar det nya projektet, som täcker fyra stora amerikanska städer om totalt 7 488 kvadratkilometer, dessa tidigare scheman genom att kombinera mer varierad data.

Sparse Data

Problemet som forskarna står inför är sparse data – mycket stora mängder olyckor kommer oundvikligen att uppmärksammas och åtgärdas utan behov av maskinell analys, men mer subtila farliga korrelationer är svåra att identifiera.

Tidigare olycksförutsägelsesystem kretsar kring Monte Carlo-estimering av historiska olyckdata, och kan inte ge någon effektiv förutsägelsemekanism där denna data saknas. Därför studerar den nya forskningen vägnätavsnitt med liknande trafikmönster, liknande visuell utseende och liknande struktur, och drar slutsatsen att olyckor kan inträffa baserat på dessa egenskaper.

Det är en ‘skott i mörkret’ som tycks ha avslöjat grundläggande olycksindikatorer, som kan användas vid design av nya vägnät.

Kernel Density Estimation (KDE) har använts för att belysa historiska trafikolycksplatser, men misslyckas med att förutsäga framtida olycksplatser. I den övre vänstra bilden ser vi var KDE har förutspått olyckor i den blå rutan, jämfört med var olyckorna i allmänhet lokaliseras (intill).

Kernel Density Estimation (KDE) har använts för att belysa historiska trafikolycksplatser, men misslyckas med att förutsäga framtida olycksplatser. I den övre vänstra bilden ser vi var KDE har förutspått olyckor i den blå rutan, jämfört med var olyckorna i allmänhet lokaliseras (intill).

Författarna påpekar att GPS-trafikdata erbjuder information om flöde, hastighet och densitet av trafik, medan satellitbilder av området tillför information om körfält, antal filer, förekomst av mittremsa och närvaro av fotgängare.

Medförfattare Amin Sadeghi, från Qatar Computing Research Institute (QCRI) kommenterade “Vår modell kan generalisera från en stad till en annan genom att kombinera flera ledtrådar från skenbart orelaterade datakällor. Detta är ett steg mot allmän AI, eftersom vår modell kan förutsäga krockkartor i okända territorier” och fortsatte “Modellen kan användas för att härleda en användbar krockkarta, även i avsaknad av historiska krockdata, vilket kan översättas till positiv användning för stadsplanering och politiska beslut genom att jämföra tänkbara scenarier”.

Arkitekturen för trafikförutsägelsesystemet genererar en olycksriskkarta med en upplösning på 5 meter, vilket författarna hävdar är avgörande för att skilja mellan olika risker mellan motorväg och intilliggande bostadsområden.

Arkitekturen för trafikförutsägelsesystemet genererar en olycksriskkarta med en upplösning på 5 meter, vilket författarna hävdar är avgörande för att skilja mellan olika risker mellan motorväg och intilliggande bostadsområden.

Projektet utvärderades på krock- och laterala data som täckte en period mellan 2017-18. Förutsägelser gjordes för 2019 och 2020, med flera ‘högrisk’-platser som uppstod, även i avsaknad av någon historisk data som normalt skulle förutsäga detta.

Att uppnå användbar generalisering

Overfitting är en kritisk risk i ett system som drivs av sparse data, även där, som i detta fall, det finns två ytterligare källor av stödjande data. Där en händelse är låg, kan för många antaganden dras från för få exempel, vilket leder till en algoritm som förväntar sig en mycket specifik, smal band av möjliga omständigheter, och som kommer att misslyckas med att identifiera bredare sannolikheter.

Därför, i utbildningen av modellen, “droppade” forskarna slumpmässigt varje ingångskälla med en 20-procentig sannolikhet, så att områden med mindre (eller ingen) olycksdata kan beaktas när modellen utbildas mot generalisering, och så att parallella datakällor kan fungera som en representativ proxy för saknad information för varje studie av en korsning eller vägavsnitt.

Utvärdering

Modellen testades på en dataset som bestod av nästan 7 500 km av urban område i Boston, Los Angeles, Chicago och New York. Dataseten var organiserad i form av 1 872 2×2 km-tiler, var och en innehållande satellitbilder från MapBox, med vägsegmentering maskerad via data från OpenStreetMap. Både basbilden och segmenteringskartorna har en upplösning på 0,625 meter.

GPS-data kommer i form av en proprietär dataset som samlades in mellan 2015-17 över de fyra städerna, totalt 7,6 miljoner kilometer av GPS-trafikdata med en sampelhastighet på 1 sekund.

Projektet utnyttjar också 4,2 miljoner poster som täcker 2016-2020 i US Accidents Dataset. Varje post innehåller tidsstämplar och annan metadata.

De första två åren av historiska data matades in i modellen, och de sista två åren användes för utbildning och utvärdering, vilket möjliggjorde för forskarna att fastställa systemets noggrannhet under två år inom en kort tidsram.

Systemet testades med och utan historiska data, och visade sig kunna fånga den underliggande riskfördelningen över alla fall, och förbättrade betydligt tidigare KDE-baserade metoder (se ovan).

Vägar framåt

Författarna hävdar att deras system kan tillämpas på andra länder med liten arkitektonisk modifiering, även i områden där olycksdata inte är tillgänglig. Dessutom föreslår författarna sin forskning som en möjlig tillägg till stadsplanering och design för nya urbana utvecklingsområden.

Huvudförfattare Songtao He kommenterade den nya forskningen:

“Genom att fånga den underliggande riskfördelning som bestämmer sannolikheten för framtida krockar på alla platser, och utan någon historisk data, kan vi hitta säkrare rutter, möjliggöra för försäkringsbolag att erbjuda anpassade försäkringsplaner baserat på kundernas körsträckor, hjälpa stadsplanerare att designa säkrare vägar, och till och med förutsäga framtida krockar.”

Även om artikeln anger att koden för systemet har släppts på GitHub, är länken till koden inte aktiv, kan för närvarande inte hittas genom en sökning, och förmodligen kommer att inkluderas i en senare revision.

Forskningen har potential att integreras i populära konsumentnivå-GPS-baserade trafikappar och ruttplanerare, enligt Songtao He:

“Om människor kan använda riskkartan för att identifiera potentiellt högriskvägar, kan de vidta åtgärder i förväg för att minska risken för resor. Appar som Waze och Apple Maps har incidentfunktioner, men vi försöker komma före krockarna – innan de händer,”

Författare på maskinlärande, domänspecialist inom mänsklig bildsyntes. Före detta chef för forskningsinnehåll på Metaphysic.ai.