заглушки ИИ предсказывает горячие точки аварий по спутниковым снимкам и данным GPS - Unite.AI
Свяжитесь с нами:

Artificial Intelligence

ИИ предсказывает горячие точки аварий по спутниковым снимкам и данным GPS

mm
обновленный on

Исследователи из Массачусетского технологического института и Катарского центра искусственного интеллекта разработали систему машинного обучения, которая анализирует спутниковые снимки высокого разрешения, координаты GPS и исторические данные о ДТП, чтобы составить карту потенциально опасных участков дорожной сети и успешно прогнозировать «горячие точки» аварий. где никакие другие данные или предыдущие методы не указывали на них.

Справа посередине горячие точки прогнозируемых аварий возникают в результате сопоставления трех источников данных. Области, выделенные кружками, представляют собой прогнозы «высокого риска», которые на самом деле не имеют истории несчастных случаев. Источник: https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf

Справа посередине горячие точки прогнозируемых аварий возникают в результате сопоставления трех источников данных. Области, выделенные кружками, представляют собой прогнозы «высокого риска», которые на самом деле не имеют истории несчастных случаев. Источник: https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf

Система предлагает смелые прогнозы для областей в дорожной сети, которые могут стать «черными точками» дорожно-транспортных происшествий, даже если эти области не имеют истории аварий. Тестируя систему на данных за четыре года, исследователи обнаружили, что их прогнозы для этих «неисторических» зон потенциальной опасности аварий подтвердились событиями в последующие годы.

Ассоциация Новый документ называется Вывод карт риска дорожно-транспортных происшествий с высоким разрешением на основе спутниковых изображений и траекторий GPS. Авторы предсказывают использование новой архитектуры помимо прогнозирования аварий, предполагая, что ее можно применить к картам или системам риска чрезвычайных ситуаций 911 для прогнозирования вероятности спроса на такси и поставщиков услуг по доставке.

Предыдущие аналогичные попытки пытались создать аналогичные предикторы происшествий из карт с низким разрешением с высоким смещением или же использовать частоту происшествий в качестве ключа, что приводило к неточным прогнозам с высокой дисперсией. Вместо этого новый проект, который охватывает четыре крупных города США общей площадью 7,488 XNUMX квадратных километров, превосходит эти более ранние схемы за счет сопоставления более разнообразных форм данных.

Разреженные данные

Проблема, с которой столкнулись исследователи, заключается в скудости данных: очень большое количество аварий неизбежно будет замечено и устранено без необходимости использования машинной аналитики, но трудно выявить более тонкие опасные корреляции.

Предыдущие системы прогнозирования несчастных случаев были сосредоточены на Оценка Монте-Карло исторических данных об авариях и не может обеспечить эффективный механизм прогнозирования, если эти данные отсутствуют. Поэтому новое исследование изучает участки дорожной сети с похожими схемами движения, похожим внешним видом и похожей структурой, делая выводы о склонности к авариям на основе этих характеристик.

Это «выстрел в темноте», который, кажется, раскрыл основные индикаторы аварий, которые можно было бы использовать при проектировании новых дорожных сетей.

Оценка плотности ядра (KDE) использовалась для выделения исторических горячих точек дорожно-транспортных происшествий, но не позволяла предсказать места будущих аварий. На верхнем левом изображении мы видим, где KDE предсказывал аварии в области синего прямоугольника, по сравнению с тем, где аварии обычно локализованы (прилегающие). Внизу справа сравнение неудачного прогноза KDE с точным прогнозом (синяя рамка) системы MIT.

Оценка плотности ядра (KDE) использовался для выделения исторических горячих точек дорожно-транспортных происшествий, но не позволял предсказать места будущих аварий. На верхнем левом изображении мы видим, где KDE предсказывал аварии в области синего прямоугольника, по сравнению с тем, где аварии обычно локализованы (прилегающие). Внизу справа сравнение неудачного прогноза KDE с точным прогнозом (синяя рамка) системы MIT.

Авторы отмечают, что данные GPS о траектории дают информацию о потоке, скорости и плотности движения, а спутниковые снимки местности добавляют информацию о расположении и количестве полос движения, а также о наличии обочины с твердым покрытием и наличии пешеходы.

Соавтор Амин Садеги из Qatar Computing Research Institute (QCRI) , имея в виду «Наша модель может обобщать от одного города к другому, комбинируя несколько подсказок из, казалось бы, несвязанных источников данных. Это шаг к общему ИИ, потому что наша модель может предсказывать карты аварий на неизведанных территориях». и продолжил: «Модель можно использовать для получения полезной карты аварий даже при отсутствии исторических данных об авариях, что может быть положительно использовано для городского планирования и разработки политики путем сравнения воображаемых сценариев».

Архитектура системы прогнозирования дорожного движения создает карту риска аварий с разрешением 5 метров, что, по словам авторов, имеет решающее значение для различения различных рисков между автострадами и прилегающими жилыми дорогами.

Архитектура системы прогнозирования дорожного движения создает карту риска аварий с разрешением 5 метров, что, по словам авторов, имеет решающее значение для различения различных рисков между автострадами и прилегающими жилыми дорогами.

Проект оценивался по авариям и боковым данным за период с 2017 по 18 год. Затем были сделаны прогнозы на 2019 и 2020 годы, при этом несколько мест с «высоким риском» появились даже в отсутствие каких-либо исторических данных, которые обычно предсказывали бы это.

Достижение полезного обобщения

переобучения является критическим риском в системе, питаемой разреженными данными, даже если, как в этом случае, есть два дополнительных источника вспомогательных данных. Там, где заболеваемость низкая, из слишком малого числа примеров можно сделать чрезмерные предположения, что приведет к алгоритму, который ожидает очень конкретный, узкий диапазон возможных обстоятельств и не сможет определить более широкие вероятности.

Таким образом, при обучении модели исследователи случайным образом «отбрасывали» каждый входной источник с вероятностью 20%, так что области с меньшими (или отсутствующими) данными об авариях можно было рассматривать при обучении модели в направлении обобщения, и чтобы параллельные источники данных могли выступать в качестве репрезентативного представителя недостающей информации для любого конкретного исследования перекрестка или участка дороги.

Оценка

Модель была протестирована на наборе данных, включающем почти 7,500 км городской территории в Бостоне, Лос-Анджелесе, Чикаго и Нью-Йорке. Набор данных был организован в виде 1,872 плиток размером 2 км x 2 км, каждая из которых содержала спутниковые снимки из MapBox, с сегментацией дорог, замаскированной данными из OpenStreetMap. Как базовые изображения, так и карты сегментации имеют разрешение 0.625 метра.

Данные GPS поступают в виде собственного набора данных, собранного в период с 2015 по 17 год по четырем городам, в общей сложности 7.6 миллиона километров траекторий GPS с частотой дискретизации в 1 секунду.

Проект также использует 4.2 миллиона записей, охватывающих период с 2016 по 2020 год. Набор данных об авариях в США. Каждая запись включает метки времени и другие метаданные.

Первые два года исторических данных были переданы в модель, а последние два года использовались для обучения и оценки, что позволило исследователям установить точность системы в течение двух лет за короткий промежуток времени.

Система была протестирована с историческими данными и без них, и было обнаружено, что она успешно фиксирует основное распределение рисков во всех случаях, заметно улучшая предыдущие методы на основе KDE (см. выше).

Дороги вперед

Авторы утверждают, что их система может применяться в других странах с небольшими архитектурными изменениями, даже в местах, где нет данных об авариях. Кроме того, авторы предлагают свое исследование в качестве возможного дополнения к градостроительному проектированию новых городских застроек.

Ведущий автор Songtao He прокомментировал новую работу:

«Отслеживая базовое распределение рисков, которое определяет вероятность будущих аварий во всех местах и ​​без каких-либо исторических данных, мы можем найти более безопасные маршруты, позволить автостраховым компаниям предоставлять индивидуальные планы страхования на основе траекторий движения клиентов, помочь градостроителям разработать более безопасные дороги и даже прогнозировать будущие аварии».

Хотя в документе указано, что код для системы был выпущен на GitHub, ссылка на код не активна, в настоящее время не может быть найдена поиском и, предположительно, будет включена в более позднюю версию.

По словам Сонгтао Хэ, это исследование может быть включено в популярные потребительские приложения для дорожного движения на основе GPS и планировщики маршрутов:

«Если люди смогут использовать карту рисков для определения участков дорог с потенциально высоким риском, они смогут заранее принять меры, чтобы снизить риск своих поездок. В таких приложениях, как Waze и Apple Maps, есть инструменты для работы с инцидентами, но мы пытаемся опередить сбои — до того, как они произойдут».