Kąt Andersona

Przewidywanie i zapobieganie tragediom na platformach metra z użyciem sztucznej inteligencji

Opublikowano 9 czerwca 2026

Przez

Martin Anderson

AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

System sztucznej inteligencji szkolony na prawdziwych nagraniach z kamer monitoringu metra twierdzi, że może zidentyfikować objawy ostrzegawcze próby samobójczej kilka minut przed jej wystąpieniem, śledząc zachowania takie jak chodzenie, zatrzymywanie się na krawędzi platformy i wielokrotne spoglądanie w stronę tunelu.

Systemy machine learning były testowane jako systemy monitorowania zdarzeń na platformach przez kilka lat, zwykle z pewną wariacją popularnego You Only Look Once (YOLO) serii aplikacji rozpoznawania obrazów, które umożliwiają scenariusze, w których ludzie mogą spaść, lub zbrodnia jest popełniana, lub gdzie platforma stacji jest po prostu przepełniona (co pozwala władzom stacji regulować dostęp i rozwiązać problem).

Z pracy z 2024 roku 'Pilotowy projekt monitorowania pieszych na stacji kolejowej z użyciem podejścia sztucznej inteligencji', etapy, w których YOLOV7 identyfikuje pasażerów na platformie. Źródło

Wraz ze wzrostem liczby prób samobójczych lub udanych samobójstw w ciągu ostatnich 3-5 lat (w regionach takich jak Wielka Brytania, Kanada i Holandia), wzrosło zainteresowanie potencjałem systemów machine learning w identyfikowaniu zachowań samobójczych na platformach kolejowych i metra, opartych na dyspozycji i innych czynnikach:

Mieszkańcy progu: przykładowe dane z zestawu danych napędzającego projekt STARR, który jest przedmiotem nowej pracy omawianej w tym artykule. Źródło

W sumie, różne projekty mające na celu wykorzystanie sztucznej inteligencji do samobójczych zachowań na platformach nie przyjęły jednolitej metodyki ani wspólnej podstawy systemu, ani wspólnego podejścia – przede wszystkim dlatego, że metody, które napędzają te systemy, są ciągle ewoluujące, wraz z wiedzą psychologiczną i psychiatryczną, która daje wgląd w ten rodzaj nadzoru sztucznej inteligencji.

Najnowsze osiągnięcia

Teraz nowe badanie z Kanady oferuje proponowaną formalizację tego nurtu w literaturze badawczej, jako Ocena ryzyka samobójstwa, w kontekście prób samobójczych na stacjach metra.

We współpracy z władzami transportu publicznego w Montrealu, badacze zaangażowani w nowe badanie uzyskali dostęp do nagrań z 66 prawdziwych prób samobójczych, jak zostały one utrwalone przez kamery platformowe w zakresie władz:

Z nowej pracy, wyniki prognoz z dwóch klatek, z których jeden przedstawia prawdziwą próbę samobójczą, a drugi nie. Po obu stronach każdego obrazu przedstawiono mapę cieplną niebezpiecznych i bezpiecznych obszarów na platformie pod nadzorem, przedstawiając w każdym przypadku 'skłonność do zatrzymania się' w odniesieniu do wejścia do tunelu, interpretowaną za pomocą wiedzy historycznej o skłonnościach prawdziwych 'skoczków'. Źródło

Chociaż było konieczne sztuczne rozwiązanie niewyrównania klas, które występuje w tak ograniczonym zestawie danych, jest to rzadkie dane o pewnej objętości; można by sobie życzyć, aby przyszłe projekty z władz transportu publicznego na całym świecie umożliwiły stworzenie międzynarodowego zestawu danych o wyższej objętości przykładów. Jednak zrozumiale, niezwykle wrażliwa natura takich nagrań sprawia, że jest to więcej niż przypadkowa lub łatwa perspektywa.

Inicjatywa, według autorów, jest pierwszym, który scalony różne zadania, które definiują ten nurt, w schemat, i przychodzi z nowym punktem odniesienia dla scenariusza samobójstwa na platformie metra.

Autorzy stwierdzają:

'W przeciwieństwie do podejść, które koncentrują się na izolowanych podzadaniach lub próbują inferować intencje bezpośrednio, nasze sformułowanie ocenia ryzyko samobójstwa z gromadzonych dowodów, integrując śledzenie osób, rozpoznawanie działań, segmentację semantyczną platformy i modelowanie mapy cieplnej opartej na trajektorii.

'Formalizując ocenę ryzyka samobójstwa jako odrębne zadanie i ustalając kompletny operacyjny potok, który osiąga 83,2% ROC-AUC na danych z monitoringu, praca ta podkreśla złożoność oceny ryzyka samobójstwa i otwiera nowe kierunki badań nad interpretowalnymi systemami sztucznej inteligencji dla dobra społecznego.'

Nowa praca pt. Ocena ryzyka samobójstwa z użyciem sztucznej inteligencji: ramy interpretowalne dla prewencji na stacjach metra, pochodzi od czterech autorów z Université TÉLUQ, Polytechnique Montréal i Université du Québec à Montréal.

Metoda

Ramowy system autorów analizuje transmisję wideo z monitoringu w czasie rzeczywistym, aby wygenerować ciągle aktualizowany wynik ryzyka samobójstwa dla każdej śledzonej osoby. Osoby są wykrywane, śledzone i przekształcane w uproszczone reprezentacje postawy ciała, po czym system rozpoznawania działań oparty na szkielecie identyfikuje działania w krótkich okresach czasu:

Potok systemu do szacowania ryzyka samobójstwa pasażera z monitoringu wideo, pokazujący, jak śledzenie, estymacja postawy, rozpoznawanie działań, strefowanie platformy i mapy cieplne trajektorii są połączone w celu przekształcenia ruchów i zachowań poszczególnych osób na platformie w ciągle aktualizowany wynik ryzyka.

Platforma jest następnie podzielona na znaczące strefy, umożliwiając wykrywanie wzorców ruchu, takich jak wielokrotne chodzenie między różnymi obszarami. Trajektoria pasażerów są projekowane na mapę platformy, co umożliwia generowanie map cieplnych, które podkreślają obszary najczęściej zajmowane lub przecinane przez osoby związane z podwyższonym ryzykiem.

W końcu system odnosi te wzorce przestrzenne do obserwowanych zachowań, aby wyprodukować indywidualną ocenę ryzyka samobójstwa dla każdej osoby na platformie – proces, który autorzy nazywają wnioskowaniem o ryzyku.

Autorzy użyli wstępnie wytrenowanego YOLOX jako wykrywacz osób dla swojego systemu, stwierdzając, że jego stan out-of-the-box jest doskonale użyteczny do tego celu. ByteTrack został użyty do orchestracji śledzenia wielu obiektów.

Każda osoba wyodrębniona przez te procesy jest przypisana do własnego wstępnie wytrenowanego HRNet modelu, który zapewnia estymację stawów i 2D punktów ciała wewnątrz ograniczenia określonego przez zewnętrzne te estymacje:

Przykłady estymacji stawów z HRNet, użyte w nowym projekcie. Źródło

Postawy ocenione z danych wideo z platformy metra są budowane w kumulatywne mapy definiujące historyczne ruchy (patrz mapy cieplne platformy po bokach wcześniejszego obrazu powyżej).

Nowy system integruje ramę STARR, wcześniejszą pracę zaprojektowaną do oceny prawdopodobieństwa samobójczego zachowania na platformach:

Estymacja postawy z ramy STARR. Źródło

W tym przypadku rama STARR jest używana do wykrycia trzech samoopisujących się adnotacji działań pasażerów: LookTunnel; Walk; i Stand.

Aby uwzględnić kontekst środowiskowy, pojęcie platformy jest podzielone na semantycznie znaczące strefy za pomocą modelu segmentacji semantycznej YOLOv8n wytrenowanego na ręcznie adnotowanych obrazach platformy:

Semantyka platformy: proces strefowania używany przez system do przekształcenia zsegmentowanej platformy w trzy zachowawczo znaczące obszary. Wynikające z tego strefy ścienne, żółto-liniowe i tunelowe zapewniają kontekst przestrzenny używany do oceny ruchów pasażerów i zachowań związanych z ryzykiem.

Wynikająca mapa segmentacji jest używana do oszacowania granic platformy i zdefiniowania trzech obszarów operacyjnych: Strefy Ściennej w pobliżu ściany platformy; Strefy Żółto-Liniowej, w której pasażerowie mogą zbliżyć się do krawędzi platformy, pozostając w granicach bezpieczeństwa; i Strefy Końcowej Platformy najbliżej wejścia do tunelu.

Te strefy zapewniają kontekst przestrzenny niezbędny do identyfikacji zachowań, które studia psychologiczne powiązały z podwyższonym ryzykiem samobójstwa. W szczególności pozwalają one systemowi wykryć powtarzające się ruchy między ścianą a linią żółtą, wraz z wejściem do obszaru końcowego platformy.

Połączone z mapami cieplnymi trajektorii wygenerowanymi wcześniej, te wskaźniki przestrzenne są później uwzględnione w końcowej ocenie ryzyka samobójstwa.

Interesujące jest to, że praca zauważa, że jednym z charakterystycznych objawów prób samobójczych jest tendencja do pozostawienia obiektu na platformie; jednak autorzy nie byli w stanie uwzględnić tego w tej wersji projektu, pozostawiając to do przyszłej pracy.

Mapa ryzyka platformy

Zamiast polegać tylko na zachowaniu jednej osoby, ramy łączą również mapy cieplne trajektorii z wielu znanych przypadków podwyższonego ryzyka, aby utworzyć platformowy 'mapę ryzyka pozycyjnego':

Tworzenie mapy ryzyka platformy z ruchów wielu osób podwyższonego ryzyka. Obszary, które wielokrotnie przyciągają zatrzymania, chodzenie lub inne zachowania związane z ryzykiem, stają się coraz bardziej widoczne i są później używane jako jeden z czynników w końcowej ocenie ryzyka.

Obszary, które wielokrotnie przyciągają długie zajmowanie, pojawiają się jako obszary o wyższym ryzyku, podczas gdy miejsca związane z krótkim lub rzadkim pobytem pozostają obszarami o niższym ryzyku. Wynikający z tego wynik ryzyka pozycyjnego staje się jednym z wejść używanych w końcowej ocenie ryzyka samobójstwa.

Końcowy wynik ryzyka oparty jest na ośmiu wskaźnikach gromadzonych w czasie: wyniku ryzyka pozycyjnego pochodzącym z map cieplnych platformy; czy pasażer chodzi lub stoi na linii żółtej; liczbie przejść przez linię żółtą; całkowitym czasie spędzonym na linii żółtej; najdłuższym nieprzerwanym okresem spędzonym na linii żółtej; powtarzającym się ruchem tam i z powrotem między ścianą a linią żółtą; powtarzającym się zwróceniem się w stronę tunelu; i wejściem do obszaru tunelu.

Te sygnały behawioralne i przestrzenne są następnie łączone za pomocą modelu XGBoost, wytwarzając ciągle aktualizowaną ocenę ryzyka samobójstwa dla każdej osoby na platformie.

Dane i testy

Testy zostały przeprowadzone na nagraniach z monitoringu dostarczonych przez Société de transport de Montréal (STM), składających się z 66 pięciominutowych nagrań utrwalonych przed prawdziwymi próbami samobójczymi, wraz z 56 nagrami kontrolnymi z tych samych kamer, w tym samym czasie, kiedy nie wystąpiła próba samobójcza.

Z pomocą psychologów i ekspertów od zachowań samobójczych, poszczególne osoby były adnotowane zgodnie z tym, czy pojawiają się w przypadku podwyższonego ryzyka lub w grupie kontrolnej, wytwarzając zestaw danych 256 osób, z których 66 było związanych z przypadkami prób samobójczych, a 190 zostało przydzielonych do grupy kontrolnej.

Aby zapobiec wyciekom informacji, wszystkie osoby wyodrębnione z tego samego nagrania zostały przydzielone do tego samego podziału danych, z 75% danych użytych do treningu i 25% zarezerwowanych do testowania, przy zachowaniu równowagi między przypadkami podwyższonego ryzyka i grupą kontrolną.

Klasyfikator XGBoost został wytrenowany na 300 iteracjach wzmocnienia, przy współczynniku uczenia 0,05, z podpróbkowaniem zarówno dla przypadków treningowych, jak i cech, w celu poprawy ogólnego dostosowania. Ponieważ zestaw danych zawiera znacznie więcej przypadków kontrolnych niż przypadków podwyższonego ryzyka, proces treningu skompensował to, przypisując dodatkową wagę do klasy mniejszościowej.

Wydajność została oceniona głównie za pomocą obszaru pod krzywą charakterystyki odbioru (ROC-AUC), mierząc, jak skutecznie system rozróżnia przypadki podwyższonego ryzyka i przypadki kontrolne.

Dodatkowe metryki obejmowały czułość, mierzącą poprawną identyfikację przypadków podwyższonego ryzyka; specyficzność, mierzącą poprawną identyfikację przypadków kontrolnych; współczynnik fałszywych alarmów, odzwierciedlający fałszywe alarmy (FPR); i współczynnik fałszywych negatywów, odzwierciedlający przypadki pominięte (FNR). Celowo niski próg decyzyjny został przyjęty w celu priorytetowego wczesnego identyfikowania potencjalnie niebezpiecznych sytuacji:

Wydajność ramy oceny ryzyka samobójstwa w czterech konfiguracjach, porównując warianty z adnotacjami ground-truth, górne i w pełni zautomatyzowane w ROC-AUC, czułości, specyficzności, współczynniku fałszywych alarmów i współczynniku pominiętych przypadków – i pokazując wpływ zastąpienia adnotacji ground-truth modułami automatycznego wykrywania, śledzenia i rozpoznawania działań.

Jak widać w tabeli wyników powyżej, w pełni zautomatyzowany system osiągnął ROC-AUC 0,832, podczas gdy zastąpienie składników automatycznego wykrywania i śledzenia adnotacjami ground-truth zwiększyło wydajność do 0,919.

Zastąpienie tylko modułu rozpoznawania działań wyprodukowało mniejszy zysk, zwiększając ROC-AUC do 0,893. Najwyższy wynik, 0,924, został osiągnięty, gdy wszystkie dane wejściowe pochodziły z adnotacji ground-truth, co sugeruje, że wykrywanie, śledzenie i ekstrakcja wskaźników są głównymi źródłami błędu w obecnym potoku.

Analiza wytrenowanego modelu XGBoost wskazała, że bezpośrednia interakcja z linią żółtą była jednym z najsilniejszych predyktorów podwyższonego ryzyka, po którym następowała liczba przejść przez linię żółtą, a następnie powtarzające się ruchy tam i z powrotem między strefami platformy. Czas spędzony na linii żółtej i wynik ryzyka pozycyjnego również przyczyniły się znacznie, podczas gdy uwaga skierowana w stronę tunelu i wejście do obszaru końcowego platformy dostarczyły dodatkowe, choć mniej decydujące sygnały.

Powracając do wyników jakościowych, ramy przypisały wysokie wyniki ryzyka osobom, które później były związane z próbami samobójczymi, podczas gdy przydzielono znacznie niższe wyniki otaczającym pasażerom kontrolnym:

Jak wcześniej w artykule, wyniki jakościowe przedstawione w pracy zawierają wyniki prognoz z dwóch obrazów z danych monitoringu, z mapami cieplnymi po obu stronach, wskazującymi na zatrzymania i inne działania platformowe.

W jednym przypadku wynik ryzyka 0,98 był związany z długim pobytem na linii żółtej i zajmowaniem obszarów uznanych za wysokie ryzyko przez mapę ryzyka pozycyjnego. W innym przypadku osoba podwyższonego ryzyka otrzymała wynik 0,92, podczas gdy pobliscy pasażerowie kontrolni otrzymali znacznie niższe szacunki.

Zdaniem autorów te różnice wynikają z gromadzenia się wielu wskaźników, a nie jednego zachowania. Długie przejścia przez linię żółtą, powtarzające się zwrócenie się w stronę tunelu i długie zajmowanie obszarów o wysokim ryzyku na platformie wszystkie przyczyniają się do wyników ryzyka.

Autorzy kończą:

'Poza wydajnością, nasza praca podkreśla interpretowalność, pokazując, że oceny ryzyka są napędzane intuicyjnymi wskaźnikami zgodnymi z ustalonymi czynnikami ryzyka behawioralnymi i przestrzennymi.

'To pozycjonuje proponowaną ramę jako znaczącą most między systemami nadzoru sztucznej inteligencji a międzydyscyplinarnymi badaniami nad prewencją samobójstw.'

Podsumowanie

Z osobistej perspektywy, jest to coraz rzadsza ulga, aby znaleźć artykuł o sztucznej inteligencji wartego raportowania, który nie ma szans na wywołanie kontrowersyjnej reakcji w jakiejś części społeczeństwa, ponieważ byłoby trudno zakwestionować wartość celów za tym rodzajem projektu.

W praktyce, bardzo mała ilość pikseli zajmowanych przez głowę, a relatywnie mała ilość miejsca na ekranie zajmowanego przez całą osobę pod nadzorem w tym scenariuszu, sprawia, że jest bardzo trudno stwierdzić, czy osoba często spogląda w stronę tunelu – jeden z objawów potencjalnego samobójstwa na kolei.

Jak zawsze w projektach dotyczących infrastruktury nadzoru, wydaje się, że jest to kwestia rozdzielczości i zasobów: gdyby były więcej kamer w częstszych odstępach, pokrywających platformę, w tym jednej specjalnie pokrywającej wyjście tunelu (tj. tunel, z którego nagle pojawia się pociąg metra), byłoby możliwe zaangażowanie niektórych z rozwijających się ram wokół kierunku spojrzenia. Jak jest teraz, bieżąca praca opiera się na ocenie całego kierunku ciała, aby sygnalizować, że osoba spogląda w stronę tunelu.

W końcu jest to kwestia budżetowa, przynajmniej jeśli chodzi o infrastrukturę kolejową; gdyby wszystkie platformy były wyposażone w bariery i bramki – funkcje, które pojawiają się rzadko na stacjach metra w Londynie i w sieciach metra w innych miastach na świecie – wówczas platformy nie oferowałyby możliwości samouszkodzenia.

Z pewnością zwiększony nadzór jest tańszą opcją, a wczesne identyfikowanie charakterystycznych objawów samouszkodzenia mogłoby umożliwić bezpośrednią interwencję przed wystąpieniem tragedii.

Pierwotnie opublikowane we wtorek, 9 czerwca 2026