Andersons vinkel
Forudsigelse og Forebyggelse af Metroplatformstragedier med AI

Et AI-system trænet på virkelige overvågningsvideooptagelser fra undergrundsstationer hævder, at det kan spotte advarselstegn på et selvmordsforsøg minutter før, det sker, ved at spore adfærd såsom pacing, lingeren ved platformkanten og gentagne kig ind i tunnelen.
Maskinlæringsystemer er blevet testet som platformbegivenheds-overvågningsystemer i nogle år, som regel med en variation af den populære You Only Look Once (YOLO) serie af billedgenkendelsesapplikationer, der driver scenarier, hvor fodgængere kan være faldet, eller en forbrydelse begås, eller hvor stationens platform er simpelthen overfyldt (hvad giver stationens myndigheder mulighed for at regulere adgang og afhjælpe problemet).

Fra 2024-papiret ‘Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach’, de stadier, hvor YOLOV7 identificerer passagerer på en platform. Kilde
Med en stigning i antallet af forsøg på eller succesfulde jernbaneselvmord i de seneste 3-5 år (i regioner såsom Storbritannien, Canada og Holland), er interessen for maskinlærings-systemers potentiale til at identificere selvmordsadfærd på jernbane- og metroplatforme øget, baseret på disposition og diverse andre faktorer:

Dwellers on the threshold: eksempeldata fra datasettet, der driver STARR-projektet, som er nævnt i denne artikel. Kilde
I alt har de forskellige projekter, der søger at udnytte AI til selvmordsadfærd på platforme, ikke hidtil antaget en ensartet metode eller underliggende system eller fælles tilgang – ikke mindst fordi de metoder, der driver disse systemer, konstant udvikles, sammen med den psykologiske og psykiatriske viden, der giver indsigt i denne type AI-overvågning.
Fremstød
Nu tilbyder en ny studie fra Canada en formel formalisering af denne forskningslinje, som Suicidriskvurdering (SRA), i sammenhæng med selvmordsforsøg på metrostationer.
I samarbejde med Montreal-transportsmyndighederne fik forskerne, der deltog i den nye studie, adgang til optagelser af 66 virkelige selvmordsforsøg, som var fanget af platformkameraer inden for myndighedernes område:

Fra den nye artikel, outputforudsigelser fra to billeder, hvoraf det ene viser et ægte jernbaneselvmordsforsøg, og det andet ikke. På hver side af hvert billede er der vist en varme-kort over farlige og sikrere områder på platformen under overvågning, der viser i hvert tilfælde en persons ‘dwell-tendens’ i forhold til tunnelmundingen, fortolket gennem historisk viden om tendenserne hos virkelige ‘springere’. Kilde
Selvom det var nødvendigt at adressere den klasse-ubalance, der opstår med sådant et begrænset grund-sandhed-dataset, er dette alligevel sjældent data i en vis mængde; man kunne håbe, at fremtidige projekter fra transitmyndigheder verden over muligvis kunne tillade en multi-lande-dataset med en højere mængde af eksempler. Men forståeligt nok gør den ekstremt følsomme natur af sådant et footage dette til mere end en casual eller let opgave.
Initiativet, som forfatterne hævder, er det første, der samler de forskellige opgaver, der definerer forfølgelsen, i en skema, og medfører en ny benchmark for metroplatform-selvmords-scenariet.
Forfatterne fastslår:
‘I modsætning til tilgange, der fokuserer på isolerede underopgaver eller forsøger at slutte intentionen direkte, vurderer vores formulering selvmordsrisiko fra akkumuleret bevis ved at inkorporere personsporings-, aktivitetsgenkendelse-, semantisk segmentering af platformen og traektorie-drevet risikovurderingsmodellering.
‘Ved at formalisere SRA som en distinkt opgave og benchmarking en komplet operativ pipeline, der opnår 83,2% ROC-AUC på virkeligt overvågningsdata, fremhæver dette arbejde kompleksiteten af selvmordsrisikovurdering og åbner nye retninger for forskning i fortolkelige AI-systemer til socialt godt.’
Den nye artikel har titlen Suicidrisikovurdering fra AI-drevet videoovervågning: En fortolkelig ramme for forebyggelse på metrostationer og kommer fra fire forfattere på Université TÉLUQ, Polytechnique Montréal og Université du Québec à Montréal.
Metode
Forfatternes ramme analyserer en live overvågningsvideostrøm for at generere en kontinuerligt opdateret selvmordsrisikovurdering for hver sporingspassager.
Personer detekteres, spores og konverteres til simplificerede kropsholdningsrepræsentationer, hvorefter et skelet-baseret aktivitetsgenkendelsessystem identificerer handlinger over korte tidsperioder:

Systempipelining til estimering af passager-selvmordsrisiko fra overvågningsvideo, der viser, hvordan sporings-, kropsholdnings-, aktivitetsgenkendelse-, platformzoning og traektorie-varmekort kombineres til at konvertere enkelte bevægelser og adfærd til en kontinuerligt opdateret risikovurdering for hver person på platformen.
Platformen deles derefter op i meningsfulde zoner, der giver mulighed for at detektere bevægelsesmønstre såsom gentagen pacing mellem forskellige områder.
Passagertraektorier projiceres derefter på et kort over platformen, hvilket giver mulighed for at generere varmekort, der fremhæver områder, der hyppigt besøges eller krydses af personer med forhøjet risiko.
Til sidst kombinerer systemet disse rumlige mønstre med observerede adfærd for at producere en individuel selvmordsrisikovurdering for hver person på platformen – en proces, som forfatterne kalder risikoinferens.
Forfatterne brugte en forudtrænet YOLOX-implementering som menneske-detektor for deres system og fandt, at dens ud af boksen-tilstand er fuldt ud brugbar til dette formål. ByteTrack blev brugt til at koordinere multi-objekt-sporing.
Hver person, der er individueret af disse processer, tildeles sin egen forudtrænede HRNet-model, der giver ledestangs-estimering og 2D-kropsværktøj inden for en begrænsningsboks bestemt af den yderste af disse estimeringer:

Eksempler på ledestangs-estimering fra HRNet, brugt i det nye projekt. Kilde
Kropsholdningsvurderingerne fra video-data fra metroplatformen opbygges til akkumulerede kort, der definerer historisk bevægelse (se ‘platform-varmekort’ til siden af billedet ovenfor).
Det nye system inkorporerer STARR-rammen, et tidligere arbejde designet til at evaluere sandsynligheden for selvmordsadfærd på platforme:

Kropsholdnings-estimering fra STARR-rammen. Kilde
I dette tilfælde bruges STARR til at detektere tre selvforklarende passager-handlings-annotationer: LookTunnel; Walk; og Stand.
Til at inkorporere miljøkontekst deles systemets opfattelse af platformen op i semantisk meningsfulde zoner ved hjælp af en YOLOv8n-semantisk-segmenteringsmodel trænet på manuelt-annoterede platformbilleder:

Platform-semantik: zoningsprocessen brugt af systemet til at konvertere en segmenteret platform til tre adfærds-mæssigt meningsfulde regioner. De resulterende væg-proximale, gul-linje-proximale og tunnel-tilstødende zoner giver den rumlige kontekst brugt til at evaluere passager-bevægelser og risiko-relateret adfærd.
De resulterende segmenteringskort bruges til at estimere platform-grænserne og definere tre operative områder: et Væg-Proximalt-Zone nær platform-væggen; en Gul-Linje-Proximal-Zone, hvor passagerer kan nærme sig platform-kanten, mens de stadig er inden for sikkerhedsgrænser; og en Platform-Far-End-Zone nær tunnel-indgangen.
Disse zoner giver den rumlige kontekst nødvendig for at identificere adfærd, som psykologiske studier har associeret med forhøjet selvmordsrisiko. Specifikt giver de mulighed for at detektere gentagen bevægelse mellem væg og gul-linje, samt indgang i platformens fjerneste zone.
Kombineret med de traektorie-varmekort genereret tidligere, inkorporeres disse rumlige indikatorer senere i den endelige selvmordsrisikovurdering.
Interessant nok nævner artiklen, at et kendetegn for selvmordsforsøg er tendensen til at lade et objekt tilbage på platformen; dog kunne forfatterne ikke inkorporere dette i denne version af projektet, og har derfor ladet det til fremtidigt arbejde.
En Kort over Platform-Risiko
I stedet for kun at afhænge af adfærden hos en enkelt person kombinerer rammen også traektorie-varmekort fra multiple kendte risiko-tilfælde for at skabe et platform-omfattende ‘position-risiko-varmekort’:

Opbygning af en platform-risiko-kort fra bevægelserne af multiple risiko-passerer. Områder, der gentagne gange tiltrækker længerevarende ophold, pacing eller anden risiko-relateret adfærd, bliver mere fremtrædende og bruges senere som en af faktorerne i den endelige risikovurdering.
Områder, der gentagne gange tiltrækker længerevarende ophold, bliver højere-risiko-områder, mens steder, der er forbundet med korte eller sjældne besøg, forbliver lavere-risiko. Den resulterende position-risiko-score bliver en af input-værdierne brugt i den endelige selvmordsrisikovurdering.
Den endelige risikovurdering er baseret på otte indikatorer akkumuleret over tid: en position-risiko-score afledt fra platform-varmekort; om en passager går eller står på gul-linjen; antallet af gul-linje-overgange; den samlede tid tilbragt på gul-linjen; den længste uafbrudte periode tilbragt på gul-linjen; gentagen frem-og-tilbage-bevægelse mellem væg og gul-linje; gentagen orientering mod tunnelen; og indgang i tunnel-tilstødende-enden af platformen.
Disse adfærds- og rumlige signaler kombineres derefter via en XGBoost-model, der producerer en kontinuerligt opdateret selvmordsrisikovurdering for hver enkelt person på platformen.
Data og Tests
Tests blev udført på overvågningsvideo leveret af Société de transport de Montréal (STM), bestående af 66 fem-minutters optagelser fanget før virkelige selvmordsforsøg, samt 56 matchede kontrol-optagelser fra samme kameraer, på tilsvarende tidspunkter, hvor intet selvmordsforsøg fandt sted.
Med hjælp fra psykologi- og selvmordsadfærdseksperter blev enkelt-passagerer annoteret i henhold til, om de optrådte i en risiko-scenario eller en kontrol-scenario, hvilket resulterede i en dataset på 256 personer, hvoraf 66 var forbundet med selvmordsforsøg, og 190 tilhørte kontrol-gruppen.
For at forhindre informations-lækage blev alle personer, der blev trukket ud af samme optagelse, tildelt samme data split, hvor 75% af dataen blev brugt til træning og 25% reserveret til test, mens balancen mellem risiko- og kontrol-tilfælde blev bevaret.
XGBoost-klassifikatoren blev trænet i 300 boosting-iterationer, med en læringsrate på 0,05, med subsampling for både trænings-eksempler og funktioner, for at forbedre generalisering. Da datasettet indeholder væsentligt flere kontrol-tilfælde end risiko-tilfælde, kompenserer træningsprocessen for dette ved at tildele ekstra vægt til den mindre klasse.
Præstationen blev primært vurderet ved hjælp af Area Under the Receiver Operating Characteristic Curve (ROC-AUC), der måler, hvor effektivt systemet kan skelne mellem risiko- og kontrol-tilfælde.
Yderligere metrikker omfattede sensitivitet, der måler korrekt identifikation af risiko-tilfælde; specificitet, der måler korrekt identifikation af kontrol-tilfælde; falsk-positiv-rate, der reflekterer falske alarmer (FPR); og falsk-negativ-rate, der reflekterer missede detectioner (FNR). En bevidst lav beslutningstærskel blev valgt for at prioritere tidlig identifikation af potentielt risiko-tilfælde:

Præstation af selvmordsrisikovurderings-rammen under fire konfigurationer, sammenlignende ground-truth-assisterede, upper-bound og fuldt automatiserede varianter på tværs af ROC-AUC, sensitivitet, specificitet, falsk-alarm-rate og missed-detection-rate – og viser præstations-indflydelsen af at erstatte ground-truth-annotationer med automatiserede detektions-, sporings- og aktivitetsgenkendelsesmoduler.
Som vist i den første resultattabel ovenfor, opnåede det fuldt automatiserede system en ROC-AUC på 0,832, mens erstatning af de automatiserede detektions- og sporingskomponenter med ground-truth-annotationer forbedrede præstationen til 0,919.
Erstatning af kun aktivitetsgenkendelsesmodulen resulterede i en mindre forbedring, der øgede ROC-AUC til 0,893. Den højeste score, 0,924, blev opnået, da alle input-værdier blev leveret fra ground-truth-annotationer, hvilket antyder, at detektion, sporings- og nedstrøms-indikator-ekstraktion forbliver de primære kilder til fejl i den nuværende pipeline.
Analyse af den trænede XGBoost-model indikerede, at direkte interaktion med gul-linjen var blandt de stærkeste prædiktorer for forhøjet risiko, efterfulgt af antallet af gul-linje-overgange og gentagen frem-og-tilbage-bevægelse mellem platform-zoner. Tiden tilbragt på gul-linjen og position-risiko-scoren bidrog også væsentligt, mens tunnel-retning og indgang i platformens fjerneste zone gav yderligere, men mindre afgørende signaler.
Da man returnerede til de kvalitative resultater, der blev forhåndsvist ovenfor, tildelte rammen høje risiko-værdier til personer, der senere blev forbundet med selvmordsforsøg, mens omgivende kontrol-passagerer fik væsentligt lavere vurderinger:

Som vist tidligere i artiklen, viser de kvalitative resultater i artiklen output-forudsigelser fra to billeder fra overvågningsdata, med varmekort til hver side for at indikere ophold og andre platform-aktiviteter.
I ét tilfælde blev en risiko-vurdering på 0,98 forbundet med længerevarende tilstedeværelse på gul-linjen og besættelse af områder, der var identificeret som høj-risiko af position-risiko-varmekortet. I et andet tilfælde fik en person med forhøjet risiko en vurdering på 0,92, mens omgivende kontrol-passagerer fik væsentligt lavere vurderinger.
Ifølge forfatterne opstår disse forskelle fra akkumulationen af multiple indikatorer, snarere end en enkelt adfærd. Længerevarende overgange af gul-linjen, gentagen orientering mod tunnelen og længerevarende tilstedeværelse i høj-risiko-områder på platformen bidrager alle til forhøjet risiko-vurdering.
Forfatterne konkluderer:
‘Uden for præstation, fremhæver vores studie fortolkelighed, og viser, at risikovurderinger drives af intuitive indikatorer, der er i overensstemmelse med etablerede adfærds- og rumlige risikofaktorer.
‘Dette positionerer den foreslåede ramme som en meningsfuld bro mellem AI-baserede overvågnings-systemer og tværfaglig forskning i selvmordsforebyggelse.’
Konklusion
På en personlig note er det en stadig sjældnere lettelse at finde en AI-artikel, der er værd at rapportere, og som ikke er sandsynlig at skabe en kontroversiel reaktion i en del af befolkningen, da det ville være svært at bestride værdien af målene bag dette type projekt.
På en praktisk note gør den meget lille mængde pixels, der er optaget af hovedet, og den relativt lille mængde skærmplads, der er optaget af hele personen under overvågning i dette scenario, det meget svært at afgøre, om personen ofte kigger på tunnelen – et af tegnene på muligt jernbaneselvmord.
Som altid i projekter om overvågnings-infrastruktur synes dette at være et spørgsmål om opløsning og ressourcer: hvis der var flere kameraer på hyppigere interval på platformen, herunder et, der specifikt dækker tunnel-udgangen (dvs. tunnel-aspektet, hvorfra en metro-toget pludselig dukker op), ville der være mulighed for at involvere nogle af de forskellige og konstant udviklende rammer omkring blik-retning. Som det er nu, afhænger det nuværende arbejde af at evaluere hele kroppens retning for at signalere, at subjektet betragter tunnelen.
Til sidst er problemet et budget-spørgsmål, i hvert fald så langt jernbane-infrastruktur er vedrørt; hvis alle platforme var udstyret med barrierer og porte – funktioner, der viser sig sjældent på London Underground-holdepladser og i metro-netværk i andre byer verden over – så ville platformene ikke tilbyde nogen mulighed for selv-skade.
For visse er øget overvågning den billigere løsning, og tidlig identifikation af karakteristiske tegn på selv-skade kunne tillade direkte intervention, før tragedien sker.
Først udgivet tirsdag, 9. juni 2026












