Andersons hoek

Voorspelling en voorkoming van metroplatformtragedieën met AI

mm
AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

Een AI-systeem getraind op echte beveiligingsbeelden van metro’s beweert dat het waarschuwingsignalen van een zelfmoordpoging kan herkennen, enkele minuten voordat het gebeurt, door gedragingen zoals heen en weer lopen, treuzelen op de rand van het perron en herhaaldelijk in de tunnel kijken.

 

Machine learning-systemen zijn al enkele jaren getest als systeem voor het bewaken van gebeurtenissen op platforms, meestal met een variatie van de populaire You Only Look Once (YOLO) serie van beeldherkenningsapplicaties die scenario’s mogelijk maken waarin voetgangers zijn gevallen, of een misdaad wordt gepleegd, of waar het station overvol is (waardoor stationautoriteiten toegang kunnen reguleren en het probleem kunnen verhelpen).

Uit het paper van 2024 'Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach', de stadia waarin YOLOV7 passagiers op een platform identificeert. Bron - https://www.mdpi.com/1424-8220/24/11/3377

Uit het paper van 2024 ‘Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach’, de stadia waarin YOLOV7 passagiers op een platform identificeert. Bron

Met een toename van het aantal pogingen tot of geslaagde treinselfmoorden in de afgelopen 3-5 jaar (in regio’s zoals het VK, Canada en Nederland), is de interesse toegenomen in het potentieel van machine learning-systemen om zelfmoordneigend gedrag op trein- en metroperrons te identificeren, op basis van houding en diverse andere factoren:

Dwellers on the threshold: voorbeeldgegevens uit de dataset die het STARR-project aandrijft, dat in dit artikel wordt besproken. Bron - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Dwellers on the threshold: voorbeeldgegevens uit de dataset die het STARR-project aandrijft, dat in dit artikel wordt besproken. Bron

In totaal hebben de verschillende projecten die proberen AI te gebruiken voor zelfmoordgedrag op platforms, nog geen uniforme methodologie of onderliggende systeem of gemeenschappelijke aanpak aangenomen – niet in de laatste plaats omdat de methoden die dergelijke systemen aandrijven, voortdurend evolueren, evenals de psychologische en psychiatrische kennis die inzicht geeft in dit soort AI-toezicht.

Staat van de techniek

Nu biedt een nieuw onderzoek uit Canada een voorgestelde formalisering van deze tak in de onderzoeksliteratuur, als Zelfmoordrisicobeoordeling (SRA), in de context van zelfmoordpogingen op metroperrons.

In samenwerking met de Montrealse vervoersautoriteiten kregen de onderzoekers die betrokken waren bij het nieuwe onderzoek toegang tot beelden van 66 echte zelfmoordpogingen, zoals vastgelegd door camerabeelden op het perron binnen het bereik van de autoriteiten:

Uit het nieuwe paper, voorspellingsresultaten van twee frames, één waarin een echte treinselfmoordpoging wordt getoond en de andere niet. Aan weerszijden van elk beeld wordt een heatmap van gevaarlijke en veiligere gebieden op het perron weergegeven, waarop de 'dwell tendency' van een persoon ten opzichte van de tunnelmond wordt weergegeven.

Uit het nieuwe paper, voorspellingsresultaten van twee frames, één waarin een echte treinselfmoordpoging wordt getoond en de andere niet. Aan weerszijden van elk beeld wordt een heatmap van gevaarlijke en veiligere gebieden op het perron weergegeven, waarop de ‘dwell tendency’ van een persoon ten opzichte van de tunnelmond wordt weergegeven. Bron

Hoewel het nodig was om de klasse-ongelijkheid die optreedt met een dergelijke beperkte grondwaarheiddataset kunstmatig aan te pakken, is dit niettemin zeldzame gegevens met enige volume; men zou kunnen hopen dat toekomstige projecten van vervoersautoriteiten over de hele wereld zouden kunnen leiden tot een multinationale dataset met een hoger volume aan voorbeelden. Echter, begrijpelijk is de extreem gevoelige aard van dergelijke beelden, waardoor dit meer dan een gewone of gemakkelijke onderneming is.

Het initiatief, zo beweren de auteurs, is het eerste dat de diverse taken die deze onderneming definiëren, in een schema samenbrengt, en komt met een nieuwe benchmark voor het metroperron-zelfmoordscenario.

De auteurs verklaren:

‘In tegenstelling tot benaderingen die zich richten op geïsoleerde subtaken of proberen de intentie rechtstreeks af te leiden, beoordeelt onze formulering het zelfmoordrisico op basis van cumulatief bewijs door het incorporeren van persoonlijk volgen, activiteitherkenning, semantische segmentatie van het perron en traject-gedreven risicokaartmodellering.

‘Door SRA te formaliseren als een afzonderlijke taak en een complete operationele pijplijn te benchmarken met een ROC-AUC van 83,2% op echte surveillancegegevens, benadrukt dit werk de complexiteit van zelfmoordrisicobeoordeling en opent het nieuwe richtingen voor onderzoek naar interpreteerbare AI-systemen voor het sociale goede.’

Het nieuwe paper heeft als titel Zelfmoordrisicobeoordeling vanuit AI-gestuurde videosurveillance: een interpreteerbaar kader voor preventie op metroperrons en komt van vier auteurs van Université TÉLUQ, Polytechnique Montréal en de Université du Québec à Montréal.

Methode

Het kader van de auteurs analyseert een live-surveillancevideo om een continue bijgewerkte zelfmoordrisicoscore voor elke getraceerde passagier te genereren. Individuen worden gedetecteerd, getraceerd en omgezet in vereenvoudigde lichaamshoudingsweergaven, waarna een op skelet gebaseerd activiteitherkenningsysteem acties over korte tijd identificeert:

Systeempijplijn voor het schatten van het zelfmoordrisico van passagiers vanuit surveillancevideo, waarin wordt getoond hoe tracking, pose-estimatie, activiteitherkenning, platformzoning en trajectheatmaps worden gecombineerd om individuele bewegingen en gedragingen om te zetten in een continue bijgewerkte risicoscore voor elke persoon op het perron.

Systeempijplijn voor het schatten van het zelfmoordrisico van passagiers vanuit surveillancevideo, waarin wordt getoond hoe tracking, pose-estimatie, activiteitherkenning, platformzoning en trajectheatmaps worden gecombineerd om individuele bewegingen en gedragingen om te zetten in een continue bijgewerkte risicoscore voor elke persoon op het perron.

Het perron wordt vervolgens opgedeeld in zinvolle zones, waardoor bewegingspatronen – zoals herhaaldelijk heen en weer lopen tussen verschillende gebieden – kunnen worden gedetecteerd. Passagierstrajecten worden geprojecteerd op een kaart van het perron, waardoor het mogelijk wordt om heatmaps te genereren die de gebieden die het vaakst worden bezocht of doorkruist door personen met verhoogd risico, markeren.

Tenslotte wordt het systeem gekruist met deze ruimtelijke patronen om een individuele zelfmoordrisicobeoordeling voor elke persoon op het perron te produceren – een proces dat de auteurs risk inference noemen.

De auteurs gebruikten een vooraf getrainde YOLOX-implementatie als menselijke detector voor hun systeem, en ontdekten dat de standaardtoestand perfect bruikbaar is voor dit doel. ByteTrack werd gebruikt om multi-objecttracking te orkestreren.

Elke persoon die door deze processen wordt geïdentificeerd, krijgt zijn eigen vooraf getrainde HRNet-model toegewezen, dat gewrichtsschatting en 2D-lichaamspunten binnen een begrenzingsvak biedt dat wordt bepaald door de buitenste van deze schattingen:

Voorbeelden van gewrichtsschatting van HRNet, gebruikt in het nieuwe project. Bron - https://github.com/HRNet

Voorbeelden van gewrichtsschatting van HRNet, gebruikt in het nieuwe project. Bron

De poses die uit videogegevens van het metroperron worden geëvalueerd, worden opgebouwd tot cumulatieve kaarten die historische beweging definiëren (zie de ‘platform heat maps’ aan de zijkant van de eerder genoemde afbeelding).

Het nieuwe systeem incorporeert het STARR-kader, een eerder werk dat is ontworpen om de waarschijnlijkheid van zelfmoordgedrag op platforms te evalueren:

Pose-estimatie van het STARR-kader. Bron - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Pose-estimatie van het STARR-kader. Bron

In dit geval wordt STARR gebruikt om drie passagiersactie-annotaties te detecteren: LookTunnel; Walk; en Stand.

Om omgevingscontext te incorporeren, wordt het systeemconcept van het perron opgedeeld in semantisch zinvolle zones met behulp van een YOLOv8n semantische segmentatiemodel getraind op handmatig geannoteerde platformafbeeldingen:

Platformsemantiek: het zoningsproces dat door het systeem wordt gebruikt om een gesegmenteerd platform om te zetten in drie gedragsmatig zinvolle regio's. De resulterende muur-nabije, gele-lijn-nabije en tunnel-aangrenzende zones bieden de ruimtelijke context die wordt gebruikt om passagiersbewegingen en risicogerelateerd gedrag te evalueren.

Platformsemantiek: het zoningsproces dat door het systeem wordt gebruikt om een gesegmenteerd platform om te zetten in drie gedragsmatig zinvolle regio’s. De resulterende muur-nabije, gele-lijn-nabije en tunnel-aangrenzende zones bieden de ruimtelijke context die wordt gebruikt om passagiersbewegingen en risicogerelateerd gedrag te evalueren.

De resulterende segmentatiekaart wordt gebruikt om de platformgrenzen te schatten en drie operationele gebieden te definiëren: een muur-nabije zone nabij de platformmuur; een gele-lijn-nabije zone waar passagiers het platform kunnen naderen terwijl ze binnen de veiligheidsgebieden blijven; en een platform-ver-uiteinde-zone dichtst bij de tunnelingang.

Deze zones bieden de ruimtelijke context die nodig is om gedragingen te identificeren die psychologische studies hebben geassocieerd met verhoogd zelfmoordrisico. In het bijzonder stellen ze het systeem in staat om herhaaldelijk bewegen tussen de muur en de gele lijn te detecteren, evenals toegang tot het verste gebied van het platform.

In combinatie met de eerder gegenereerde trajectheatmaps worden deze ruimtelijke indicatoren later opgenomen in de definitieve zelfmoordrisicobeoordeling.

Interessant is dat het paper vermeldt dat een van de kenmerken van zelfmoordpogingen is de neiging om een voorwerp op het platform achter te laten; echter, de auteurs konden dit niet incorporeren in deze versie van het project, en laten het voor toekomstig onderzoek.

Een kaart van platformrisico

In plaats van te vertrouwen op het gedrag van één persoon, combineert het kader ook trajectheatmaps van meerdere bekende risicovolle gevallen om een platformbrede ‘positierisicokaart’ te creëren:

Het opbouwen van een platformrisicokaart vanuit de bewegingen van meerdere risicovolle passagiers. Gebieden die herhaaldelijk treuzelen, heen en weer lopen of ander risicogerelateerd gedrag aantrekken, worden steeds prominenter en worden later gebruikt als één factor in de definitieve risicobeoordeling.

Het opbouwen van een platformrisicokaart vanuit de bewegingen van meerdere risicovolle passagiers. Gebieden die herhaaldelijk treuzelen, heen en weer lopen of ander risicogerelateerd gedrag aantrekken, worden steeds prominenter en worden later gebruikt als één factor in de definitieve risicobeoordeling.

Gebieden die herhaaldelijk langdurig worden bezocht, komen naar voren als hoger-risicogebieden, terwijl locaties die worden geassocieerd met korte of zeldzame bezoeken, lager-risicogebieden blijven. De resulterende positierisicoscore wordt één van de invoerwaarden die in de definitieve zelfmoordrisicobeoordeling worden gebruikt.

De definitieve risicoscore is gebaseerd op acht indicatoren die in de loop van de tijd zijn opgebouwd: een positierisicoscore afgeleid van de platformheatmaps; of een passagier over de gele lijn loopt of staat; het aantal gele-lijnkruisingen; de totale tijd doorgebracht op de gele lijn; de langste ononderbroken periode doorgebracht op de gele lijn; herhaaldelijk heen en weer lopen tussen de muur en de gele lijn; herhaaldelijk oriënteren naar de tunnel; en toegang tot het tunnel-aangrenzende uiteinde van het platform.

Deze gedrags- en ruimtelijke signalen worden vervolgens gecombineerd via een XGBoost-model, waardoor een continue bijgewerkte zelfmoordrisicoschatting voor elke individu op het platform wordt gegenereerd.

Gegevens en tests

Er werden tests uitgevoerd op surveillancebeelden die door de Société de transport de Montréal (STM) werden geleverd, bestaande uit 66 opnames van vijf minuten die waren gemaakt voordat echte zelfmoordpogingen plaatsvonden, samen met 56 controlegegevens van dezelfde camera’s, op vergelijkbare tijdstippen waarop geen zelfmoordpoging plaatsvond.

Met de hulp van psychologie en experts in zelfmoordgedrag werden individuele passagiers geannoteerd op basis van of ze in een risicovolle of controlegroep vielen, waardoor een dataset van 256 individuen ontstond, waarvan 66 waren geassocieerd met zelfmoordpogingen en 190 waren toegewezen aan de controlegroep.

Om gegevenslekkage te voorkomen, werden alle individuen die uit dezelfde opname waren geëxtraheerd, toegewezen aan dezelfde gegevens split, waarbij 75% van de gegevens werd gebruikt voor training en 25% werd gereserveerd voor testen, terwijl het evenwicht tussen risicovolle en controlegroepen werd behouden.

De XGBoost-classificator werd getraind voor 300 boost-iteraties, bij een leer tempo van 0,05, met subsampling voor zowel trainingsinstanties als kenmerken, om generalisatie te verbeteren. Omdat de dataset aanzienlijk meer controlegroepen bevat dan risicovolle gevallen, compenseerde het trainingsproces hiervoor door extra gewicht toe te kennen aan de minderheidsklasse.

De prestaties werden voornamelijk beoordeeld met behulp van de Area Under the Receiver Operating Characteristic Curve (ROC-AUC), die meet hoe effectief het systeem risicovolle en controlegroepen onderscheidt.

Extra metrics omvatten gevoeligheid, die de juiste identificatie van risicovolle gevallen meet; specificiteit, die de juiste identificatie van controlegroepen meet; vals-positief tarief, dat valse alarmen (FPR) weerspiegelt; en vals-negatief tarief, dat gemiste detecties (FNR) weerspiegelt. Een bewust lage beslissingsdrempel werd aangenomen om vroegtijdige identificatie van potentieel risicovolle situaties te prioriteren:

Prestatie van het zelfmoordrisicobeoordelingskader onder vier configuraties, waarin grondwaarheid-geassisteerde, bovengrens- en volledig geautomatiseerde varianten worden vergeleken over ROC-AUC, gevoeligheid, specificiteit, vals-alarmtarief en gemiste-detectietarief – en de prestatie-impact van het vervangen van grondwaarheidannotaties met geautomatiseerde detectie-, volg- en activiteitherkenningsmodules.

Prestatie van het zelfmoordrisicobeoordelingskader onder vier configuraties, waarin grondwaarheid-geassisteerde, bovengrens- en volledig geautomatiseerde varianten worden vergeleken over ROC-AUC, gevoeligheid, specificiteit, vals-alarmtarief en gemiste-detectietarief – en de prestatie-impact van het vervangen van grondwaarheidannotaties met geautomatiseerde detectie-, volg- en activiteitherkenningsmodules.

Zoals te zien is in de initiële resultaatentabel hierboven, bereikte het volledig geautomatiseerde systeem een ROC-AUC van 0,832, terwijl het vervangen van de geautomatiseerde detectie- en volgcomponenten met grondwaarheidannotaties de prestaties verhoogde tot 0,919.

Het vervangen van alleen de activiteitherkenningsmodule produceerde een kleinere toename, waardoor de ROC-AUC steeg tot 0,893. De hoogste score, 0,924, werd behaald toen alle invoerwaarden van grondwaarheidannotaties werden geleverd, wat suggereert dat detectie, volgen en downstream-indicator-extractie de belangrijkste bronnen van fouten in de huidige pijplijn blijven.

De analyse van het getrainde XGBoost-model toonde aan dat directe interactie met de gele lijn een van de sterkste voorspellers van verhoogd risico was, gevolgd door het aantal gele-lijnkruisingen, en herhaaldelijk heen en weer lopen tussen platformzones. Tijd doorgebracht op de gele lijn en de positierisicoscore droegen ook aanzienlijk bij, terwijl tunnelgerichte aandacht en toegang tot het verste uiteinde van het platform extra, maar minder beslissende signalen boden.

Terugkerend naar de kwalitatieve resultaten die eerder in het artikel werden getoond, wees het kader hoge risicoscores toe aan individuen die later werden geassocieerd met zelfmoordpogingen, terwijl omringende controlegroepen aanzienlijk lagere scores kregen:

Zoals eerder in het artikel getoond, tonen de kwalitatieve resultaten in het paper de voorspellingsresultaten van twee beelden uit surveillancegegevens, met heatmaps aan weerszijden om treuzelen en andere platformactiviteiten aan te geven.

Zoals eerder in het artikel getoond, tonen de kwalitatieve resultaten in het paper de voorspellingsresultaten van twee beelden uit surveillancegegevens, met heatmaps aan weerszijden om treuzelen en andere platformactiviteiten aan te geven.

In één geval werd een risicoscore van 0,98 gekoppeld aan langdurig aanwezig zijn op de gele lijn en bezetting van gebieden die door de positierisicokaart als hoogrisico werden geïdentificeerd. In een ander geval kreeg een risicovolle persoon een score van 0,92, terwijl omringende controlegroepen aanzienlijk lagere schattingen kregen.

Volgens de auteurs komen deze onderscheiden vormen voort uit de accumulatie van meerdere indicatoren, in plaats van één enkel gedrag. Langdurig kruisen van de gele lijn, herhaaldelijk oriënteren naar de tunnel en langdurig aanwezig zijn in hoogrisicogebieden van het platform dragen allemaal bij aan verhoogde risicoschattingen.

De auteurs concluderen:

‘Verder dan de prestaties, benadrukt ons onderzoek interpreteerbaarheid, waaruit blijkt dat risicobeoordelingen worden aangedreven door intuïtieve indicatoren die aansluiten bij gevestigde gedrags- en ruimtelijke risicofactoren.

‘Dit positioneert het voorgestelde kader als een zinvolle brug tussen AI-gebaseerde surveillance-systemen en interdisciplinair onderzoek naar zelfmoordpreventie.’

Conclusie

Op een persoonlijke noot is het een steeds zeldzamere opluchting om een AI-paper te vinden dat het waard is om over te rapporteren en dat niet waarschijnlijk een brandbaar reactie zal veroorzaken bij een deel van de bevolking, aangezien het moeilijk zou zijn om de waarde van de doelen achter dit soort projecten in twijfel te trekken.

Op een praktische noot is de zeer kleine hoeveelheid pixels die door het hoofd wordt ingenomen, en de relatief kleine hoeveelheid schermruimte die door de hele persoon in beslag wordt genomen in dit scenario, het zeer moeilijk om te bepalen of de persoon vaak naar de tunnel kijkt – één van de waarschuwingsignalen van een potentiële treinselfmoord.

Als altijd, in projecten met betrekking tot surveillance-infrastructuur, lijkt dit een kwestie van resolutie en middelen: als er meer camera’s op meer frequentie-intervallen het platform zouden bedekken, inclusief één die specifiek de tunneluitgang (d.w.z. het tunnelaspect van waaruit een metrotrein plotseling verschijnt) zou bestrijken, zou er ruimte zijn om enkele van de verschillende en voortdurend ontwikkelde kaders rond kijkrichting te betrekken. Zoals het er nu uitziet, vertrouwt de huidige werk op het evalueren van de gehele richting van het lichaam om aan te geven dat het onderwerp de tunnel bekijkt.

Uiteindelijk is het een kwestie van budget, tenminste voor zover het gaat om spoorweg-infrastructuur; als alle platforms waren uitgerust met barrières en poorten – kenmerken die zelden voorkomen in Londen Underground-stops en in de metronetwerken van andere steden over de hele wereld – dan zouden de platforms geen gelegenheid bieden voor zelfbeschadiging.

Zeker, verhoogde surveillance is de goedkopere optie, en vroegtijdige identificatie van kenmerkende tekenen van zelfbeschadiging zou directe interventie mogelijk maken voordat een tragedie plaatsvindt.

 

Publicatie op dinsdag 9 juni 2026

Schrijver over machine learning, domeinspecialist in menselijke beeldsynthese. Voormalig hoofd onderzoekscontent bij Metaphysic.ai.