Angolo di Anderson

Prevenire e anticipare le tragedie nelle piattaforme della metropolitana con l’AI

mm
AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

Un sistema di intelligenza artificiale addestrato su immagini di sorveglianza reali della metropolitana afferma di poter rilevare i segni di allarme di un tentativo di suicidio alcuni minuti prima che accada, monitorando comportamenti come il camminare avanti e indietro, il sostare ai margini della piattaforma e il guardare ripetutamente nel tunnel.

 

I sistemi di apprendimento automatico sono stati sperimentati come sistemi di monitoraggio degli eventi sulla piattaforma da alcuni anni, di solito con alcune variazioni della popolare serie di applicazioni di riconoscimento di immagini You Only Look Once (YOLO) che alimentano scenari in cui i pedoni potrebbero essere caduti, o un crimine sta essere commesso, o dove la piattaforma della stazione è semplicemente sovraffollata (consentendo alle autorità della stazione di regolare l’accesso e risolvere il problema).

Dal paper del 2024 'Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach', le fasi con cui YOLOV7 identifica i passeggeri su una piattaforma. Fonte - https://www.mdpi.com/1424-8220/24/11/3377

Dal paper del 2024 ‘Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach’, le fasi con cui YOLOV7 identifica i passeggeri su una piattaforma. Fonte

Con l’aumento del numero di tentativi di suicidio o di suicidi riusciti negli ultimi 3-5 anni (in regioni come il Regno Unito, il Canada e i Paesi Bassi), è cresciuto l’interesse per il potenziale dei sistemi di apprendimento automatico per identificare comportamenti inclini al suicidio sulle piattaforme ferroviarie e metropolitane, in base alla disposizione e a diversi altri fattori:

Dwellers on the threshold: esempio di dati dal set di dati che alimenta il progetto STARR, che figura nel nuovo paper in discussione in questo articolo. Fonte - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Dwellers on the threshold: esempio di dati dal set di dati che alimenta il progetto STARR, che figura nel nuovo paper in discussione in questo articolo. Fonte

In aggregato, la varietà di progetti che cercano di sfruttare l’AI per comportamenti suicidi sulla piattaforma non ha ancora adottato una metodologia uniforme o un sistema sottostante comune o un approccio comune – non meno perché i metodi che alimentano tali sistemi sono in continua evoluzione, insieme alle conoscenze psicologiche e psichiatriche che forniscono insight a questo tipo di sorveglianza AI.

Avanguardia

Ora, uno studio canadese propone una formalizzazione di questo filone nella letteratura di ricerca, come Valutazione del rischio di suicidio (SRA), nel contesto dei tentativi di suicidio nelle stazioni della metropolitana.

In collaborazione con le autorità dei trasporti di Montréal, i ricercatori coinvolti nello studio hanno avuto accesso a immagini di 66 tentativi di suicidio reali, come catturati dalle telecamere della piattaforma nell’ambito delle autorità:

Dal nuovo paper, previsioni di output da due frame, uno che rappresenta un vero tentativo di suicidio ferroviario e l'altro no. Su entrambi i lati di ogni immagine è rappresentata una mappa di calore di aree pericolose e più sicure nella piattaforma sotto sorveglianza, rappresentando in ogni caso la 'tendenza a sostare' di una persona in relazione alla bocca del tunnel. Fonte - https://arxiv.org/pdf/2605.22904

Dal nuovo paper, previsioni di output da due frame, uno che rappresenta un vero tentativo di suicidio ferroviario e l’altro no. Su entrambi i lati di ogni immagine è rappresentata una mappa di calore di aree pericolose e più sicure nella piattaforma sotto sorveglianza, rappresentando in ogni caso la ‘tendenza a sostare’ di una persona in relazione alla bocca del tunnel, interpretata attraverso la conoscenza storica delle tendenze dei veri ‘saltatori’. Fonte

Sebbene fosse necessario affrontare artificialmente lo squilibrio delle classi che si verifica con un set di dati di verità terra così limitato, questo è comunque un dato raro a un volume fattibile; si potrebbe sperare che futuri progetti da parte delle autorità dei trasporti di tutto il mondo potrebbero consentire un set di dati mult paese con un volume più alto di esempi. Tuttavia, comprensibilmente, la natura estremamente sensibile di tali immagini rende questo più di una prospettiva casuale o facile.

L’iniziativa, gli autori sostengono, è la prima a fondere i diversi compiti che definiscono l’inseguimento in uno schema, e porta con sé un nuovo punto di riferimento per lo scenario di suicidio sulla piattaforma della metropolitana.

Gli autori affermano:

‘A differenza degli approcci che si concentrano su sottocompiti isolati o cercano di inferire direttamente l’intento, la nostra formulazione valuta il rischio di suicidio sulla base di prove accumulate incorporando il tracciamento della persona, il riconoscimento dell’attività, la segmentazione semantica della piattaforma e la modellazione della mappa di calore del rischio basata sulla traiettoria.

‘Formalizzando la SRA come un compito distinto e creando un punto di riferimento per una pipeline operativa completa che raggiunge un ROC-AUC dell’83,2% sui dati di sorveglianza reali, questo lavoro sottolinea la complessità della valutazione del rischio di suicidio e apre nuove direzioni per la ricerca su sistemi di intelligenza artificiale interpretabili per il bene sociale.’

Il nuovo paper si intitola Valutazione del rischio di suicidio da sorveglianza video alimentata da AI: un framework interpretabile per la prevenzione nelle stazioni della metropolitana e proviene da quattro autori di Université TÉLUQ, Polytechnique Montréal e Université du Québec à Montréal.

Metodo

La cornice degli autori analizza un flusso di video di sorveglianza in tempo reale per generare un punteggio di rischio di suicidio continuamente aggiornato per ogni passeggero tracciato. Le persone vengono rilevate, tracciate e convertite in rappresentazioni di pose del corpo semplificate, dopo di che un sistema di riconoscimento dell’attività basato su scheletro identifica azioni su brevi periodi di tempo:

Pipeline di sistema per la stima del rischio di suicidio dei passeggeri da video di sorveglianza, mostrando come il tracciamento, la stima della pose, il riconoscimento dell'attività, la zonizzazione della piattaforma e le mappe di calore della traiettoria siano combinati per convertire i movimenti e i comportamenti individuali in un punteggio di rischio continuamente aggiornato per ogni persona sulla piattaforma.

Pipeline di sistema per la stima del rischio di suicidio dei passeggeri da video di sorveglianza, mostrando come il tracciamento, la stima della pose, il riconoscimento dell’attività, la zonizzazione della piattaforma e le mappe di calore della traiettoria siano combinati per convertire i movimenti e i comportamenti individuali in un punteggio di rischio continuamente aggiornato per ogni persona sulla piattaforma.

La piattaforma viene quindi divisa in zone significative, consentendo di rilevare modelli di movimento come il camminare avanti e indietro tra diverse aree. Le traiettorie dei passeggeri vengono proiettate su una mappa della piattaforma, rendendo possibile generare mappe di calore che evidenziano le aree più frequentate o attraversate da persone associate a un rischio elevato.

Infine, il sistema incrocia questi modelli spaziali con comportamenti osservati per produrre una valutazione individuale del rischio di suicidio per ogni persona sulla piattaforma – un processo che gli autori chiamano inferenza del rischio.

Gli autori hanno utilizzato un’implementazione pre-addestrata di YOLOX come rilevatore di persone per il loro sistema, scoprendo che il suo stato predefinito è perfettamente utilizzabile per questo scopo. ByteTrack è stato utilizzato per orchestrare il tracciamento multi-oggetto.

Ogni persona individuata da questi processi viene assegnata il proprio modello HRNet pre-addestrato, fornendo stima delle articolazioni e punti chiave del corpo 2D all’interno di un rettangolo di delimitazione determinato dalle stime più esterne:

Esempi di stima delle articolazioni da HRNet, utilizzato nel nuovo progetto. Fonte - https://github.com/HRNet

Esempi di stima delle articolazioni da HRNet, utilizzato nel nuovo progetto. Fonte

Le pose valutate dai dati video della piattaforma della metropolitana vengono costruite in mappe cumulative che definiscono il movimento storico (vedere le ‘mappe di calore della piattaforma’ sul lato dell’immagine precedente).

Il nuovo sistema incorpora il framework STARR, un lavoro precedente progettato per valutare la probabilità di comportamento suicidario sulle piattaforme:

Stima della pose dal framework STARR. Fonte - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Stima della pose dal framework STARR. Fonte

In questo caso, STARR viene utilizzato per rilevare tre annotazioni di azioni di passeggeri autoesplicative: GuardaTunnel; Cammina; e Fermo.

Per incorporare il contesto ambientale, la concezione del sistema della piattaforma è divisa in zone semanticamente significative utilizzando un modello di segmentazione semantica YOLOv8n addestrato su immagini della piattaforma annotate manualmente:

Semantica della piattaforma: il processo di zonizzazione utilizzato dal sistema per convertire una piattaforma segmentata in tre regioni comportamentali significative. Le regioni risultanti vicine al muro, vicine alla linea gialla e vicine al tunnel forniscono il contesto spaziale utilizzato per valutare i movimenti e i comportamenti dei passeggeri legati al rischio.

semantica della piattaforma: il processo di zonizzazione utilizzato dal sistema per convertire una piattaforma segmentata in tre regioni comportamentali significative. Le regioni risultanti vicine al muro, vicine alla linea gialla e vicine al tunnel forniscono il contesto spaziale utilizzato per valutare i movimenti e i comportamenti dei passeggeri legati al rischio.

La mappa di segmentazione risultante viene utilizzata per stimare i confini della piattaforma e definire tre aree operative: una zona vicina al muro vicino al muro della piattaforma; una zona vicina alla linea gialla dove i passeggeri possono avvicinarsi al bordo della piattaforma restando all’interno dei confini di sicurezza; e una zona lontana dalla piattaforma più vicina all’ingresso del tunnel.

Queste zone forniscono il contesto spaziale necessario per identificare comportamenti che gli studi psicologici hanno associato a un rischio di suicidio elevato. In particolare, consentono al sistema di rilevare movimenti ripetuti tra il muro e la linea gialla, insieme all’ingresso nella zona più lontana della piattaforma.

Combinate con le mappe di calore della traiettoria generate in precedenza, questi indicatori spaziali vengono successivamente incorporati nella valutazione finale del rischio di suicidio.

Interessantemente, il paper nota che un segno distintivo dei tentativi di suicidio è la tendenza a lasciare un oggetto sulla piattaforma; tuttavia, gli autori non sono stati in grado di incorporare questo nella versione attuale del progetto, lasciandolo per lavori futuri.

Mappa del rischio della piattaforma

Piuttosto che affidarsi solo al comportamento di una singola persona, la cornice combina anche mappe di calore della traiettoria da più casi noti a rischio per creare una ‘mappa del rischio della piattaforma’ a livello di piattaforma:

Creazione di una mappa del rischio della piattaforma dai movimenti di più passeggeri a rischio. Le aree che attirano sistematicamente la presenza prolungata, il camminare avanti e indietro o altri comportamenti associati al rischio diventano sempre più prominenti e vengono successivamente utilizzate come uno dei fattori nella valutazione finale del rischio.

Creazione di una mappa del rischio della piattaforma dai movimenti di più passeggeri a rischio. Le aree che attirano sistematicamente la presenza prolungata, il camminare avanti e indietro o altri comportamenti associati al rischio diventano sempre più prominenti e vengono successivamente utilizzate come uno dei fattori nella valutazione finale del rischio.

Le aree che attirano sistematicamente la presenza prolungata emergono come regioni ad alto rischio, mentre le ubicazioni associate a brevi o infrequenti visite rimangono a basso rischio. Il punteggio di rischio per posizione che ne risulta diventa uno degli input utilizzati nella valutazione finale del rischio di suicidio.

Il punteggio di rischio finale si basa su otto indicatori accumulati nel tempo: un punteggio di rischio per posizione derivato dalle mappe di calore della piattaforma; se un passeggero cammina o si ferma sulla linea gialla; il numero di attraversamenti della linea gialla; il tempo totale trascorso sulla linea gialla; il periodo più lungo di tempo trascorso ininterrottamente sulla linea gialla; movimento ripetuto avanti e indietro tra il muro e la linea gialla; orientamento ripetuto verso il tunnel; e ingresso nella zona adiacente al tunnel della piattaforma.

Questi segnali comportamentali e spaziali vengono quindi combinati tramite un modello XGBoost, producendo una stima del rischio di suicidio continuamente aggiornata per ogni individuo sulla piattaforma.

Dati e test

I test sono stati condotti su immagini di sorveglianza fornite dalla Société de transport de Montréal (STM), che comprendevano 66 registrazioni di cinque minuti catturate prima di tentativi di suicidio reali, insieme a 56 registrazioni di controllo dalle stesse telecamere, in momenti simili in cui non si è verificato alcun tentativo di suicidio.

Con l’aiuto di esperti di psicologia e comportamento suicidario, i passeggeri individuali sono stati annotati in base al fatto che apparivano in uno scenario a rischio o di controllo, producendo un set di dati di 256 individui, di cui 66 associati a casi di tentativi di suicidio e 190 assegnati al gruppo di controllo.

Per prevenire la perdita di informazioni, tutti gli individui estratti dalla stessa registrazione sono stati assegnati alla stessa divisione dei dati, con il 75% dei dati utilizzati per l’addestramento e il 25% riservato per il test, mantenendo l’equilibrio tra casi a rischio e di controllo.

Il classificatore XGBoost è stato addestrato per 300 iterazioni di boosting, a un tasso di apprendimento di 0,05, con campionamento per istanze di addestramento e caratteristiche, per migliorare la generalizzazione. Poiché il set di dati contiene sostanzialmente più casi di controllo che casi a rischio, il processo di addestramento ha compensato questo assegnando peso aggiuntivo alla classe minoritaria.

Le prestazioni sono state valutate principalmente utilizzando l’Area Under the Receiver Operating Characteristic Curve (ROC-AUC), che misura quanto efficacemente il sistema distingue tra individui a rischio e di controllo.

Altri metriche comprendevano sensibilità, che misura l’identificazione corretta dei casi a rischio; specificità, che misura l’identificazione corretta dei casi di controllo; falso tasso di positività, che riflette i falsi allarmi (FPR); e falso tasso di negatività, che riflette le rilevazioni mancate (FNR). Una soglia di decisione deliberatamente bassa è stata adottata per dare priorità all’identificazione precoce di situazioni potenzialmente a rischio:

Prestazioni del framework di valutazione del rischio di suicidio sotto quattro configurazioni, confrontando varianti assistite dalla verità terra, limite superiore e completamente automatizzate in ROC-AUC, sensibilità, specificità, tasso di falsi allarmi e tasso di rilevamento mancato – e mostrando l'impatto delle prestazioni sostituendo le annotazioni della verità terra con moduli di rilevamento, tracciamento e riconoscimento dell'attività automatizzati.

Prestazioni del framework di valutazione del rischio di suicidio sotto quattro configurazioni, confrontando varianti assistite dalla verità terra, limite superiore e completamente automatizzate in ROC-AUC, sensibilità, specificità, tasso di falsi allarmi e tasso di rilevamento mancato – e mostrando l’impatto delle prestazioni sostituendo le annotazioni della verità terra con moduli di rilevamento, tracciamento e riconoscimento dell’attività automatizzati.

Come si vede nella tabella dei risultati iniziali sopra, il sistema completamente automatizzato ha raggiunto un ROC-AUC di 0,832, mentre sostituire i componenti di rilevamento e tracciamento automatizzati con annotazioni della verità terra ha aumentato le prestazioni a 0,919.

Sostituire solo il modulo di riconoscimento dell’attività ha prodotto un guadagno più piccolo, aumentando il ROC-AUC a 0,893. Il punteggio più alto, 0,924, è stato ottenuto quando tutte le informazioni sono state fornite da annotazioni della verità terra, suggerendo che il rilevamento, il tracciamento e l’estrazione degli indicatori a valle rimangono le principali fonti di errore nella pipeline attuale.

L’analisi del modello XGBoost addestrato ha indicato che l’interazione diretta con la linea gialla era tra i predittori più forti di rischio elevato, seguito dal numero di attraversamenti della linea gialla e dal movimento ripetuto avanti e indietro tra le zone della piattaforma. Il tempo trascorso sulla linea gialla e il punteggio di rischio per posizione hanno contribuito in modo significativo, mentre l’attenzione rivolta al tunnel e l’ingresso nella zona più lontana della piattaforma hanno fornito segnali aggiuntivi, sebbene meno decisivi.

Ritornando ai risultati qualitativi presentati in precedenza, il framework ha assegnato punteggi di rischio elevati a individui successivamente associati a tentativi di suicidio, mentre assegnava punteggi di rischio sostanzialmente più bassi ai passeggeri di controllo circostanti:

Come visto in precedenza nell'articolo, i risultati qualitativi presentati nel paper presentano le previsioni di output di due immagini da dati di sorveglianza, con mappe di calore su entrambi i lati per indicare la permanenza e altre attività sulla piattaforma.

Come visto in precedenza nell’articolo, i risultati qualitativi presentati nel paper presentano le previsioni di output di due immagini da dati di sorveglianza, con mappe di calore su entrambi i lati per indicare la permanenza e altre attività sulla piattaforma.

In un caso, un punteggio di rischio di 0,98 è stato collegato a una presenza prolungata sulla linea gialla e all’occupazione di aree identificate come ad alto rischio dalla mappa di rischio per posizione. In un altro, un individuo a rischio ha ricevuto un punteggio di 0,92, mentre i passeggeri di controllo vicini hanno ricevuto stime molto più basse.

Secondo gli autori, queste distinzioni emergono dall’accumulo di più indicatori, piuttosto che da un singolo comportamento. L’attraversamento prolungato della linea gialla, l’orientamento ripetuto verso il tunnel e la presenza sostenuta in aree ad alto rischio della piattaforma contribuiscono tutti a stime di rischio elevate.

Gli autori concludono:

‘Oltre alle prestazioni, il nostro studio sottolinea l’interpretabilità, mostrando che le valutazioni del rischio sono guidate da indicatori intuitivi allineati con i fattori di rischio comportamentali e spaziali stabiliti.

‘Ciò posiziona il framework proposto come un ponte significativo tra i sistemi di sorveglianza basati sull’IA e la ricerca interdisciplinare sulla prevenzione del suicidio.’

Conclusione

Sulla base personale, è un sollievo sempre più raro trovare un paper sull’IA degno di essere segnalato che non sia probabile creare una reazione incendiaria in alcuna parte della popolazione, poiché sarebbe difficile contestare il valore degli obiettivi dietro questo tipo di progetto.

Sul piano pratico, la quantità molto piccola di pixel occupata dalla testa e la quantità relativamente piccola di spazio sullo schermo occupata dall’intera persona sotto sorveglianza in questo scenario rendono molto difficile capire se l’individuo sta guardando frequentemente nel tunnel – uno dei segni di allarme del potenziale suicidio ferroviario.

Come sempre, in progetti riguardanti l’infrastruttura di sorveglianza, questo sembra essere un problema di risoluzione e risorse: se ci fossero più telecamere a intervalli più frequenti che coprono la piattaforma, compresa una specificamente coperta dall’uscita del tunnel (cioè l’aspetto del tunnel da cui un treno della metropolitana appare improvvisamente), ci sarebbe la possibilità di coinvolgere alcuni dei vari framework in continua evoluzione sulla direzione dello sguardo. Come stanno le cose, il lavoro attuale si affida a valutare l’intera direzione del corpo per segnalare che il soggetto sta guardando il tunnel.

Infine, il problema è un problema di budget, almeno per quanto riguarda l’infrastruttura ferroviaria; se tutte le piattaforme fossero dotate di barriere e cancelli – caratteristiche che appaiono raramente nelle stazioni della metropolitana di Londra e nelle reti della metropolitana di altre città del mondo – allora le piattaforme non offrirebbero alcuna opportunità di autolesionismo.

Certo, una maggiore sorveglianza è l’opzione più economica, e l’identificazione precoce dei segni caratteristici dell’autolesionismo potrebbe consentire un intervento diretto prima che si verifichi una tragedia.

 

Pubblicato per la prima volta martedì 9 giugno 2026

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.