Andersons Blickwinkel

Vorhersage und Verhinderung von Metro-Plattform-Tragödien mit KI

mm
AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

Ein KI-System, das mit echten U-Bahn-Überwachungsvideos trainiert wurde, behauptet, es könne die Warnsignale eines Selbstmordversuchs Minuten vor dem Ereignis erkennen, indem es Verhaltensweisen wie Pacing, Verweilen am Plattformrand und wiederholtes Hineinschauen in den Tunnel verfolgt.

 

Machine-Learning-Systeme werden seit einigen Jahren als Plattform-Event-Überwachungssysteme getestet, meist mit einer Variation der beliebten You Only Look Once (YOLO)-Serie von Bilderkennungsanwendungen, die Szenarien ermöglichen, in denen Fußgänger möglicherweise gefallen sind oder ein Verbrechen begangen wird oder die Station Plattform einfach überfüllt ist (was es den Stationsbehörden ermöglicht, den Zugang zu regulieren und das Problem zu beheben).

Aus dem Paper von 2024 'Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach', die Stufen, mit denen YOLOV7 Passagiere auf einer Plattform identifiziert. Quelle - https://www.mdpi.com/1424-8220/24/11/3377

Aus dem Paper von 2024 ‘Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach’, die Stufen, mit denen YOLOV7 Passagiere auf einer Plattform identifiziert. Quelle

Da die Anzahl der versuchten oder erfolgreichen Eisenbahn-Selbstmorde in den letzten 3-5 Jahren (in Regionen wie dem Vereinigten Königreich, Kanada und den Niederlanden) zugenommen hat, ist das Interesse an der potenziellen Fähigkeit von Machine-Learning-Systemen zur Identifizierung von selbstmordgefährdetem Verhalten auf Schienen- und U-Bahn-Plattformen gestiegen, basierend auf Disposition und verschiedenen anderen Faktoren:

Bewohner der Schwelle: Beispiel-Daten aus dem Datensatz, der das STARR-Projekt antreibt, das in dem neuen Paper vorgestellt wird, das in diesem Artikel diskutiert wird. Quelle - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Bewohner der Schwelle: Beispiel-Daten aus dem Datensatz, der das STARR-Projekt antreibt, das in dem neuen Paper vorgestellt wird, das in diesem Artikel diskutiert wird. Quelle

Insgesamt haben die verschiedenen Projekte, die versuchen, KI für selbstmordgefährdetes Plattform-Verhalten zu nutzen, bisher keine einheitliche Methodik oder ein gemeinsames System oder einen gemeinsamen Ansatz entwickelt – nicht zuletzt, weil die Methoden, die solche Systeme antreiben, ständig weiterentwickelt werden, zusammen mit dem psychologischen und psychiatrischen Wissen, das Einblick in diese Art von KI-Überwachung gibt.

Spitzenleistung

Jetzt bietet eine neue Studie aus Kanada eine vorgeschlagene Formalisierung dieses Forschungsstrangs in der Literatur, als Suizid-Risiko-Bewertung (SRA), im Kontext von Selbstmordversuchen an U-Bahn-Stationen.

In Zusammenarbeit mit den Montrealer Verkehrsbetrieben erhielten die an der neuen Studie beteiligten Forscher Zugang zu Aufnahmen von 66 realen Selbstmordversuchen, die von den Kameras auf den Plattformen innerhalb des Zuständigkeitsbereichs der Behörden aufgenommen wurden:

Aus dem neuen Paper, Vorhersageergebnisse aus zwei Bildern, von denen eines einen echten Eisenbahn-Selbstmordversuch und das andere nicht darstellt. Auf jeder Seite der Bilder ist eine Wärmebildkarte von gefährlichen und sicheren Bereichen auf der überwachten Plattform abgebildet, die in jedem Fall die 'Verweilneigung' einer Person in Bezug auf den Tunnelmund darstellt, interpretiert durch historisches Wissen über die Neigungen echter 'Springer'.

Aus dem neuen Paper, Vorhersageergebnisse aus zwei Bildern, von denen eines einen echten Eisenbahn-Selbstmordversuch und das andere nicht darstellt. Quelle

Obwohl es notwendig war, den Klassenungleichgewicht zu adressieren, der bei einem solchen begrenzten Ground-Truth-Datensatz auftritt, handelt es sich dennoch um seltene Daten in einem gewissen Umfang; man könnte hoffen, dass zukünftige Projekte von Verkehrsbetrieben auf der ganzen Welt möglicherweise ein länderübergreifendes Datenset mit einer höheren Anzahl von Beispielen ermöglichen. Allerdings ist die extrem sensible Natur solcher Aufnahmen mehr als nur ein Casual oder einfaches Vorhaben.

Die Initiative, so behaupten die Autoren, ist die erste, die die verschiedenen Aufgaben, die diese Verfolgung definieren, in ein Schema zusammenfasst und bringt ein neues Benchmark für das U-Bahn-Plattform-Selbstmord-Szenario mit.

Die Autoren erklären:

‘Im Gegensatz zu Ansätzen, die sich auf isolierte Teilaufgaben konzentrieren oder versuchen, die Absicht direkt abzuleiten, bewertet unsere Formulierung das Suizid-Risiko durch akkumulierte Beweise, indem sie Personenerkennung, Aktivitätserkennung, semantische Segmentierung der Plattform und trajektoriengetriebene Risikowärmebild-Modellierung einbezieht.

‘Indem wir SRA als eine separate Aufgabe formalisieren und eine vollständige operative Pipeline benchmarken, die 83,2 % ROC-AUC auf echten Überwachungsvideos erreicht, unterstreicht diese Arbeit die Komplexität der Suizid-Risiko-Bewertung und eröffnet neue Forschungsrichtungen für interpretierbare KI-Systeme für den sozialen Nutzen.’

Das neue Paper trägt den Titel Suizid-Risiko-Bewertung aus KI-gesteuerter Video-Überwachung: Ein interpretierbares Framework für die Prävention in U-Bahn-Stationen und stammt von vier Autoren der Université TÉLUQ, Polytechnique Montréal und der Université du Québec à Montréal.

Methode

Das Framework der Autoren analysiert einen Live-Überwachungs-Videostream, um für jeden verfolgten Passagier einen kontinuierlich aktualisierten Suizid-Risiko-Score zu generieren. Personen werden erkannt, verfolgt und in vereinfachte Körperhaltungs-Darstellungen umgewandelt, wonach ein skeletonbasierter Aktivitätserkennungs-System Aktionen über kurze Zeiträume identifiziert:

System-Pipeline zur Schätzung des Suizid-Risikos von Passagieren aus Überwachungsvideos, die zeigt, wie Verfolgung, Körperhaltungs-Schätzung, Aktivitätserkennung, Plattform-Zonierung und Trajektorien-Wärmebilder kombiniert werden, um individuelle Bewegungen und Verhaltensweisen in einen kontinuierlich aktualisierten Risiko-Score für jede Person auf der Plattform umzuwandeln.

System-Pipeline zur Schätzung des Suizid-Risikos von Passagieren aus Überwachungsvideos, die zeigt, wie Verfolgung, Körperhaltungs-Schätzung, Aktivitätserkennung, Plattform-Zonierung und Trajektorien-Wärmebilder kombiniert werden, um individuelle Bewegungen und Verhaltensweisen in einen kontinuierlich aktualisierten Risiko-Score für jede Person auf der Plattform umzuwandeln.

Die Plattform wird dann in bedeutsame Zonen unterteilt, wodurch Bewegungsmuster wie wiederholtes Pacing zwischen verschiedenen Bereichen erkannt werden können. Passagier-Trajektorien werden auf eine Karte der Plattform projiziert, wodurch es möglich wird, Wärmebilder zu generieren, die die am häufigsten besetzten Bereiche oder die von Personen mit erhöhtem Risiko überquerten Bereiche hervorheben.

Schließlich kreuzt das System diese räumlichen Muster mit beobachteten Verhaltensweisen, um für jede Person auf der Plattform eine individuelle Suizid-Risiko-Bewertung zu erstellen – ein Prozess, den die Autoren als Risiko-Ableitung bezeichnen.

Die Autoren verwendeten eine vorgefertigte YOLOX-Implementierung als Personenerkennung für ihr System und stellten fest, dass ihr Out-of-the-Box-Zustand für diesen Zweck perfekt geeignet ist. ByteTrack wurde verwendet, um die Mehrobjekt-Verfolgung zu orchestrieren.

Jede durch diese Prozesse individuierte Person wird einer eigenen vorgefertigten HRNet-Modell zugeteilt, das Gelenkschätzung und 2D-Körper-Schlüsselpunkte innerhalb eines Begrenzungsrahmens bereitstellt, der durch die äußerste dieser Schätzungen bestimmt wird:

Beispiele für Gelenkschätzung aus HRNet, die im neuen Projekt verwendet werden. Quelle - https://github.com/HRNet

Beispiele für Gelenkschätzung aus HRNet, die im neuen Projekt verwendet werden. Quelle

Die aus Videodaten von der U-Bahn-Plattform abgeleiteten Körperhaltungen werden zu kumulativen Karten aufgebaut, die historische Bewegungen definieren (siehe die ‘Plattform-Wärmebilder’ an der Seite des früheren Bildes oben).

Das neue System integriert das STARR-Framework, eine vorherige Arbeit, die darauf abzielt, die Wahrscheinlichkeit suizidalem Verhaltens auf Plattformen zu bewerten:

Körperhaltungs-Schätzung aus dem STARR-Framework. Quelle - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Körperhaltungs-Schätzung aus dem STARR-Framework. Quelle

In diesem Fall wird STARR verwendet, um drei selbstverständliche Passagier-Aktivitäts-Anmerkungen zu erkennen: LookTunnel; Walk; und Stand.

Um Umgebungs-Kontext einzubeziehen, wird das Konzept der Plattform in semantisch bedeutsame Zonen unterteilt, indem ein YOLOv8n-Semantik-Segmentierungs-Modell auf manuell annotierten Plattform-Bildern trainiert wird:

Plattform-Semantik: Der Zonierungsprozess, der vom System verwendet wird, um eine segmentierte Plattform in drei verhaltensbedingt bedeutsame Regionen umzuwandeln. Die resultierenden wandnahen, gelbmarkierten und tunnelnahen Zonen liefern den räumlichen Kontext, der zur Bewertung von Passagier-Bewegungen und risikobezogenem Verhalten verwendet wird.

Plattform-Semantik: Der Zonierungsprozess, der vom System verwendet wird, um eine segmentierte Plattform in drei verhaltensbedingt bedeutsame Regionen umzuwandeln.

Die resultierende Segmentierungskarte wird verwendet, um die Plattform-Grenzen zu schätzen und drei operative Bereiche zu definieren: Eine wandnahe Zone in der Nähe der Plattform-Wand; eine gelbmarkierte Zone, in der Passagiere die Plattform-Kante erreichen können, während sie innerhalb der Sicherheitsgrenzen bleiben; und eine Plattform-Endzone in der Nähe des Tunnel-Eingangs.

Diese Zonen liefern den räumlichen Kontext, der erforderlich ist, um Verhaltensweisen zu identifizieren, die psychologische Studien mit erhöhtem Suizid-Risiko in Verbindung gebracht haben. Insbesondere ermöglichen sie es dem System, wiederholte Bewegungen zwischen der Wand und der gelben Linie zu erkennen, sowie das Betreten der Endzone der Plattform.

Die Kombination dieser räumlichen Indikatoren mit den zuvor generierten Trajektorien-Wärmebildern wird später in die endgültige Suizid-Risiko-Bewertung einbezogen.

Interessanterweise vermerkt das Paper, dass ein Merkmal von Selbstmordversuchen die Tendenz ist, ein Objekt auf der Plattform zu lassen; jedoch konnten die Autoren dies in dieser Version des Projekts nicht einbeziehen, was sie für zukünftige Arbeiten vorbehalten.

Eine Karte des Plattform-Risikos

Anstatt sich nur auf das Verhalten einer einzelnen Person zu verlassen, kombiniert das Framework auch Trajektorien-Wärmebilder aus mehreren bekannten Risikofällen, um eine plattformweite ‘Position-Risiko-Wärmebildkarte’ zu erstellen:

Erstellung einer Plattform-Risiko-Karte aus den Bewegungen mehrerer risikobehafteter Passagiere. Bereiche, die wiederholt von Verweil-, Pacing- oder anderen risikobezogenen Verhaltensweisen angezogen werden, werden zunehmend prominent und werden später als ein Faktor in der endgültigen Risiko-Bewertung verwendet.

Erstellung einer Plattform-Risiko-Karte aus den Bewegungen mehrerer risikobehafteter Passagiere.

Bereiche, die wiederholt von längerem Aufenthalt angezogen werden, treten als höher risikobehaftete Regionen hervor, während Orte, die mit kurzen oder seltenen Besuchen assoziiert sind, als niedriger risikobehaftet bleiben. Der resultierende Position-Risiko-Score wird zu einem der Eingaben, die in der endgültigen Suizid-Risiko-Bewertung verwendet werden.

Der endgültige Risiko-Score basiert auf acht Indikatoren, die über die Zeit akkumuliert werden: Ein Position-Risiko-Score, der aus den Plattform-Wärmebildern abgeleitet wird; ob ein Passagier auf der gelben Linie geht oder steht; die Anzahl der gelben Linienübergänge; die Gesamtzeit, die auf der gelben Linie verbracht wird; die längste ununterbrochene Zeit, die auf der gelben Linie verbracht wird; wiederholte hin- und her-Bewegungen zwischen der Wand und der gelben Linie; wiederholte Ausrichtung auf den Tunnel; und das Betreten der tunnelnahen Endzone der Plattform.

Diese Verhaltens- und räumlichen Signale werden dann mittels eines XGBoost-Modells kombiniert, um für jede Person auf der Plattform eine kontinuierlich aktualisierte Suizid-Risiko-Schätzung zu erzeugen.

Daten und Tests

Tests wurden mit Überwachungsvideos durchgeführt, die von der Société de transport de Montréal (STM) bereitgestellt wurden, bestehend aus 66 fünfminütigen Aufnahmen, die vor echten Selbstmordversuchen aufgenommen wurden, zusammen mit 56 passenden Kontrollaufnahmen von den gleichen Kameras, zu vergleichbaren Zeiten, wenn kein Selbstmordversuch stattfand.

Mithilfe von Psychologie- und Suizid-Verhaltens-Experten wurden einzelne Passagiere annotiert, um zu bestimmen, ob sie in einem risikobehafteten oder Kontroll-Szenario erschienen, was ein Datenset von 256 Personen ergab, von denen 66 mit Selbstmordversuch-Fällen assoziiert waren und 190 der Kontrollgruppe zugewiesen wurden.

Um Informations-Leckagen zu vermeiden, wurden alle Personen, die aus der gleichen Aufnahme extrahiert wurden, der gleichen Datensplit-Zuweisung zugewiesen, wobei 75 % der Daten für die Ausbildung und 25 % für die Tests verwendet wurden, während die Balance zwischen risikobehafteten und Kontrollfällen erhalten blieb.

Der XGBoost-Klassifizierer wurde für 300 Boosting-Iterationen mit einer Lernrate von 0,05 trainiert, mit Subsampling für sowohl Trainings- als auch Merkmals-Instanzen, um die Verallgemeinerung zu verbessern. Da das Datenset wesentlich mehr Kontrollfälle als risikobehaftete Fälle enthält, kompensierte der Trainingsprozess dies, indem er der Minderheitsklasse zusätzliches Gewicht zuwies.

Die Leistung wurde hauptsächlich unter Verwendung der Fläche unter der Receiver-Operating-Charakteristik-Kurve (ROC-AUC) bewertet, die misst, wie effektiv das System zwischen risikobehafteten und Kontroll-Individuen unterscheidet.

Weitere Metriken umfassten Empfindlichkeit, die die richtige Identifizierung von risikobehafteten Fällen misst; Spezifität, die die richtige Identifizierung von Kontrollfällen misst; falsch-positiver Rate, der falschen Alarme (FPR) widerspiegelt; und falsch-negativer Rate, der verpassten Erkennungen (FNR) widerspiegelt. Ein bewusst niedriger Entscheidungsschwellenwert wurde angenommen, um die frühzeitige Identifizierung potenziell risikobehafteter Situationen zu priorisieren:

Leistung des Suizid-Risiko-Bewertungs-Frameworks unter vier Konfigurationen, die ground-truth-unterstützte, obere Grenze und vollautomatische Varianten über ROC-AUC, Empfindlichkeit, Spezifität, Falsch-Alarm-Rate und Fehl-Erkennungs-Rate vergleichen – und die Leistungs-Einflüsse des Ersetzens von ground-truth-Anmerkungen durch automatisierte Erkennungs-, Verfolgungs- und Aktivitätserkennungs-Module zeigen.

Leistung des Suizid-Risiko-Bewertungs-Frameworks unter vier Konfigurationen, die ground-truth-unterstützte, obere Grenze und vollautomatische Varianten über ROC-AUC, Empfindlichkeit, Spezifität, Falsch-Alarm-Rate und Fehl-Erkennungs-Rate vergleichen.

Wie in der obigen Ergebnis-Tabelle zu sehen ist, erreichte das vollautomatische System eine ROC-AUC von 0,832, während das Ersetzen der automatisierten Erkennungs- und Verfolgungskomponenten durch ground-truth-Anmerkungen die Leistung auf 0,919 erhöhte.

Das Ersetzen nur des Aktivitätserkennungs-Moduls führte zu einem geringeren Gewinn, der die ROC-AUC auf 0,893 erhöhte. Der höchste Score, 0,924, wurde erzielt, als alle Eingaben von ground-truth-Anmerkungen bereitgestellt wurden, was darauf hindeutet, dass Erkennung, Verfolgung und Downstream-Indikator-Extraktion die Hauptquellen des Fehlers in der aktuellen Pipeline bleiben.

Die Analyse des trainierten XGBoost-Modells zeigte, dass direkte Interaktion mit der gelben Linie unter den stärksten Prädiktoren für erhöhtes Risiko war, gefolgt von der Anzahl der gelben Linienübergänge und wiederholter hin- und her-Bewegung zwischen Plattform-Zonen. Die Zeit, die auf der gelben Linie verbracht wird, und der Position-Risiko-Score trugen ebenfalls erheblich bei, während tunnelgerichtete Aufmerksamkeit und das Betreten der Endzone der Plattform zusätzliche, aber weniger entscheidende Signale lieferten.

Bei der Rückkehr zu den qualitativen Ergebnissen, die oben vorgestellt wurden, wies das Framework hohe Risiko-Scores zu, die später mit Selbstmordversuchen in Verbindung gebracht wurden, während es für umliegende Kontroll-Passagiere wesentlich niedrigere Scores zuwies:

Wie oben im Artikel gezeigt, zeigen die qualitativen Ergebnisse im Paper die Ausgabe-Vorhersagen von zwei Bildern aus Überwachungs-Daten, mit Wärmebildern auf jeder Seite, die Verweil- und andere Plattform-Aktivitäten anzeigen.

Wie oben im Artikel gezeigt, zeigen die qualitativen Ergebnisse im Paper die Ausgabe-Vorhersagen von zwei Bildern aus Überwachungs-Daten, mit Wärmebildern auf jeder Seite, die Verweil- und andere Plattform-Aktivitäten anzeigen.

In einem Fall wurde ein Risiko-Score von 0,98 mit einem längeren Aufenthalt auf der gelben Linie und der Besetzung von Bereichen in Verbindung gebracht, die vom Position-Risiko-Wärmebild als hochrisikobehaftet identifiziert wurden. In einem anderen Fall erhielt eine risikobehaftete Person einen Score von 0,92, während nahegelegene Kontroll-Passagiere wesentlich niedrigere Schätzungen erhielten.

Laut den Autoren treten diese Unterscheidungen durch die Akkumulation mehrerer Indikatoren auf, anstatt durch ein einzelnes Verhalten. Längeres Überqueren der gelben Linie, wiederholte Ausrichtung auf den Tunnel und anhaltendes Verweilen in hochrisikobehafteten Bereichen der Plattform tragen alle zum erhöhten Risiko bei.

Die Autoren schlussfolgern:

‘Über die Leistung hinaus betont unsere Studie die Interpretierbarkeit und zeigt, dass Risiko-Bewertungen durch intuitive Indikatoren angetrieben werden, die mit etablierten Verhaltens- und räumlichen Risikofaktoren übereinstimmen.

‘Dies positioniert das vorgeschlagene Framework als eine bedeutende Brücke zwischen KI-gesteuerter Überwachung und interdisziplinärer Forschung zur Suizid-Prävention.’

Schlussfolgerung

Persönlich ist es eine zunehmend seltene Erleichterung, ein KI-Paper zu finden, das berichtenswert ist und nicht wahrscheinlich eine kontroversen Reaktion in einem Teil der Bevölkerung auslöst, da es schwierig wäre, den Wert der Ziele hinter einem solchen Projekt in Frage zu stellen.

Praktisch gesehen ist die sehr geringe Anzahl von Pixeln, die vom Kopf eingenommen werden, und der relativ geringe Bildschirmplatz, den die gesamte Person in diesem Szenario einnimmt, es sehr schwierig, zu bestimmen, ob die Person häufig in den Tunnel schaut – eines der verräterischen Anzeichen eines möglichen Eisenbahn-Selbstmords.

Wie immer in Projekten im Zusammenhang mit Überwachungs-Infrastruktur scheint dies ein Problem um Auflösung und Ressourcen zu sein: Wenn es mehr Kameras in kürzeren Abständen gäbe, die die Plattform abdecken, einschließlich einer, die speziell den Tunnel-Ausgang (d. h. den Tunnel-Aspekt, aus dem ein Metro-Zug plötzlich erscheint) überwacht, gäbe es die Möglichkeit, einige der verschiedenen und ständig weiterentwickelten Frameworks um Blickrichtung zu involvieren. Wie es derzeit steht, verlässt sich die aktuelle Arbeit auf die Bewertung der gesamten Körper-Richtung, um anzuzeigen, dass das Subjekt den Tunnel betrachtet.

Letztendlich ist das Problem ein budgetärer Aspekt, zumindest was die Schienen-Infrastruktur betrifft; Wenn alle Plattformen mit Barrieren und Toren ausgestattet wären – Merkmale, die in Londoner U-Bahn-Stationen und in den U-Bahn-Netzen anderer Städte der Welt nur selten auftauchen – dann würden die Plattformen keine Gelegenheit für Selbstverletzung bieten.

Sicherlich ist eine erhöhte Überwachung die kostengünstigere Option, und die frühzeitige Identifizierung von Merkmalen von Selbstverletzung könnte eine direkte Intervention vor einer Tragödie ermöglichen.

 

Erstveröffentlicht am Dienstag, den 9. Juni 2026

Autor über maschinelles Lernen, Domänen-Spezialist in der menschlichen Bildsynthese. Ehemaliger Leiter der Forschungsinhalte bei Metaphysic.ai.