Andersonの視点
鉄道駅の自殺予防にAIを活用する:メトロプラットフォームでの自殺予防のためのAIシステム

実際の地下鉄の監視カメラの映像で訓練されたAIシステムは、自殺未遂の警告サインを数分前に検知できるという主張があり、プラットフォームの端で足踏みしたり、トンネルを見たり、黄色い線の近くで立ち止まったりするような行動を追跡することができる。
機械学習システムは、プラットフォームイベントの監視システムとして、数年前から試験的に使用されてきた。通常、人気のあるYou Only Look Once(YOLO)シリーズの画像認識アプリケーションのバリエーションが使用される。YOLOは、歩行者がプラットフォームから落ちた場合、または犯罪が行われた場合、または駅のプラットフォームが単純に混雑している場合(駅の当局がアクセスを規制し、問題を解決できるようにする)などのシナリオで使用される。

2024年の論文『Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach』より、YOLOV7がプラットフォームの乗客を識別する段階。ソース – https://www.mdpi.com/1424-8220/24/11/3377 ソース
過去3〜5年間で、イギリス、カナダ、オランダなどの地域で、鉄道自殺の試みや成功した自殺が増加しているため、鉄道やメトロのプラットフォームでの自殺行為を特定するための機械学習システムの可能性に関心が高まっている。特定の要因に基づいて、自殺行為の兆候を特定することができるからである。

閾値にいる人々:STARRプロジェクトを支えるデータセットからの例。ソース – https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf ソース
自殺行為をプラットフォームで特定するためのAIを使用するプロジェクトは、統一された方法論や基礎システムや共通のアプローチを採用していない。これは、これらのシステムを支える方法論が不断に進化していること、そしてこれらのシステムが洞察をもたらす心理学や精神医学の知識も進化していることによる。
最先端
カナダからの新しい研究は、この研究分野に正式な枠組みを提案し、メトロ駅での自殺の試みを特定するための「自殺リスク評価」(SRA)としている。
モントリオール交通局と協力して、研究者は66件の実際の自殺未遂の映像を入手し、これらの映像は当局の管轄下にあるプラットフォームのカメラによって撮影された。

新しい論文からの出力予測:2つのフレームの1つは実際の鉄道自殺の試みを表し、もう1つはそうではない。各画像の左右には、トンネル口に対する個人の「滞在傾向」を示すプラットフォームの危険な区域と安全な区域のヒートマップが表示される。ソース – https://arxiv.org/pdf/2605.22904
このデータセットは、限られたグランドトゥルースデータセットのクラス不均衡を人工的に解決する必要があったが、ある程度のボリュームの実データセットは希少である。将来的には、世界中の交通当局からより多くのデータが提供され、多国籍のデータセットが作成されることを期待できるが、非常にデリケートな映像であるため、実現は容易ではない。
この取り組みは、最初のものである。多様なタスクを1つのスキーマにまとめ、メトロプラットフォームの自殺シナリオの新しいベンチマークを提供するものである。
研究者は次のように述べている。
‘他のアプローチとは異なり、我々の提案は、個人の追跡、活動認識、プラットフォームのセマンティックセグメンテーション、トラジェクトリ駆動型リスクヒートマップモデリングを組み合わせて、蓄積された証拠から自殺リスクを評価する。’
‘SRAを明確なタスクとして定式化し、完全な運用パイプラインをベンチマーク化し、実際の監視データで83.2%のROC-AUCを達成したことで、この研究は自殺リスク評価の複雑さを強調し、社会のためにAIシステムの研究を開拓する。’
新しい論文は、「メトロ駅での自殺リスク評価:予防のための解釈可能なAIビデオ監視フレームワーク」というタイトルで、Université TÉLUQ、Polytechnique Montréal、Université du Québec à Montréalの4人の研究者によって執筆された。
方法
研究者のフレームワークは、ライブの監視ビデオフィードを分析して、追跡された各乗客の自殺リスクスコアを継続的に更新する。

監視ビデオから乗客の自殺リスクを推定するシステムパイプライン。追跡、姿勢推定、活動認識、プラットフォームゾーニング、トラジェクトリヒートマップが組み合わされて、個人の動きや行動をリスクスコアに変換する。
プラットフォームは、意味のあるゾーンに分割され、たとえば、異なるエリア間を繰り返し歩くような動きを検知できるようになる。
乗客の軌跡はプラットフォームの地図に投影され、危険性の高いエリアや、自殺リスクの高い行動と関連するエリアを強調するヒートマップを生成することができる。
最後に、システムはこれらの空間パターンを観察された行動と照合して、プラットフォーム上の各個人の自殺リスク評価を生成する。これを「リスク推論」と呼ぶ。
研究者は、人間検出器として、事前トレーニング済みのYOLOX実装を使用し、ByteTrackを使用してマルチオブジェクト追跡をオーケストレートした。
これらのプロセスによって個別化された各個人は、2Dボディジョイントを提供する事前トレーニング済みのHRNetモデルを割り当てられ、外側の推定値によって決定されるバウンディングボックス内でジョイント推定とボディキーポイントを実行する。

HRNetを使用したジョイント推定の例。ソース – https://github.com/HRNet ソース
ビデオデータから推定された姿勢は、歴史的な動きを定義する累積マップにまとめられる(上記の画像の側にある「プラットフォームヒートマップ」参照)。
新しいシステムは、STARRフレームワークを組み込んでいる。これは、プラットフォームでの自殺行為の確率を評価するために設計された以前の研究である。

STARRフレームワークからの姿勢推定。ソース – https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf ソース
この場合、STARRは、3つの乗客の行動アノテーションを検出するために使用される:トンネルを見る、歩く、立つ。
環境的背景を組み込むために、システムはプラットフォームを意味のあるゾーンに分割するために、YOLOv8nのセマンティックセグメンテーションモデルを使用する。このモデルは、手動でアノテーションされたプラットフォーム画像でトレーニングされている。

プラットフォームセマンティクス:システムがセグメンテーションされたプラットフォームを3つの行動的に意味のある領域に変換するプロセス。結果として得られる壁に近い領域、黄色い線に近い領域、トンネルに近い領域は、乗客の動きやリスク関連の行動を評価するために使用される空間的背景を提供する。
セグメンテーションマップは、プラットフォームの境界を推定し、3つの運用領域を定義するために使用される:壁に近いゾーン、黄色い線に近いゾーン、トンネルに近いゾーン。
これらのゾーンは、心理学的研究によって自殺リスクの高い行動と関連付けられている動きを検知するために必要な空間的背景を提供する。特に、壁と黄色い線の間を繰り返し移動したり、プラットフォームの遠端エリアに入ったりすることができる。
これらの空間的指標は、前に生成されたトラジェクトリヒートマップと組み合わされて、最終的な自殺リスク評価に組み込まれる。
興味深いことに、論文では、自殺の試みの特徴の1つは、プラットフォームに物を残すことであると述べられているが、研究者はこの要素をこのプロジェクトに組み込むことができなかったため、将来の研究に残している。
プラットフォームリスクマップ
単一の個人の行動のみに頼るのではなく、システムは複数の既知のリスクの高いケースからのトラジェクトリヒートマップを組み合わせて、プラットフォーム全体の「位置リスクヒートマップ」を作成する。

複数のリスクの高い乗客の動きからプラットフォームリスクマップを作成する。滞在、足踏み、またはその他のリスク関連の行動を引き付ける領域が、最終的なリスク評価で使用される指標として浮き彫りになる。
長時間占有される領域は、リスクの高い地域として浮き彫りになり、短時間またはまれに訪れる場所は、リスクの低い地域として残る。位置リスクスコアは、最終的な自殺リスク評価の入力の1つとなる。
最終的なリスクスコアは、時間の経過とともに蓄積された8つの指標に基づいている:位置リスクスコア、黄色い線を歩くか立つか、黄色い線を横切る回数、黄色い線上で過ごす合計時間、黄色い線上で過ごす最長の連続時間、壁と黄色い線の間を繰り返し移動する回数、トンネルに向かう回数、プラットフォームのトンネルに近いエリアに入る回数。
これらの行動的および空間的シグナルは、XGBoostモデルを介して組み合わされ、プラットフォーム上の各個人の自殺リスクの継続的に更新される推定値を生成する。
データとテスト
モントリオール交通局(STM)から提供された監視カメラの映像を使用してテストが行われた。66件の自殺未遂の5分間の映像と、同じカメラで同じ時間に自殺未遂が発生しなかった56件のコントロール映像が使用された。
心理学者や自殺行為の専門家の協力を得て、個々の乗客は、自殺未遂のシナリオに関連しているかどうかに基づいてアノテーションされた。これにより、66件の自殺未遂ケースに関連する256人の乗客のデータセットが作成され、190人はコントロールグループに割り当てられた。
情報漏洩を防ぐために、同じ映像から抽出されたすべての個人は、同じデータ分割に割り当てられ、75%のデータがトレーニングに、25%がテストに使用された。自殺未遂ケースとコントロールケースのバランスが保持された。
XGBoost分類器は、300回のブースティングイテレーションで、0.05の学習率でトレーニングされ、トレーニングインスタンスと特徴のサブサンプリングが行われた。データセットにコントロールケースが多いため、トレーニングプロセスでは少数クラスに追加の重みが割り当てられた。
パフォーマンスは、主に受信者操作特性曲線下の面積(ROC-AUC)で評価され、システムが自殺未遂ケースとコントロールケースをどの程度よく区別できるかを測定した。
追加のメトリックには、感度(自殺未遂ケースの正確な識別)、特異度(コントロールケースの正確な識別)、偽陽性率(誤報)、偽陰性率(検出漏れ)が含まれた。自殺未遂の可能性のある状況を早期に特定することを優先するために、意図的に低い決定閾値が採用された。

4つの構成で自殺リスク評価フレームワークのパフォーマンス。グラウンドトゥルース支援、上限、完全自動のバリアントを比較し、ROC-AUC、感度、特異度、偽陽性率、検出漏れ率を示す。自動検出、追跡、活動認識モジュールをグラウンドトゥルースアノテーションに置き換えることのパフォーマンスへの影響も示す。
上記の結果表から見られるように、完全自動システムは0.832のROC-AUCを達成し、自動検出と追跡コンポーネントをグラウンドトゥルースアノテーションに置き換えると、パフォーマンスは0.919に改善された。
活動認識モジュールのみを置き換えると、ROC-AUCは0.893に上昇した。グラウンドトゥルースアノテーションからすべての入力が得られた場合、最高スコア0.924が得られた。これは、検出、追跡、ダウンストリームの指標抽出が現在のパイプラインの主なエラーソースであることを示唆している。
トレーニング済みのXGBoostモデルを分析した結果、黄色い線との直接的なやり取りがリスクの高い強い予測因子であることがわかり、黄色い線を横切る回数、壁とプラットフォームの間を繰り返し移動することが続いた。黄色い線上で過ごす時間や位置リスクスコアも大きく寄与し、トンネルに向かうことやプラットフォームの遠端エリアに入ることは、追加的なしかし決定的なシグナルを提供した。
上記でプレビューした質的結果に戻ると、フレームワークは後に自殺未遂に関連する個人に高いリスクスコアを割り当て、周囲のコントロール乗客にははるかに低いスコアを割り当てた。

先ほどの記事で見たように、論文の質的結果は、監視データからの2つの画像の出力予測を特徴とし、ヒートマップは滞在やその他のプラットフォーム活動を示す。
1つのケースでは、黄色い線上での長時間の存在と位置リスクヒートマップによって特定された高リスク領域の占有により、リスクスコア0.98が関連付けられた。別のケースでは、自殺未遂に関連する個人はスコア0.92を受け取り、近くのコントロール乗客ははるかに低い推定値を受けた。
研究者によると、これらの違いは、単一の行動ではなく、複数の指標の蓄積から生じる。黄色い線を横切る、トンネルに向かう、またはプラットフォームの高リスク領域に滞在することはすべて、リスク評価の向上に貢献する。
研究者は次のように結論付ける。
‘パフォーマンスの向上に加えて、私たちの研究は解釈可能性を強調しており、リスク評価は既成の行動的および空間的リスク要因と一致する直感的な指標によって推進されることを示している。’
‘これにより、提案されたフレームワークは、AIを使用した監視システムと自殺予防に関する学際的な研究の間の有意義な橋渡しとなり、社会のためにAIシステムの研究を開拓する。’
結論
個人的な観点から、このようなプロジェクトは、人々の一部に炎を起こす可能性のある反応を引き起こさないAIの論文を見つけることは、ますます珍しい救いである。なぜなら、このようなプロジェクトの背後にある目的の価値を争うことは難しいからである。
実用的には、監視される個人の頭部が占めるピクセル数が非常に少なく、個人が占める画面スペースも比較的少ないため、このシナリオでは、個人がトンネルを頻繁に見ているかどうかを判断することは非常に難しい。自殺未遂の潜在的な兆候の1つである。
監視インフラストラクチャに関するプロジェクトでは、これは解像度とリソースの問題のようです。プラットフォーム全体をより多くのカメラでカバーし、トンネル出口(メトロ列車が突然現れるトンネルの側面)を特にカバーするカメラがあれば、さまざまなフレームワークを使用して視線の方向をよりよく把握できるでしょう。現状では、現在の作業は、トンネルを眺める個人の方向を評価するために、身体の全方向を評価することに頼っている。
最終的には、鉄道インフラストラクチャの問題は予算の問題です。世界中の都市のメトロネットワークやロンドンの地下鉄の駅がすべてバリアーやゲートで保護されていたら、プラットフォームは自殺の機会を提供しないだろう。確かに、監視の増加はより安価な選択肢であり、自殺の特徴的な兆候を早期に特定することで、悲劇が起こる前に直接介入できる。
2026年6月9日火曜日初版












