Anderson 视角

预测和预防地铁站台悲剧事件的发生，利用人工智能

发布于 2026年6月9日

作者

Martin Anderson

AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

一款人工智能系统，利用真实的地铁监控视频进行训练，声称可以在悲剧事件发生前几分钟内发现自杀企图的警告信号，追踪诸如在站台边缘徘徊、反复看向隧道等行为。

机器学习系统已经被用作平台事件监控系统多年，通常使用流行的You Only Look Once（YOLO）系列图像识别应用程序，用于行人可能已经摔倒、犯罪正在发生，或车站平台过度拥挤（允许车站当局监管和缓解问题）的场景。

来自2024年论文“Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach”的YOLOV7识别站台乘客的步骤。来源 - https://www.mdpi.com/1424-8220/24/11/3377

来自2024年论文“Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach”的YOLOV7识别站台乘客的步骤。来源 – 来源

过去3-5年，铁路自杀尝试或成功事件的数量增加（在英国、加拿大和荷兰等地区），人们对机器学习系统识别铁路和地铁站台上的自杀倾向行为的潜力感兴趣，这些行为基于性格和其他多种因素：

站台边缘的徘徊者：STARR项目的示例数据，该项目出现在本文讨论的新论文中。来源 - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

站台边缘的徘徊者：STARR项目的示例数据，该项目出现在本文讨论的新论文中。来源 – 来源

这些项目的多样性，旨在利用人工智能来预防自杀行为，尚未采用统一的方法论或底层系统或共同的方法——这主要是因为这些系统的方法正在不断演变，随着对这一类人工智能监控的心理学和精神病学知识的深入理解。

前沿技术

现在，加拿大的一项新研究为这方面的研究文献提供了一个正式的框架，称为“自杀风险评估”（SRA），在地铁站的自杀尝试的背景下。

与蒙特利尔交通局合作，研究人员获得了66段真实自杀尝试的监控视频录像，这些录像由车站摄像头拍摄：

来自新论文的输出预测，显示两帧图像，一幅是真正的铁路自杀尝试，另一幅不是。每幅图像的两侧显示了危险和安全区域的热力图，显示每个人的“停留倾向”与隧道口有关，通过历史知识解释真正的“跳跃者”的倾向。来源 - https://arxiv.org/pdf/2605.22904

来自新论文的输出预测，显示两帧图像，一幅是真正的铁路自杀尝试，另一幅不是。每幅图像的两侧显示了危险和安全区域的热力图，显示每个人的“停留倾向”与隧道口有关，通过历史知识解释真正的“跳跃者”的倾向。来源 – 来源

尽管需要人为地解决这种有限的真实数据集所带来的类别不平衡问题，但这是一个罕见的、有一定数量的数据集；我们可以希望未来来自世界各地的交通当局的项目能够提供一个跨国数据集，拥有更多的例子。然而，考虑到这种录像的极度敏感性，这是一个非常困难的任务。

该项目是第一个将识别自杀风险的各种任务整合到一个框架中的项目，并带来了一个新的基准，用于地铁站台自杀场景。

作者们表示：

“与专注于孤立子任务或直接推断意图的方法不同，我们的方法通过积累证据来评估自杀风险，包括人体追踪、活动识别、平台语义分割和轨迹驱动的风险热力图建模。”

“通过将自杀风险评估（SRA）正式化为一个独立的任务，并基准测试一个完整的操作管道，实现了83.2%的ROC-AUC在真实监控数据上，这项工作强调了自杀风险评估的复杂性，并为可解释的AI系统在社会福利方面的研究开辟了新的方向。”

新论文题为利用人工智能视频监控进行自杀风险评估：地铁站台预防的可解释框架，由来自Université TÉLUQ、Polytechnique Montréal和Université du Québec à Montréal的四位作者撰写。

方法

作者们的框架分析实时监控视频流，以生成每个跟踪乘客的持续更新的自杀风险评分。个体被检测、跟踪并转换为简化的身体姿势表示，然后使用基于骨架的活动识别系统识别短时间内的行为：

估计乘客自杀风险的系统管道，展示了如何将跟踪、姿势估计、活动识别、平台分区和轨迹热力图结合起来，将个体的运动和行为转换为每个站台上的人的持续更新的风险评分。

然后将平台划分为有意义的区域，使得可以检测到诸如在不同区域之间反复踱步等运动模式。乘客的轨迹被投影到平台地图上，使得可以生成热力图，突出经常被高风险人群占据或经过的区域。

最后，系统将这些空间模式与观察到的行为进行交叉参考，以产生每个站台上个体的自杀风险评估——一个过程，作者们称之为风险推断。

作者们使用预训练的YOLOX实现作为他们系统的人体检测器，发现其开箱即用的状态对于这个目的是可用的。 ByteTrack被用来编排多目标跟踪。

每个个体都被分配一个预训练的HRNet模型，提供关节估计和2D身体关键点，在由这些估计的最外层确定的边界框内：

来自新项目的HRNet的关节估计示例。来源 - https://github.com/HRNet

来自新项目的HRNet的关节估计示例。来源 – 来源

从视频数据中评估的姿势被构建成累积地图，定义了历史运动（见上面早些时候的图像旁边的“平台热力图”）。

新系统包含STARR框架，这是一个旨在评估地铁站台上自杀行为概率的先前工作：

来自STARR框架的姿势估计。来源 - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

来自STARR框架的姿势估计。来源 – 来源

在这种情况下，STARR用于检测三个自解释的乘客行为注释：LookTunnel；Walk；和Stand。

为了融入环境背景，系统的平台概念被划分为语义上有意义的区域，使用在手动注释的平台图像上训练的YOLOv8n语义分割模型：

平台语义：系统用于将分割平台转换为三个行为上有意义的区域的分区过程。由此产生的靠近墙壁、靠近黄线和靠近隧道的区域提供了用于评估乘客运动和风险相关行为的空间背景。

分割后的地图被用来估计平台边界并定义三个操作区域：靠近平台墙壁的区域；靠近黄线的区域，乘客可以在安全边界内接近平台边缘；以及靠近隧道的区域。

这些区域提供了识别与自杀风险增加相关的行为所需的空间背景。特别是，它们使系统能够检测在墙壁和黄线之间反复移动，以及进入平台的远端区域。

结合之前生成的轨迹热力图，这些空间指标被纳入最终的自杀风险评估中。

有趣的是，该论文指出，自杀尝试的一个特征是在站台上留下物品的倾向；然而，作者们无法将其纳入这个项目版本中，将其留给未来的工作。

站台风险地图

与仅依赖单个个体的行为不同，该框架还将多个已知高风险案例的轨迹热力图组合起来，创建一个站台范围内的“位置风险热力图”：

从多个高风险乘客的运动中构建站台风险地图。经常吸引长时间停留、徘徊或其他风险相关行为的区域变得更加突出，后来被用作最终风险评估的一个因素。

反复吸引长时间停留的区域出现为高风险区域，而与短暂或不频繁的访问相关的位置则保持为低风险。由此产生的位置风险评分成为最终自杀风险评估的输入之一。

最终的风险评分基于八个随时间积累的指标：位置风险评分，来源于平台热力图；乘客是否走在或站在黄线上；黄线穿越次数；在黄线上花费的总时间；在黄线上未间断停留的最长时间；在墙壁和黄线之间反复移动；反复面向隧道；以及进入隧道附近的平台远端区域。

这些行为和空间信号通过一个XGBoost模型组合，生成每个站台上个体的持续更新的自杀风险估计。

数据和测试

测试是在蒙特利尔交通局（STM）提供的监控视频上进行的，包括66段5分钟的录像，捕捉了真实的自杀尝试之前的场景，以及56段匹配的对照录像，来自相同的摄像头，在没有发生自杀尝试的相同时间：

在心理学和自杀行为专家的帮助下，个体乘客被注释为是否出现在高风险或对照场景中，产生了256个个体的数据集，其中66个与自杀尝试案例相关，190个被分配到对照组。

为了防止信息泄露，同一录像中提取的所有个体都被分配到相同的数据分割，其中75%的数据用于训练，25%保留用于测试，同时保持高风险和对照案例之间的平衡。

XGBoost分类器经过300次增强迭代训练，学习率为0.05，训练实例和特征进行子采样，以提高泛化能力。由于数据集包含的对照案例远多于高风险案例，训练过程通过为少数类别分配额外的权重来弥补这一点。

性能主要使用接收者操作特征曲线下面积（ROC-AUC）来评估，衡量系统区分高风险和对照个体的有效性。

其他指标包括敏感度，用于测量正确识别高风险案例；特异度，用于测量正确识别对照案例；假阳性率，反映假警报（FPR）；以及假阴性率，反映漏检率（FNR）。采用了故意较低的决策阈值，以优先识别潜在高风险情况：

在四种配置下自杀风险评估框架的性能，比较了辅助真实数据、上限和完全自动化的变体，跨ROC-AUC、敏感度、特异度、假警报率和漏检率——并展示了用自动检测、跟踪和活动识别模块替换真实数据注释的性能影响。

如上表所示，完全自动化系统实现了0.832的ROC-AUC，而用真实数据注释替换自动化检测和跟踪组件可以提高性能到0.919。

仅替换活动识别模块会产生较小的收益，提高ROC-AUC到0.893。最高分数0.924是在所有输入都来自真实数据注释时获得的，这表明检测、跟踪和下游指标提取仍然是当前管道中的主要错误来源。

对训练的XGBoost模型进行分析，发现与黄线的直接交互是预测高风险的最强预测指标，其次是黄线穿越次数，以及在平台区域之间反复移动。花费在黄线上的时间和位置风险评分也做出了显著贡献，而面向隧道和进入平台远端的注意力提供了额外但不那么决定性的信号。

回顾之前预览的定性结果，框架为后来与自杀尝试相关的个体分配了高风险评分，而为周围的对照乘客分配了显著较低的评分：

如本文前面所见，论文中的定性结果显示了两幅来自监控数据的图像的输出预测，两侧的热力图显示了停留和其他平台活动。

在一个案例中，一个风险评分为0.98的个体与在黄线上长时间停留和占据由位置风险热力图确定的高风险区域有关。在另一个案例中，一个高风险个体的评分为0.92，而附近的对照乘客的评分则要低得多。

根据作者的说法，这些区别是由多个指标的积累而产生的，而不是由单一行为引起的。在黄线上长时间停留、反复面向隧道和长时间停留在高风险区域都导致了风险评分的提高。

作者们总结道：

“超越性能，我们的研究强调了可解释性，表明风险评估是由与既定的行为和空间风险因素一致的直观指标驱动的。”

“这使得提出的框架成为人工智能监控系统和自杀预防领域跨学科研究之间的重要桥梁。”

结论

从个人角度来看，能够找到一篇值得报道的人工智能论文，而不会在某些人群中引起激烈的反应，这是一件越来越罕见的令人欣慰的事情，因为很难有人会反对这类项目背后的目标的价值。

从实际角度来看，头部在这种情况下占据的像素数量很少，整个被监控的人在屏幕上的空间也相对较小，这使得很难判断个体是否经常看向隧道，这是潜在铁路自杀的警告信号之一。

与监控基础设施相关的项目一样，这似乎是一个预算问题；如果所有平台都配备了屏障和门——这些功能在伦敦地铁站和世界各地的地铁网络中很少出现——那么平台就不会提供自我伤害的机会。

当然，增加监控是一个更便宜的选择，早期识别自我伤害的特征性迹象可以在悲剧发生之前允许直接干预。

首次发表于2026年6月9日，星期二

Martin Anderson

机器学习作家，人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站： martinanderson.ai
联系： [email protected]
Twitter：@manders_ai

Unite.AI

预测和预防地铁站台悲剧事件的发生，利用人工智能

前沿技术

方法

站台风险地图

数据和测试

结论

You may like