Ângulo de Anderson

Prever e Prevenir Tragédias em Plataformas de Metrô com IA

mm
AI-generated image (GPT-2): A surveillance-style view of a subway platform showing a person walking near the platform edge, with an AI monitoring overlay displaying a detection box around the individual, a tunnel entrance ahead, and passengers visible on the opposite platform.

Um sistema de IA treinado com imagens de vigilância de metrô reais afirma ser capaz de identificar os sinais de alerta de uma tentativa de suicídio minutos antes de ocorrer, rastreando comportamentos como caminhar, permanecer na borda da plataforma e olhar repetidamente para o túnel.

 

Sistemas de aprendizado de máquina vêm sendo testados como sistemas de monitoramento de eventos de plataforma há alguns anos, geralmente com alguma variação da popular série de aplicações de reconhecimento de imagens You Only Look Once (YOLO) que alimentam cenários em que pedestres podem ter caído, ou um crime está sendo cometido, ou onde a plataforma da estação está simplesmente superlotada (permitindo que as autoridades da estação regulamentem o acesso e remediem o problema).

Do estudo de 2024 'Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach', as etapas pelas quais o YOLOV7 identifica passageiros em uma plataforma. Fonte - https://www.mdpi.com/1424-8220/24/11/3377

Do estudo de 2024 ‘Train Station Pedestrian Monitoring Pilot Study Using an Artificial Intelligence Approach’, as etapas pelas quais o YOLOV7 identifica passageiros em uma plataforma. Fonte

Com o aumento do número de tentativas de suicídio ou suicídios bem-sucedidos nos últimos 3-5 anos (em regiões como o Reino Unido, Canadá e os Países Baixos), o interesse aumentou no potencial dos sistemas de aprendizado de máquina para identificar comportamento suicida em plataformas de trem e metrô, com base em disposição e diversos outros fatores:

Moradores na fronteira: exemplo de dados do conjunto de dados que alimenta o projeto STARR, que é apresentado no novo artigo em discussão. Fonte - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Moradores na fronteira: exemplo de dados do conjunto de dados que alimenta o projeto STARR, que é apresentado no novo artigo em discussão. Fonte

Em resumo, a variedade de projetos que visam aproveitar a IA para comportamento suicida em plataformas não adotou, até o momento, uma metodologia uniforme ou sistema subjacente comum – não menos porque os métodos que alimentam esses sistemas estão constantemente evoluindo, juntamente com o conhecimento psicológico e psiquiátrico que traz insights para esse tipo de vigilância da IA.

Vanguarda

Agora, um novo estudo do Canadá oferece uma formalização proposta dessa vertente na literatura de pesquisa, como Avaliação de Risco de Suicídio (SRA), no contexto de tentativas de suicídio em estações de metrô.

Em colaboração com as autoridades de transporte de Montreal, os pesquisadores envolvidos no novo estudo obtiveram acesso a imagens de 66 tentativas de suicídio reais, capturadas por câmeras de plataforma dentro da jurisdição das autoridades:

Do novo artigo, previsões de saída de duas imagens, uma representando uma tentativa de suicídio de trem real e a outra não. Em cada lado de cada imagem, é representado um mapa de calor de áreas perigosas e mais seguras na plataforma sob vigilância, representando, em cada caso, a 'tendência de permanência' de uma pessoa em relação à boca do túnel.

Do novo artigo, previsões de saída de duas imagens, uma representando uma tentativa de suicídio de trem real e a outra não. Em cada lado de cada imagem, é representado um mapa de calor de áreas perigosas e mais seguras na plataforma sob vigilância, representando, em cada caso, a ‘tendência de permanência’ de uma pessoa em relação à boca do túnel, interpretada por meio do conhecimento histórico das tendências dos ‘puladores’ reais. Fonte

Embora tenha sido necessário abordar artificialmente o desequilíbrio de classes que ocorre com um conjunto de dados de verdade limitado, este é, no entanto, um conjunto de dados raro com algum volume viável; alguém poderia esperar que futuros projetos de autoridades de trânsito de todo o mundo permitissem um conjunto de dados multpaís com um volume maior de exemplos. No entanto, compreensivelmente, a natureza extremamente sensível dessas imagens torna isso mais do que uma perspectiva casual ou fácil.

A iniciativa, segundo os autores, é a primeira a unificar as tarefas diversas que definem a busca em um esquema, e traz consigo um novo padrão para o cenário de suicídio em plataformas de metrô.

Os autores afirmam:

‘Ao contrário das abordagens que se concentram em subtarefas isoladas ou tentam inferir a intenção diretamente, nossa formulação avalia o risco de suicídio a partir de evidências acumuladas, incorporando rastreamento de pessoas, reconhecimento de atividades, segmentação semântica da plataforma e modelagem de mapa de calor baseada em trajetória.

‘Ao formalizar a SRA como uma tarefa distinta e criar um pipeline operacional completo que alcança 83,2% de ROC-AUC em dados de vigilância reais, este trabalho destaca a complexidade da avaliação do risco de suicídio e abre novas direções para a pesquisa sobre sistemas de IA interpretáveis para o bem social.’

O novo artigo é intitulado Avaliação de Risco de Suicídio a partir de Vigilância de Vídeo com IA: Um Quadro Interpretável para Prevenção em Estações de Metrô, e vem de quatro autores da Université TÉLUQ, Polytechnique Montréal e Université du Québec à Montréal.

Método

A estrutura dos autores analisa um feed de vídeo de vigilância ao vivo para gerar uma pontuação de risco de suicídio continuamente atualizada para cada passageiro rastreado. Indivíduos são detectados, rastreados e convertidos em representações de postura corporal simplificadas, após o que um sistema de reconhecimento de atividades baseado em esqueleto identifica ações ao longo de curtos períodos de tempo:

Pipeline do sistema para estimar o risco de suicídio de um passageiro a partir de vídeo de vigilância, mostrando como o rastreamento, a estimativa de postura, o reconhecimento de atividades, a zonagem da plataforma e os mapas de calor de trajetória são combinados para converter movimentos e comportamentos individuais em uma pontuação de risco continuamente atualizada para cada pessoa na plataforma.

Pipeline do sistema para estimar o risco de suicídio de um passageiro a partir de vídeo de vigilância, mostrando como o rastreamento, a estimativa de postura, o reconhecimento de atividades, a zonagem da plataforma e os mapas de calor de trajetória são combinados para converter movimentos e comportamentos individuais em uma pontuação de risco continuamente atualizada para cada pessoa na plataforma.

A plataforma é então dividida em zonas significativas, permitindo que padrões de movimento – como caminhar repetidamente entre diferentes áreas – sejam detectados. As trajetórias dos passageiros são projetadas em um mapa da plataforma, tornando possível gerar mapas de calor que destacam as áreas mais frequentemente ocupadas ou cruzadas por pessoas associadas a risco elevado.

Finalmente, o sistema cruza esses padrões espaciais com comportamentos observados para produzir uma avaliação individual de risco de suicídio para cada pessoa na plataforma – um processo que os autores chamam de inferência de risco.

Os autores usaram uma implementação pré-treinada do YOLOX como detector de humanos para o seu sistema, encontrando que seu estado fora da caixa é perfeitamente usável para esse propósito. ByteTrack foi usado para orquestrar o rastreamento de múltiplos objetos.

Cada pessoa individuada por esses processos é atribuída ao seu próprio modelo HRNet pré-treinado, fornecendo estimativa de articulações e pontos de chave 2D dentro de uma caixa delimitadora determinada pelas estimativas mais externas:

Exemplos de estimativa de articulações do HRNet, usados no novo projeto. Fonte - https://github.com/HRNet

Exemplos de estimativa de articulações do HRNet, usados no novo projeto. Fonte

As posturas avaliadas a partir de dados de vídeo da plataforma são construídas em mapas cumulativos que definem movimento histórico (veja os ‘mapas de calor da plataforma’ ao lado da imagem anterior).

O novo sistema incorpora o quadro STARR, um trabalho anterior projetado para avaliar a probabilidade de comportamento suicida em plataformas:

Estimativa de postura do quadro STARR. Fonte - https://openaccess.thecvf.com/content/WACV2025W/RWS/papers/Naimi_SSTAR_Skeleton-based_Spatio-Temporal_Action_Recognition_for_Intelligent_Video_Surveillance_and_WACVW_2025_paper.pdf

Estimativa de postura do quadro STARR. Fonte

Nesse caso, o STARR é usado para detectar três anotações de ação de passageiros autoexplicativas: OlharTúnel; Caminhar; e Parar.

Para incorporar contexto ambiental, a concepção da plataforma é dividida em zonas semanticamente significativas usando um modelo de segmentação semântica YOLOv8n treinado em imagens de plataforma anotadas manualmente:

Semântica da plataforma: o processo de zonagem usado pelo sistema para converter uma plataforma segmentada em três regiões comportamentalmente significativas. As regiões resultantes próximas à parede, próximas à linha amarela e adjacentes ao túnel fornecem o contexto espacial usado para avaliar movimentos e comportamentos de risco de passageiros.

Semântica da plataforma: o processo de zonagem usado pelo sistema para converter uma plataforma segmentada em três regiões comportamentalmente significativas. As regiões resultantes próximas à parede, próximas à linha amarela e adjacentes ao túnel fornecem o contexto espacial usado para avaliar movimentos e comportamentos de risco de passageiros.

O mapa de segmentação resultante é usado para estimar os limites da plataforma e definir três áreas operacionais: uma Zona Próxima à Parede perto da parede da plataforma; uma Zona Próxima à Linha Amarela onde os passageiros podem se aproximar da borda da plataforma enquanto permanecem dentro dos limites de segurança; e uma Zona do Fim da Plataforma mais próxima da entrada do túnel.

Essas zonas fornecem o contexto espacial necessário para identificar comportamentos que estudos psicológicos associaram a risco de suicídio elevado. Em particular, elas permitem que o sistema detecte movimento repetido entre a parede e a linha amarela, juntamente com a entrada na área do fim da plataforma.

Combinados com os mapas de calor de trajetória gerados anteriormente, esses indicadores espaciais são posteriormente incorporados na avaliação final de risco de suicídio.

Interessantemente, o artigo observa que um dos sinais característicos de tentativas de suicídio é a tendência a deixar um objeto na plataforma; no entanto, os autores não conseguiram incorporar isso nessa versão do projeto, deixando-o para trabalhos futuros.

Um Mapa de Risco da Plataforma

Em vez de confiar apenas no comportamento de uma única pessoa, a estrutura também combina mapas de calor de trajetória de vários casos conhecidos de risco para criar um ‘mapa de risco de plataforma’ em toda a plataforma:

Construindo um mapa de risco de plataforma a partir dos movimentos de vários passageiros em risco. Áreas que atraem ocupação prolongada, caminhar ou outros comportamentos associados a risco se tornam cada vez mais proeminentes e são posteriormente usadas como um fator na avaliação final de risco.

Construindo um mapa de risco de plataforma a partir dos movimentos de vários passageiros em risco. Áreas que atraem ocupação prolongada, caminhar ou outros comportamentos associados a risco se tornam cada vez mais proeminentes e são posteriormente usadas como um fator na avaliação final de risco.

Áreas que atraem ocupação prolongada surgem como regiões de alto risco, enquanto locais associados a visitas breves ou infrequentes permanecem como regiões de baixo risco. A pontuação de risco de posição resultante se torna uma das entradas usadas na avaliação final de risco de suicídio.

A pontuação de risco final é baseada em oito indicadores acumulados ao longo do tempo: uma pontuação de risco de posição derivada dos mapas de calor da plataforma; se um passageiro caminha ou para na linha amarela; o número de cruzamentos da linha amarela; o tempo total gasto na linha amarela; o período mais longo ininterrupto gasto na linha amarela; movimento repetido entre a parede e a linha amarela; orientação repetida em direção ao túnel; e entrada na área adjacente ao túnel.

Esses sinais comportamentais e espaciais são então combinados por meio de um modelo XGBoost, produzindo uma estimativa de risco de suicídio continuamente atualizada para cada indivíduo na plataforma.

Dados e Testes

Testes foram realizados em imagens de vigilância fornecidas pela Société de transport de Montréal (STM), compostas por 66 gravações de cinco minutos capturadas antes de tentativas de suicídio reais, juntamente com 56 gravações de controle correspondentes das mesmas câmeras, em momentos comparáveis em que nenhuma tentativa de suicídio ocorreu.

Com a ajuda de psicologia e especialistas em comportamento suicida, os passageiros individuais foram anotados de acordo com se pareciam em um cenário de risco ou controle, produzindo um conjunto de dados de 256 indivíduos, dos quais 66 estavam associados a casos de tentativa de suicídio, e 190 foram atribuídos ao grupo de controle.

Para evitar vazamento de informações, todos os indivíduos extraídos da mesma gravação foram atribuídos à mesma divisão de dados, com 75% dos dados usados para treinamento e 25% reservados para teste, mantendo o equilíbrio entre casos de risco e controle.

O classificador XGBoost foi treinado por 300 iterações de impulso, a uma taxa de aprendizado de 0,05, com subamostragem para instâncias de treinamento e recursos, para melhorar a generalização. Como o conjunto de dados contém substancialmente mais casos de controle do que casos de risco, o processo de treinamento compensou isso atribuindo peso adicional à classe minoritária.

O desempenho foi avaliado principalmente usando a Área Sob a Curva da Característica de Operação do Receptor (ROC-AUC), medindo quão eficazmente o sistema distingue entre indivíduos em risco e controle.

Métricas adicionais incluíram sensibilidade, medindo a identificação correta de casos de risco; especificidade, medindo a identificação correta de casos de controle; taxa de falsos positivos, refletindo alarmes falsos (FPR); e taxa de falsos negativos, refletindo detecções perdidas (FNR). Um limiar de decisão deliberadamente baixo foi adotado para priorizar a identificação precoce de situações potencialmente em risco:

Desempenho do quadro de avaliação de risco de suicídio sob quatro configurações, comparando variantes assistidas por dados reais, limite superior e totalmente automatizadas em ROC-AUC, sensibilidade, especificidade, taxa de alarme falso e taxa de detecção perdida – e mostrando o impacto de desempenho de substituir anotações de dados reais por módulos de detecção, rastreamento e reconhecimento de atividades automatizados.

Desempenho do quadro de avaliação de risco de suicídio sob quatro configurações, comparando variantes assistidas por dados reais, limite superior e totalmente automatizadas em ROC-AUC, sensibilidade, especificidade, taxa de alarme falso e taxa de detecção perdida – e mostrando o impacto de desempenho de substituir anotações de dados reais por módulos de detecção, rastreamento e reconhecimento de atividades automatizados.

Como visto na tabela de resultados inicial acima, o sistema totalmente automatizado alcançou um ROC-AUC de 0,832, enquanto substituir os componentes de detecção e rastreamento automatizados por anotações de dados reais aumentou o desempenho para 0,919.

Substituir apenas o módulo de reconhecimento de atividades produziu um ganho menor, elevando o ROC-AUC para 0,893. A pontuação mais alta, 0,924, foi obtida quando todas as entradas foram fornecidas por anotações de dados reais, sugerindo que a detecção, o rastreamento e a extração de indicadores downstream permanecem as principais fontes de erro na pipeline atual.

A análise do modelo XGBoost treinado indicou que interação direta com a linha amarela foi um dos principais preditores de risco elevado, seguido pelo número de cruzamentos da linha amarela e pelo movimento repetido entre zonas da plataforma. O tempo gasto na linha amarela e a pontuação de risco de posição também contribuíram substancialmente, enquanto a atenção direcionada ao túnel e a entrada na zona do fim da plataforma forneceram sinais adicionais, embora menos decisivos.

Retornando aos resultados qualitativos previstos acima, a estrutura atribuiu pontuações de risco altas a indivíduos posteriormente associados a tentativas de suicídio, enquanto atribuiu pontuações substancialmente mais baixas a passageiros de controle circundantes:

Como visto anteriormente no artigo, os resultados qualitativos apresentados no artigo apresentam as previsões de saída de duas imagens de dados de vigilância, com mapas de calor em cada lado para indicar permanência e outras atividades de plataforma.

Como visto anteriormente no artigo, os resultados qualitativos apresentados no artigo apresentam as previsões de saída de duas imagens de dados de vigilância, com mapas de calor em cada lado para indicar permanência e outras atividades de plataforma.

Em um caso, uma pontuação de risco de 0,98 foi vinculada à presença prolongada na linha amarela e à ocupação de regiões identificadas como de alto risco pelo mapa de calor de posição. Em outro, um indivíduo em risco recebeu uma pontuação de 0,92, enquanto passageiros de controle próximos receberam estimativas muito mais baixas.

De acordo com os autores, essas distinções surgem da acumulação de vários indicadores, em vez de qualquer comportamento isolado. Cruzar a linha amarela por um longo período, orientar-se repetidamente em direção ao túnel e permanecer em áreas de alto risco da plataforma contribuem para estimativas de risco elevadas.

Os autores concluem:

‘Além do desempenho, nosso estudo enfatiza a interpretabilidade, mostrando que as avaliações de risco são impulsionadas por indicadores intuitivos alinhados com fatores de risco comportamental e espacial estabelecidos.

‘Isso posiciona o quadro proposto como uma ponte significativa entre sistemas de vigilância baseados em IA e pesquisas interdisciplinares sobre prevenção de suicídio.’

Conclusão

Em uma nota pessoal, é um alívio cada vez mais raro encontrar um artigo de IA digno de relato que não provoque uma reação incendiária em alguma parte da população, pois seria difícil contestar o valor dos objetivos por trás desse tipo de projeto.

Em uma nota prática, a quantidade muito pequena de pixels ocupada pela cabeça e a quantidade relativamente pequena de espaço de tela ocupada por toda a pessoa sob vigilância nesse cenário tornam muito difícil determinar se o indivíduo está olhando frequentemente para o túnel – um dos sinais característicos de um potencial suicídio em trem.

Como sempre, em projetos relacionados à infraestrutura de vigilância, isso parece ser uma questão de resolução e recursos: se houvesse mais câmeras em intervalos mais frequentes cobrindo a plataforma, incluindo uma câmera específica cobrindo a saída do túnel (ou seja, o aspecto do túnel de onde um trem de metrô surge subitamente), haveria espaço para envolver alguns dos vários quadros em desenvolvimento em torno da direção do olhar. Como está, o trabalho atual depende de avaliar a direção geral do corpo para sinalizar que o sujeito está olhando para o túnel.

No final, a questão é uma questão orçamentária, pelo menos no que diz respeito à infraestrutura ferroviária; se todas as plataformas fossem equipadas com barreiras e portas – recursos que aparecem com pouca frequência em estações do metrô de Londres e nas redes de metrô de outras cidades ao redor do mundo – então as plataformas não ofereceriam oportunidade para autolesão.

Com certeza, a vigilância aumentada é a opção mais barata, e a identificação precoce de sinais característicos de autolesão poderia permitir intervenção direta antes que a tragédia ocorra.

 

Publicado pela primeira vez na terça-feira, 9 de junho de 2026

Escritor sobre aprendizado de máquina, especialista em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa da Metaphysic.ai.