Vigilância

Identificação de Abuso de Telefones Móveis de Motoristas com Filtros Polarizantes e Reconhecimento de Objetos

mm

Pesquisadores no Reino Unido propuseram um sistema de detecção de uso ilegal de telefones móveis entre motoristas, utilizando filtros foto-ópticos clássicos e captura por infravermelho. Dependendo da qualidade do equipamento de captura, o sistema demonstrou uma taxa de precisão de até 95,81% em testes do mundo real.

Um dos modelos dos pesquisadores em ação. A área do para-brisa é primeiro identificada e isolada como uma área de captura para uma busca auxiliada por IA de imagens de um telefone móvel. O sistema é projetado para ignorar telefones móveis montados e procurar dispositivos que estão sendo ativamente segurados pelo motorista. Fonte: https://www.youtube.com/watch?v=PErIUr3Cxvg

Um dos modelos dos pesquisadores em ação. A área do para-brisa é primeiro identificada e isolada como uma área de captura para uma busca auxiliada por IA de imagens de um telefone móvel. O sistema é projetado para ignorar telefones móveis montados e procurar dispositivos que estão sendo ativamente segurados pelo motorista. Fonte: https://www.youtube.com/watch?v=PErIUr3Cxvg

A pesquisa é intitulada Identificação de Violações de Uso de Telefone de Motorista via Detecção de Objetos de Estado da Arte com Rastreamento, e vem da Escola de Computação da Universidade de Newcastle.

Superando a Reflexividade dos Para-brisas

Abordagens anteriores para detecção de uso de dispositivos móveis entre motoristas foram prejudicadas pela alta reflexividade dos para-brisas durante as horas de luz do dia, exacerbada quando reflexos de grupos de nuvens grandes obscurecem ainda mais o interior do veículo. Tais casos não podem ser realisticamente abordados com fontes de luz infravermelha, desde que a quantidade de iluminação IR necessária para penetrar a luz do dia seria intensiva em recursos.

Portanto, os pesquisadores de Newcastle propõem o truque mais antigo do livro (datando de 1812) para eliminar reflexos de uma superfície de vidro percebida – um filtro polarizador barato e físico que poderia ser anexado a câmeras de vigilância ao lado da estrada, calibrado uma vez e, em seguida, permitir uma visão clara no interior dos veículos.

Acima, uma visão não filtrada de um para-brisa. Abaixo, a mesma visão com um filtro polarizador físico anexado à câmera. Fonte: https://arxiv.org/pdf/2109.02119.pdf

Acima, uma visão não filtrada de um para-brisa. Abaixo, a mesma visão com um filtro polarizador físico anexado à câmera. Fonte: https://arxiv.org/pdf/2109.02119.pdf

Com a mudança de câmeras dedicadas para sensores baseados em dispositivos móveis, a presença do filtro polarizador na cultura popular foi reduzida principalmente para sua inclusão em óculos de sol de qualidade razoável, onde o usuário pode observar suas propriedades de eliminação de reflexos inclinando seu ponto de vista ou alterando seu ponto de vista no objeto reflexivo.

A luz solar é dispersa por moléculas de oxigênio e nitrogênio, com a luz azul sendo mais extensivamente dispersa do que outras comprimentos de onda, tornando o azul a cor nativa de um céu claro durante o dia. A luz azul é polarizada, e uma lente polarizada linear ou circular pode efetivamente eliminar essa luz polarizada, removendo reflexos no processo.

O artigo reconhece que para-brisas fumados poderiam impedir ou mesmo frustrar esse método de visualização do interior do carro. No entanto, como isso é limitado pela lei do Reino Unido, com regulamentações variando por estado nos EUA, o artigo não considera isso como um obstáculo principal.

YOLO

O sistema que o artigo propõe é destinado a ser integrado à infraestrutura cívica, como câmeras de vigilância ao lado da estrada instaladas pelo governo. Cientes de possíveis obstáculos sobre custo, os pesquisadores testaram várias configurações de sistemas de reconhecimento de objetos em diferentes níveis de qualidade de equipamento de captura e oferecem um cenário de custo mínimo onde filtros polarizadores baratos poderiam ser adicionados a câmeras existentes, com todos os outros aspectos do sistema remotos.

Quatro estruturas de reconhecimento de objetos foram testadas: You-Only-Look-Once (YOLO) versões 3 e 4; SSD rede base; Faster R-CNN; e CenterNet. Nos testes, os resultados mais precisos foram obtidos com YOLO V3, usando um fluxo de trabalho de duas etapas que primeiro localiza a área do para-brisa e, em seguida, procura um dispositivo móvel nesse espaço.

No entanto, a necessidade de executar o vídeo por meio de duas redes resulta em uma taxa de quadros menos do que ótima de 13,15fps, em comparação com cerca de 30fps no sistema mais simples. A qualidade dos resultados depende do equipamento de entrada, e os pesquisadores descobriram que, quando a entrada foi dividida entre câmeras de baixo custo e equipamentos de melhor qualidade, uma taxa de precisão de cerca de 96% foi possível no melhor equipamento, e 74,35% nas câmeras mais baratas.

Limitando Infrações Reconhecidas

Além de tornar o sistema economicamente viável, os pesquisadores estão preocupados em desenvolver um sistema totalmente automatizado com um mínimo de supervisão humana necessária, e o sistema foi concebido para entregar multas automaticamente. No entanto, como as leis em torno do uso de telefones móveis ao dirigir estão se tornando mais severas em todo o mundo, com penalidades que podem exceder multas ou deduções de pontos de licença (i.e. no Reino Unido), parece provável que a verificação humana casual permaneça um fator na implantação de tal sistema.

Apesar do uso de fluxo óptico e outros métodos para levar em conta a totalidade do conteúdo do vídeo, algoritmos de reconhecimento de objetos, como YOLO, consideram cada quadro como uma ‘história completa’, e o próximo quadro como um projeto subsequente. Portanto, um sistema desse tipo deve ser impedido de emitir (por exemplo) 128 multas separadas cobrindo 128 quadros de vídeo de captura de infração.

Para evitar isso, o sistema incorpora o algoritmo de rastreamento de objetos Deep SORT, que adiciona um ‘ID de incidente’ único a cada reconhecimento de infração e garante que o ID não seja duplicado em quadros dentro de uma sequência de captura única.

Manipulando Vigilância Noturna

Para condições noturnas, os pesquisadores usam captura por infravermelho, como usado em projetos de pesquisa anteriores que investigam o mesmo desafio. Eles testaram comprimentos de onda de IR de 850 e 730 nanômetros e descobriram que os melhores detalhes foram capturados com 730nm.

O artigo afirma que é necessária uma investigação mais aprofundada para determinar até que ponto a captura por infravermelho poderia ser usada durante condições diurnas.

Dados

Para a versão mais econômica do sistema de uma etapa, os pesquisadores usaram 2.235 imagens de placas de licença do conjunto de dados de imagens abertas do Google, e 2150 imagens de telefones móveis em estoque e personalizadas. Como era necessário incluir imagens de telefones sendo segurados por motoristas, 1.700 das imagens de telefones foram tiradas especificamente para o projeto.

A versão de duas etapas do sistema exigiu a anotação de 487 para-brisas, usados para treinar a primeira etapa do processo, além dos dados usados no processo de uma etapa.

Como não havia acesso à infraestrutura de vigilância rodoviária oficial, todas as imagens foram tiradas por voluntários para aproximar condições semelhantes.

Compromissos

Os resultados finais oferecem uma gama de padrões de precisão que precisariam ser compensados contra o custo de implementação, com equipamentos de captura superiores e resultados de processamento oferecendo a maior precisão, e uma precisão “aceitável” obtida por meio de retrofit barato de equipamentos de vigilância urbanos existentes.

O pipeline mais barato, de 'uma etapa', alcança algo perto de 75% de precisão, com os menores custos de implementação (i.e. a instalação de um filtro polarizador barato), enquanto o sistema de duas etapas mais complexo (que isola a área do para-brisa antes de procurar um dispositivo móvel segurado pelo motorista) alcança taxas de precisão mais altas, mas pode ser adequado apenas para nova infraestrutura, dependendo do orçamento disponível.

O pipeline mais barato, de ‘uma etapa’, alcança algo perto de 75% de precisão, com os menores custos de implementação (i.e. a instalação de um filtro polarizador barato), enquanto o sistema de duas etapas mais complexo (que isola a área do para-brisa antes de procurar um dispositivo móvel segurado pelo motorista) alcança taxas de precisão mais altas, mas pode ser adequado apenas para nova infraestrutura, dependendo do orçamento disponível. Em ambos os casos, a qualidade do equipamento de captura é uma variável adicional.

Como observado acima, a percepção dos pesquisadores sobre a viabilidade do projeto parece ser informada pela suposição de que o sistema deve funcionar entirely autonomamente – um requisito questionável.

Veja o vídeo oficial do projeto abaixo para mais detalhes sobre a implementação e as abordagens usadas.

Escritor sobre aprendizado de máquina, especialista em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa da Metaphysic.ai.