Inteligência artificial
Usando as Mãos como Identificador Biométrico em Vídeo Forense Criminal

Pesquisadores no Reino Unido desenvolveram um sistema biométrico de aprendizado de máquina capaz de identificar indivíduos pela forma das suas mãos. A intenção do trabalho é ajudar a identificar ofensores, particularmente em casos de ofensores sexuais que gravaram seus crimes, onde as informações das mãos são frequentemente o único sinal biométrico disponível.
O artigo, intitulado Identificação de Pessoas com base em Mãos usando Aprendizado de Recursos Globais e Conscientes de Partes, e propõe um novo quadro de ML chamado Rede Global e Consciente de Partes (GPA-Net).

Na GPA-Net, dois tensores 3D distintos (global e local) são obtidos passando a imagem de origem por camadas convolucionais empilhadas na rede de backbone ResNet50. Cada uma das vias analíticas fará uma previsão de identidade. Fonte: https://arxiv.org/pdf/2101.05260.pdf
A GPA-Net cria ramos locais e globais na camada convolucional, a fim de criar sistemas de reconhecimento distintos para as mãos como um todo (com mãos esquerdas e direitas distintamente reconhecidas, ao contrário de algumas tentativas anteriores neste setor) e as partes da mão, que por si só podem atuar como bandeiras de alimentação para uma melhor identificação da mão toda.
A pesquisa vem da Escola de Computação e Comunicações da Universidade de Lancaster, e é liderada por Nathanael L. Baisa, agora Professor Assistente na Universidade De Montfort, em Leicester.
Mãos como Indicadores Biométricos Consistentes
Os pesquisadores observam que as mãos oferecem uma coleção consistente de características biométricas distintas que podem ser menos sujeitas à idade, tentativas de disfarce ou outros fatores distorcidos (como variações de expressões, no caso de captura facial) que podem influenciar a confiabilidade de sistemas de indicadores mais populares, incluindo reconhecimento de marcha e reconhecimento facial.
Embora sistemas de segurança tenham sido concebidos que utilizam padrões de veias das mãos por meio de imagem infravermelha, isso não é provável que se torne disponível nos tipos de dispositivos de gravação usados em crimes. Em vez disso, a pesquisa atual se concentra em capturas obtidas por meio de câmeras digitais padrão, geralmente incorporadas em dispositivos móveis, mas no caso de crimes sexuais, frequentemente mais prováveis de serem obtidas por câmeras “dumb” que são menos inclinadas a compartilhar informações de rede.
Ironicamente, a impressão palmar, possivelmente o método biométrico mais popular apresentado em filmes de ficção científica dos últimos cinquenta anos, não desfrutou da adoção esperada pelos futuristas, talvez porque os sistemas de identificação por impressão digital requerem superfícies de reconhecimento menores e mais baratas. No entanto, a Fujitsu produziu um estudo promocional em 2016 argumentando que o reconhecimento de padrões de veias palmares é uma ferramenta biométrica superior para sistemas de segurança.
Conjuntos de Dados e Testes
A GPA-Net é, de acordo com os pesquisadores, o primeiro sistema treinado de ponta a ponta para tentar reconhecimento de mãos. O backbone central de sua rede é baseado no ResNet50 treinado sobre o ImageNet. Esses foram escolhidos por sua capacidade de performar bem em uma variedade de plataformas, incluindo Google Inception (um GoogleNet módulo que evoluiu para uma Rede Neural Convolucional em evolução especializada em detecção de objetos e análise de imagens).
A estrutura GPA-Net foi testada em dois conjuntos de dados – o conjunto 11k Hands de 2016, uma colaboração entre pesquisadores do Canadá e do Egito; e o conjunto de dados Hand Dorsal (HD) da Universidade Politécnica de Hong Kong.

Um detalhe de ‘Identificação Pessoal Usando Padrões de Knuckle Menor da Superfície Dorsal da Mão’, focando na identificação de knuckles.
O conjunto de dados 11k apresenta 190 sujeitos de identidade, incluindo uma variedade de metadados sobre ID, idade, cor da pele, gênero e outros fatores. Os pesquisadores excluíram qualquer imagem que contivesse joias, pois essas inevitavelmente acabariam como outliers disruptivos. Eles também excluíram imagens do conjunto de dados HD que não tinham clareza adequada, pois a correspondência de ID é um setor mais sensível do que a síntese de imagens, e os dados obscurecidos são um perigo maior.
A GPA-Net foi executada em um quadro de aprendizado profundo PyTorch em uma única GPU NVIDIA GeForce RTX 2080 Ti com 11gb de VRAM. O modelo foi treinado usando perda de entropia cruzada, e um otimizador de Descida de Gradiente Estocástico (SGD) mini-lote. O treinamento ocorreu durante 60 épocas com uma taxa de aprendizado inicial de 0,02, tratada posteriormente por um agendador de taxa de aprendizado com um fator de decadência de 0,1 para cada 30 épocas – efetivamente desacelerando o treinamento à medida que os recursos de alta dimensão se tornam rapidamente incorporados, e o sistema deve subsequentemente gastar mais tempo percorrendo os dados para mais detalhes granulares.
A avaliação foi realizada usando a métrica Características de Combinação Cumulativa (CMC) com Precisão Média Averagem (mAP).
Os pesquisadores encontraram que a GPA-Net supera os métodos concorrentes no ResNet50 por 24,74% na precisão de classificação 1 e por 37,82% na mAP.

Resultados qualitativos do teste do sistema GPA-Net. As linhas de cima para baixo são as reconhecimentos dorsais direitos do conjunto 11k, dorsal esquerdo do mesmo, palmar direito do mesmo, e o palmar esquerdo dos conjuntos de dados 11k e HD. Caixas delimitadoras verdes e vermelhas indicam combinações corretas e incorretas.
Os pesquisadores consideram que o método tem ‘forte potencial para identificação robusta dos perpetradores de crimes graves’.












