Inteligencia artificial
Utilizando las manos como identificador biométrico en forenses de video criminales

Los investigadores en el Reino Unido han desarrollado un sistema biométrico de aprendizaje automático capaz de identificar a los individuos por la forma de sus manos. La intención del trabajo es ayudar a identificar a los delincuentes, particularmente en casos de delincuentes sexuales que han grabado sus crímenes, donde la información de la mano es a menudo el único señalaje biométrico disponible.
El documento, titulado Identificación de personas basada en manos utilizando representación de características globales y conscientes de partes profundas, y propone un nuevo marco de ML llamado Red Global y Consciente de Partes (GPA-Net).

En GPA-Net, se obtienen dos tensores 3D distintos (global y local) al pasar la imagen de origen a través de capas convolucionales apiladas en la red de backbone ResNet50. Cada una de las vías analíticas hará una predicción de identidad. Fuente: https://arxiv.org/pdf/2101.05260.pdf
GPA-Net crea ramas locales y globales en la capa convolucional, con el fin de crear sistemas de reconocimiento distintos para la totalidad de las manos (con manos izquierdas y derechas reconocidas de manera distinta, a diferencia de algunos intentos anteriores en este sector) y las partes de la mano, que en sí mismas pueden actuar como banderas de alimentación para una mejor identificación de la mano completa.
La investigación proviene de la Escuela de Computación y Comunicaciones de la Universidad de Lancaster, y está liderada por Nathanael L. Baisa, ahora profesor asistente en la Universidad De Montfort de Leicester.
Manos como indicadores biométricos consistentes
Los investigadores observan que las manos ofrecen una colección consistente de características biométricas distintas que pueden ser menos sujetas a la edad, los intentos de disfraz o otros factores distorsionantes (como la variación en las expresiones, en el caso de la captura facial) que pueden influir en la confiabilidad de sistemas de indicadores más populares, incluyendo el reconocimiento de la marcha y el reconocimiento facial.
Aunque se han diseñado sistemas de seguridad que utilizan patrones de venas de la mano a través de imágenes infrarrojas, esto no es probable que esté disponible en los tipos de dispositivos de grabación utilizados en crímenes. En cambio, la investigación actual se centra en capturas obtenidas a través de cámaras digitales estándar, generalmente incrustadas en dispositivos móviles, pero en el caso de delitos sexuales, a menudo es más probable que se obtengan mediante ‘cámaras tontas’ que son menos propensas a compartir información de red.
Irónicamente, la huella de la palma, posiblemente el método biométrico más popular presentado en películas de ciencia ficción de los últimos cincuenta años, no ha disfrutado del uso esperado por los futuristas, quizás porque los sistemas de identificación por huellas dactilares requieren superficies de reconocimiento más pequeñas y baratas. Sin embargo, Fujitsu produjo un estudio promocional en 2016 argumentando que el reconocimiento de patrones de venas de la palma es una herramienta biométrica superior para sistemas de seguridad.
Conjuntos de datos y pruebas
GPA-Net es, según los investigadores, el primer sistema entrenado de extremo a extremo para intentar el reconocimiento de manos. El esqueleto central de su red se basa en ResNet50 entrenado sobre ImageNet. Estos se eligieron por su capacidad para funcionar bien en una variedad de plataformas, incluyendo Google Inception (un módulo GoogleNet que se graduó a una red neuronal convolucional evolutiva especializada en detección de objetos y análisis de imágenes).
El marco de GPA-Net se probó en dos conjuntos de datos: el conjunto de 11k Hands de 2016, una colaboración entre investigadores de Canadá y Egipto; y el conjunto de datos Hand Dorsal (HD) de la Universidad Politécnica de Hong Kong.

Un detalle de ‘Identificación personal utilizando patrones de nudillos menores de la superficie dorsal de la palma’, centrado en la identificación de nudillos.
El conjunto de datos de 11k cuenta con 190 sujetos de identidad, incluyendo una variedad de metadatos sobre ID, edad, color de piel, género y otros factores. Los investigadores excluyeron cualquier imagen que contuviera joyería, ya que estas inevitablemente terminarían como outliers disruptivos. También excluyeron imágenes del conjunto de datos HD que carecían de claridad adecuada, ya que la coincidencia de ID es un sector más sensible que la síntesis de imágenes, y los datos oscurecidos son un peligro mayor.
GPA-Net se ejecutó en un marco de aprendizaje profundo PyTorch en una sola GPU NVIDIA GeForce RTX 2080 Ti con 11 GB de VRAM. El modelo se entrenó utilizando pérdida de entropía cruzada, y un optimizador de gradiente estocástico mini-lote (SGD). El entrenamiento se realizó durante 60 épocas con una tasa de aprendizaje inicial de 0,02, manejada posteriormente por un programador de tasa de aprendizaje con un factor de decaimiento de 0,1 por cada 30 épocas – efectivamente ralentizando el entrenamiento a medida que las características de alta dimensión se vuelven rápidamente incrustadas, y el sistema debe posteriormente pasar más tiempo atravesando los datos para obtener más detalles granulares.
La evaluación se realizó utilizando la métrica de Características de Coincidencia Acumulativa (CMC) con Precisión Media Averigua (mAP).
Los investigadores encontraron que GPA-Net supera a los métodos competidores en ResNet50 en un 24,74% en precisión de rango 1 y en un 37,82% en mAP.

Resultados cualitativos de la prueba del sistema GPA-Net. Las filas de arriba a abajo son las reconocimientos dorsales derechos del conjunto de 11k, dorsal izquierdo del mismo, palmar derecho del mismo, y el palmar izquierdo de los conjuntos de datos de 11k y HD. Las cajas delimitadoras verdes y rojas indican coincidencias correctas e incorrectas.
Los investigadores consideran que el método tiene ‘un fuerte potencial para la identificación robusta de los perpetradores de delitos graves’.












