Ángulo de Anderson

Uso de las manos como identificador biométrico en la videoforensia criminal

mm

Investigadores en el Reino Unido han desarrollado un sistema biométrico de aprendizaje automático capaz de identificar a individuos por la forma de sus manos. El objetivo de este trabajo es ayudar a identificar a los delincuentes, particularmente en casos de delincuentes sexuales que han grabado sus crímenes, donde la información de las manos es a menudo el único señal biométrico disponible.

El documento, titulado Identificación de personas basada en manos utilizando representación de características globales y conscientes de partes profundas, y propone un nuevo marco de aprendizaje automático llamado Red Global y Consciente de Partes (GPA-Net).

En GPA-Net, se obtienen dos tensores 3D distintos (globales y locales) al pasar la imagen de origen a través de capas convolucionales apiladas en la red de base ResNet50. Cada una de las vías analíticas realizará una predicción de identidad. Fuente: https://arxiv.org/pdf/2101.05260.pdf

En GPA-Net, se obtienen dos tensores 3D distintos (globales y locales) al pasar la imagen de origen a través de capas convolucionales apiladas en la red de base ResNet50. Cada una de las vías analíticas realizará una predicción de identidad. Fuente: https://arxiv.org/pdf/2101.05260.pdf

GPA-Net crea ramas locales y globales en la capa convolucional, con el fin de crear sistemas de reconocimiento distintos para la totalidad de las manos (con manos izquierdas y derechas reconocidas de manera distinta, a diferencia de algunos intentos anteriores en este sector) y las partes de la mano, que en sí mismas pueden actuar como banderas de alimentación para una mejor identificación de la mano completa.

La investigación proviene de la Escuela de Computación y Comunicaciones de la Universidad de Lancaster, y está liderada por Nathanael L. Baisa, ahora profesor asistente en la Universidad De Montfort de Leicester.

Manos como indicadores biométricos consistentes

Los investigadores observan que las manos ofrecen una colección consistente de características biométricas distintas que pueden ser menos sujetas a la edad, los intentos de disfraz o otros factores distorsionadores (como la variación en las expresiones, en el caso de la captura facial) que pueden influir en la confiabilidad de sistemas de indicadores más populares, incluyendo el reconocimiento de la marcha y el reconocimiento facial.

Aunque los sistemas de seguridad han sido diseñados que utilizan patrones de venas de la mano a través de imágenes infrarrojas, esto no es probable que esté disponible en los tipos de dispositivos de grabación utilizados en los delitos. Más bien, la investigación actual se centra en las capturas obtenidas a través de cámaras digitales estándar, generalmente integradas en dispositivos móviles, pero en el caso de los delitos sexuales, a menudo más probable que se obtengan mediante “cámaras tontas” que son menos propensas a compartir información de la red.

Irónicamente, la huella de la palma, posiblemente el método biométrico más popular que se presenta en las películas de ciencia ficción de los últimos cincuenta años, no ha disfrutado del uso esperado por los futuristas, quizás porque los sistemas de identificación de huellas dactilares requieren superficies de reconocimiento más pequeñas y baratas. Sin embargo, Fujitsu produjo un estudio promocional en 2016 que argumentaba que el reconocimiento de patrones de venas de la palma es una herramienta biométrica superior para los sistemas de seguridad.

Conjuntos de datos y pruebas

GPA-Net es, según los investigadores, el primer sistema entrenado de extremo a extremo para intentar el reconocimiento de manos. El núcleo central de su red se basa en ResNet50 entrenado sobre ImageNet. Estos fueron elegidos por su capacidad para funcionar bien en una variedad de plataformas, incluyendo Google Inception (un módulo GoogleNet que evolucionó a una Red Neuronal Convolucional que se especializa en la detección de objetos y el análisis de imágenes).

El marco GPA-Net se probó en dos conjuntos de datos: el conjunto de 11k Manos de 2016, una colaboración entre investigadores de Canadá y Egipto; y el conjunto de datos Dorsal de la Mano (HD) de la Universidad Politécnica de Hong Kong.

Un detalle de 'Identificación personal utilizando patrones de nudillos menores de la superficie dorsal de la palma', centrado en la identificación de nudillos.

Un detalle de ‘Identificación personal utilizando patrones de nudillos menores de la superficie dorsal de la palma’, centrado en la identificación de nudillos.

El conjunto de datos de 11k cuenta con 190 sujetos de identidad, incluyendo una variedad de metadatos sobre ID, edad, color de piel, género y otros factores. Los investigadores excluyeron cualquier imagen que contuviera joyería, ya que estas inevitablemente terminarían como outliers disruptivos. También excluyeron imágenes del conjunto de datos HD que carecían de claridad adecuada, ya que la coincidencia de ID es un sector más sensible que la síntesis de imágenes, y los datos oscurecidos son un peligro mayor.

GPA-Net se ejecutó en un marco de aprendizaje profundo PyTorch en una sola GPU NVIDIA GeForce RTX 2080 Ti con 11 GB de VRAM. El modelo se entrenó utilizando pérdida de entropía cruzada, y un optimizador de gradiente estocástico descendente (SGD) en mini-lotes. El entrenamiento ocurrió durante 60 épocas con una tasa de aprendizaje inicial de 0,02, manejada posteriormente por un programador de tasa de aprendizaje con un factor de decaimiento de 0,1 por cada 30 épocas – efectivamente ralentizando el entrenamiento a medida que las características de alta dimensión se incorporan rápidamente, y el sistema debe posteriormente pasar más tiempo atravesando los datos para obtener detalles más granulares.

La evaluación se realizó utilizando la métrica de Características de Coincidencia Acumulativa (CMC) con Precisión Media Promedio (mAP).

Los investigadores encontraron que GPA-Net supera a los métodos competidores en ResNet50 en un 24,74% en precisión de rango 1 y en un 37,82% en mAP.

Resultados cualitativos de las pruebas del sistema GPA-Net. Las filas de arriba a abajo son los reconocimientos dorsales derechos del conjunto de 11k, dorsal izquierdo del mismo, palmar derecho del mismo, y el palmar izquierdo de los conjuntos de datos de 11k y HD. Las cajas delimitadoras verdes y rojas indican coincidencias correctas e incorrectas.

Resultados cualitativos de las pruebas del sistema GPA-Net. Las filas de arriba a abajo son los reconocimientos dorsales derechos del conjunto de 11k, dorsal izquierdo del mismo, palmar derecho del mismo, y el palmar izquierdo de los conjuntos de datos de 11k y HD. Las cajas delimitadoras verdes y rojas indican coincidencias correctas e incorrectas.

Los investigadores consideran que el método tiene ‘un fuerte potencial para la identificación robusta de los perpetradores de delitos graves’.

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Anterior jefe de contenido de investigación en Metaphysic.ai.