Ciberseguridad

‘Rostros Maestros’ Que Pueden Sortear Más Del 40% De Los Sistemas De Autenticación De Identificación Facial

mm

Los investigadores de Israel han desarrollado una red neuronal capaz de generar ‘rostros maestros’ – imágenes faciales que cada una puede impersonar múltiples IDs. El trabajo sugiere que es posible generar tales ‘llaves maestras’ para más del 40% de la población utilizando solo 9 caras sintetizadas por la red generativa adversaria StyleGAN (GAN), a través de tres sistemas de reconocimiento facial líderes.

El artículo es una colaboración entre la Escuela de Ciencias de la Computación Blavatnik y la Escuela de Ingeniería Eléctrica, ambas en Tel Aviv.

Al probar el sistema, los investigadores encontraron que una sola cara generada podría desbloquear el 20% de todas las identidades en la base de datos de código abierto Labeled Faces in the Wild (LFW) de la Universidad de Massachusetts, un repositorio común utilizado para el desarrollo y la prueba de sistemas de identificación facial, y la base de datos de referencia para el sistema israelí.

El flujo de trabajo del sistema israelí, que utiliza el generador StyleGAN para buscar iterativamente 'rostros maestros'.

El flujo de trabajo del sistema israelí, que utiliza el generador StyleGAN para buscar iterativamente ‘rostros maestros’. Source: https://arxiv.org/pdf/2108.01077.pdf

El nuevo método mejora un artículo reciente similar de la Universidad de Siena, que requiere un nivel de acceso privilegiado al marco de aprendizaje automático. Por el contrario, el nuevo método infiere características generalizadas a partir de material público y las utiliza para crear características faciales que abarcan una gran cantidad de identidades.

Evolución De Rostros Maestros

StyleGAN se utiliza inicialmente en este enfoque bajo un método de optimización de caja negra que se centra (no sorprendentemente) en datos de alta dimensionalidad, ya que es importante encontrar las características faciales más amplias y generalizadas que satisfarán un sistema de autenticación.

Este proceso se repite iterativamente para abarcar identidades que no se codificaron en el pase inicial. En condiciones de prueba variables, los investigadores encontraron que era posible obtener autenticación para el 40-60% con solo nueve imágenes generadas.

Grupos sucesivos de 'rostros maestros' obtenidos en la investigación a través de varios métodos de búsqueda de cobertura, incluyendo LM-MA-ES. La cobertura media del conjunto (MSC, una métrica de precisión) se indica debajo de cada imagen.

Grupos sucesivos de ‘rostros maestros’ obtenidos en la investigación a través de varios métodos de búsqueda de cobertura, incluyendo LM-MA-ES. La cobertura media del conjunto (MSC, una métrica de precisión) se indica debajo de cada imagen.

El sistema utiliza un algoritmo evolutivo acoplado con un predictor neuronal que estima la probabilidad de que el ‘candidato’ actual generalice mejor que el percentil p de los candidatos generados en pasos anteriores.

La filtración de candidatos generados en la arquitectura del sistema israelí.

La filtración de candidatos generados en la arquitectura del sistema israelí.

LM-MA-ES

El proyecto utiliza el algoritmo de adaptación de matriz de memoria limitada (LM-MA-ES) desarrollado para una iniciativa de 2017 liderada por el Grupo de Investigación de Aprendizaje Automático para el Diseño de Algoritmos Automatizados, un enfoque que es muy adecuado para la optimización de caja negra de alta dimensionalidad.

El LM-MA-ES produce candidatos de forma aleatoria. Aunque esto es adecuado para el propósito del proyecto, se necesita un componente adicional para deducir qué caras son los mejores candidatos para la autenticación entre identidades. Por lo tanto, los investigadores crearon un ‘Predictor de Éxito’ clasificador neuronal para cribar la inundación de candidatos en las caras más adecuadas para la tarea.

Razonamiento del Predictor de Éxito utilizado en el proyecto de identificación facial israelí.

Razonamiento del Predictor de Éxito utilizado en el proyecto de identificación facial israelí.

Evaluación

El sistema se probó contra tres descriptores de caras basados en CNN: SphereFace, FaceNet y Dlib, cada arquitectura del sistema que contiene una métrica de similitud y una función de pérdida, que son útiles para validar las puntuaciones de precisión del sistema.

El Predictor de Éxito es una red neuronal de progresión que comprende tres capas completamente conectadas. La primera de estas utiliza la regularización BatchNorm para garantizar la consistencia de los datos antes de la activación. La red utiliza ADAM como optimizador, con una tasa de aprendizaje ambiciosa de 0,001 sobre lotes de 32 imágenes de entrada.

Salida de las tres arquitecturas.

Salida de las tres arquitecturas.

Los tres algoritmos probados se entrenaron durante 26.400 llamadas a la función de ajuste utilizando el mismo conjunto de cinco semillas.

Los investigadores habían establecido en este punto que los procesos de entrenamiento más largos no beneficiaban al sistema; efectivamente, el enfoque israelí está buscando derivar datos clave desde una etapa temprana del entrenamiento del modelo, donde solo se han discernido las características más altas. Vale la pena señalar que esto es algo de un regalo, en términos de economía del marco.

Habiendo establecido resultados de referencia con el entorno de optimización sin gradiente de Python de Facebook NeverGrad, el sistema se perfiló contra una serie de algoritmos, incluyendo varias marcas de la heurística de evolución diferencial.

Los investigadores encontraron que un enfoque ‘codicioso’ basado en Dlib superó a sus competidores, logrando crear nueve caras maestras capaces de desbloquear el 42%-64% del conjunto de datos de prueba. La aplicación del Predictor de Éxito del sistema mejoró aún más estos resultados muy favorables.

El artículo sostiene que ‘la autenticación basada en el rostro es extremadamente vulnerable, incluso si no hay información sobre la identidad objetivo’, y los investigadores consideran su iniciativa un enfoque válido para una metodología de incursión de seguridad para sistemas de reconocimiento facial.

Escritor sobre aprendizaje automático, especialista en síntesis de imágenes humanas. Anterior jefe de contenido de investigación en Metaphysic.ai.