Connect with us

Intelligenza artificiale

Utilizzo delle mani come identificatore biometrico nella videosorveglianza forense

mm

I ricercatori nel Regno Unito hanno sviluppato un sistema biometrico di apprendimento automatico in grado di identificare gli individui sulla base della forma delle loro mani. L’intento del lavoro è quello di aiutare nell’identificazione degli autori di reati, in particolare nei casi di autori di reati sessuali che hanno registrato i loro crimini, dove le informazioni sulla mano sono spesso l’unico segnale biometrico disponibile.

Il documento, intitolato Identificazione della persona basata sulla mano utilizzando la rappresentazione delle caratteristiche globali e locali con apprendimento profondo, e propone un nuovo framework di apprendimento automatico chiamato Global and Part-Aware Network (GPA-Net).

In GPA-Net, due tensori 3D distinti (globali e locali) vengono ottenuti passando l'immagine sorgente attraverso strati convoluzionali impilati sulla rete backbone ResNet50. Ogni una delle vie analitiche effettuerà una previsione di identità. Fonte: https://arxiv.org/pdf/2101.05260.pdf

In GPA-Net, due tensori 3D distinti (globali e locali) vengono ottenuti passando l’immagine sorgente attraverso strati convoluzionali impilati sulla rete backbone ResNet50. Ogni una delle vie analitiche effettuerà una previsione di identità. Fonte: https://arxiv.org/pdf/2101.05260.pdf

GPA-Net crea rami locali e globali nello strato convoluzionale, al fine di creare sistemi di riconoscimento distinti per l’intera mano (con mani sinistra e destra riconosciute distintamente, a differenza di alcuni precedenti tentativi in questo settore) e le parti della mano, che possono agire come indicatori di identificazione della mano intera.

La ricerca proviene dalla School of Computing and Communications dell’Università di Lancaster, e è guidata da Nathanael L. Baisa, ora Assistant Professor all’Università De Montfort di Leicester.

Mani come indicatori biometrici consistenti

I ricercatori osservano che le mani offrono una collezione consistente di caratteristiche biometriche distinte che possono essere meno soggette all’età, ai tentativi di mascheramento o ad altri fattori distorti (come la variazione delle espressioni, nel caso della cattura facciale) che possono influenzare l’affidabilità di sistemi indicatori più popolari, tra cui il riconoscimento della andatura e il riconoscimento facciale.

Sebbene siano stati progettati sistemi di sicurezza che utilizzano modelli di vena della mano attraverso l’imaging a infrarossi, ciò non è probabile che diventi disponibile nei tipi di dispositivi di registrazione utilizzati nei crimini. Piuttosto, la ricerca attuale si concentra su catture ottenute attraverso fotocamere digitali standard, solitamente incorporate in dispositivi mobili, ma nel caso di crimini sessuali, spesso più probabile che vengano ottenute da “fotocamere stupide” che sono meno inclini a condividere informazioni di rete.

Ironia della sorte, la impronta palmare, forse il metodo biometrico più popolare presente nei film di fantascienza degli ultimi cinquant’anni, non ha goduto del successo atteso dai futuristi, forse perché i sistemi di riconoscimento delle impronte digitali richiedono superfici di riconoscimento più piccole e più economiche. Tuttavia, Fujitsu ha prodotto uno studio promozionale nel 2016 che sostiene che il riconoscimento del modello di vena della mano è uno strumento biometrico superiore per i sistemi di sicurezza.

Set di dati e testing

GPA-Net è, secondo i ricercatori, il primo sistema addestrato end-to-end per tentare il riconoscimento della mano. La colonna vertebrale della sua rete è basata su ResNet50 addestrato su ImageNet. Questi sono stati scelti per la loro capacità di funzionare bene su una varietà di piattaforme, tra cui Google Inception (un modulo GoogleNet che si è evoluto in una rete neurale convoluzionale in evoluzione specializzata nella rilevazione di oggetti e analisi di immagini).

Il framework GPA-Net è stato testato su due set di dati – il set 11k Hands del 2016, una collaborazione tra ricercatori del Canada e dell’Egitto; e il set di dati Hand Dorsal (HD) dell’Università Politecnica di Hong Kong.

Un dettaglio da 'Personal Identification Using Minor Knuckle Patterns From Palm Dorsal Surface', concentrandosi sull'identificazione dei knuckle.

Un dettaglio da ‘Personal Identification Using Minor Knuckle Patterns From Palm Dorsal Surface’, concentrandosi sull’identificazione dei knuckle.

Il set di dati 11k presenta 190 soggetti di identità, tra cui una varietà di metadati relativi a ID, età, colore della pelle, genere e altri fattori. I ricercatori hanno escluso qualsiasi immagine che contenesse gioielli, poiché questi sarebbero inevitabilmente finiti come outlier disruptivi. Hanno anche escluso immagini dal set di dati HD che mancavano di chiarezza adeguata, poiché l’abbinamento dell’ID è un settore più sensibile rispetto alla sintesi di immagini, e i dati oscurati sono un pericolo maggiore.

GPA-Net è stato eseguito su un framework di apprendimento profondo PyTorch su una sola GPU NVIDIA GeForce RTX 2080 Ti con 11 GB di VRAM. Il modello è stato addestrato utilizzando cross-entropy loss, e un ottimizzatore Stochastic Gradient Descent (SGD) a mini-lotto. L’addestramento è avvenuto su 60 epoche con un tasso di apprendimento iniziale di 0,02, gestito successivamente da un programma di pianificazione del tasso di apprendimento con un fattore di decadimento di 0,1 per ogni 30 epoche – effettivamente rallentando l’addestramento mentre le caratteristiche ad alta dimensionalità si impiantano rapidamente, e il sistema deve successivamente spendere più tempo per attraversare i dati per più dettagli granulari.

La valutazione è stata eseguita utilizzando la metrica Cumulative Matching Characteristics (CMC) con Mean Average Precision (mAP).

I ricercatori hanno trovato che GPA-Net supera i metodi concorrenti su ResNet50 del 24,74% in accuratezza di rank-1 e del 37,82% su mAP.

Risultati qualitativi del test del sistema GPA-Net. Le righe dall'alto in basso sono le riconoscimenti dorsali destra dei set 11k, sinistra dorsale dello stesso, destra palmare dello stesso, e la sinistra palmare dei set 11k e HD. Le caselle verdi e rosse indicano abbinamenti corretti e scorretti.

Risultati qualitativi del test del sistema GPA-Net. Le righe dall’alto in basso sono le riconoscimenti dorsali destra dei set 11k, sinistra dorsale dello stesso, destra palmare dello stesso, e la sinistra palmare dei set 11k e HD. Le caselle verdi e rosse indicano abbinamenti corretti e scorretti.

I ricercatori ritengono che il metodo abbia ‘un forte potenziale per un’identificazione robusta degli autori di gravi reati’.

Scrittore su apprendimento automatico, specialista di dominio nella sintesi di immagini umane. Ex capo della ricerca contenuti presso Metaphysic.ai.