Connect with us

Künstliche Intelligenz

Verwendung von Händen als biometrischen Identifikator in der forensischen Videokriminalität

mm

Forscher im Vereinigten Königreich haben ein maschinelles Lernbiometriesystem entwickelt, das in der Lage ist, Personen anhand der Form ihrer Hände zu identifizieren. Die Absicht dieser Arbeit ist es, bei der Identifizierung von Tätern zu helfen, insbesondere in Fällen von Sexualstraftätern, die ihre Verbrechen aufgenommen haben, wo Handinformationen oft das einzige verfügbare biometrische Signal sind.

Das Papier, betitelt Handbasierte Personenerkennung unter Verwendung globaler und teilbewusster tiefer Merkmalsextraktion, und schlägt ein neues ML-Framework namens Global und Part-Aware-Netzwerk (GPA-Net) vor.

In GPA-Net werden zwei unterschiedliche 3D-Tensoren (global und lokal) durch das Durchlaufen des Quellbildes durch gestapelte konvolutive Schichten auf dem ResNet50-Backbonenetzwerk erhalten. Jeder der analytischen Wege wird eine Identitätsvorhersage treffen. Quelle: https://arxiv.org/pdf/2101.05260.pdf

In GPA-Net werden zwei unterschiedliche 3D-Tensoren (global und lokal) durch das Durchlaufen des Quellbildes durch gestapelte konvolutive Schichten auf dem ResNet50-Backbonenetzwerk erhalten. Jeder der analytischen Wege wird eine Identitätsvorhersage treffen. Quelle: https://arxiv.org/pdf/2101.05260.pdf

GPA-Net erstellt lokale und globale Zweige auf der konvolutiven Schicht, um unterschiedliche Erkennungssysteme für die gesamten Hände (mit linken und rechten Händen, die anders als bei einigen früheren Versuchen in diesem Sektor unterschieden werden) und die Teile der Hand zu erstellen, die selbst als Flags für eine bessere Identifizierung der gesamten Hand dienen können.

Die Forschung stammt von der School of Computing and Communications an der Lancaster University und wird von Nathanael L. Baisa geleitet, der jetzt Assistant Professor an der De Montfort University in Leicester ist.

Hände als konsistente biometrische Indikatoren

Die Forscher beobachten, dass Hände eine konsistente Sammlung von unterschiedlichen biometrischen Merkmalen bieten, die weniger anfällig für Alter, Versuche, sich zu verkleiden, oder andere verzerrende Faktoren (wie Variationen in Ausdrücken im Falle von Gesichtserkennung) sind, die die Zuverlässigkeit von beliebteren Indikatorsystemen, einschließlich Gang- und Gesichtserkennung, beeinflussen können.

Obwohl Sicherheitssysteme entwickelt wurden, die Handvenenmuster durch Infrarotbildgebung verwenden, ist es unwahrscheinlich, dass dies in den Arten von Aufnahmegeräten verwendet wird, die bei Verbrechen eingesetzt werden. Stattdessen konzentriert sich die aktuelle Forschung auf Aufnahmen, die durch Standard-Digitalkameras aufgenommen werden, die normalerweise in Mobilgeräten eingebettet sind, aber im Falle von Sexualverbrechen oft eher durch “dumb”-Kameras aufgenommen werden, die weniger geneigt sind, Netzwerkinformationen zu teilen.

Ironischerweise hat die Handflächenabdruckmethode, die möglicherweise die beliebteste biometrische Methode in Science-Fiction-Filmen der letzten fünfzig Jahre ist, nicht den Aufschwung erlebt, den Futuristen erwartet haben, vielleicht weil Fingerabdruck-IDs kleinere und günstigere Erkennungsflächen erfordern. Allerdings hat Fujitsu 2016 eine promotionale Studie durchgeführt, in der argumentiert wird, dass die Erkennung von Handvenenmustern ein überlegenes biometrisches Werkzeug für Sicherheitssysteme ist.

Datensätze und Tests

GPA-Net ist, laut den Forschern, das erste End-to-End-Trainingsystem, das sich um die Handerkennung bemüht. Der zentrale Backbone seines Netzwerks basiert auf ResNet50, das über ImageNet trainiert wurde. Diese wurden aufgrund ihrer Fähigkeit, auf einer Vielzahl von Plattformen gut zu performen, einschließlich Google Inception (ein GoogleNet-Modul, das zu einem sich entwickelnden Convolutional Neural Network für Objekterkennung und Bildanalyse wurde).

Das GPA-Net-Framework wurde auf zwei Datensätzen getestet – dem 2016er 11k-Hands-Datensatz, einer Zusammenarbeit zwischen Forschern aus Kanada und Ägypten; und dem Hand-Dorsal-(HD)-Datensatz der Hong Kong Polytechnic University.

Ein Detail aus 'Personal Identification Using Minor Knuckle Patterns From Palm Dorsal Surface', das sich auf die Knöchelidentifizierung konzentriert.

Ein Detail aus ‘Personal Identification Using Minor Knuckle Patterns From Palm Dorsal Surface’, das sich auf die Knöchelidentifizierung konzentriert.

Der 11k-Datensatz enthält 190 Identitätssubjekte, einschließlich einer Vielzahl von Metadaten bezüglich ID, Alter, Hautfarbe, Geschlecht und anderen Faktoren. Die Forscher schlossen alle Bilder aus, die Schmuck enthielten, da diese unweigerlich als störende Ausreißer enden würden. Sie schlossen auch Bilder aus dem HD-Datensatz aus, die nicht ausreichend klar waren, da die ID-Übereinstimmung ein empfindlicherer Sektor als die Bildsynthese ist und verdeckte Daten eine größere Gefahr darstellen.

GPA-Net wurde auf einem PyTorch-Deep-Learning-Framework auf einer einzelnen NVIDIA GeForce RTX 2080 Ti GPU mit 11 GB VRAM ausgeführt. Das Modell wurde mit Cross-Entropy-Verlust trainiert und einem Mini-Batch-Stochastic-Gradient-Descent- (SGD)-Optimizer. Die Ausbildung erfolgte über 60 Epochen bei einer anfänglichen Lernrate von 0,02, die danach von einem Lernrate-Scheduler mit einem Abfallfaktor von 0,1 für jede 30 Epochen gehandhabt wurde – effektiv verlangsamt das Training, da hochdimensionale Merkmale schnell eingebettet werden und das System danach länger braucht, um durch die Daten zu navigieren, um mehr granulare Details zu erhalten.

Die Bewertung wurde mit dem Cumulative Matching Characteristics- (CMC)-Maß und der mittleren Durchschnittsgenauigkeit (mAP) durchgeführt.

Die Forscher fanden heraus, dass GPA-Net die konkurrierenden Methoden auf ResNet50 um 24,74 % in der Rang-1-Genauigkeit und um 37,82 % auf mAP übertrifft.

Qualitative Ergebnisse aus dem Testen des GPA-Net-Systems. Die oberen bis unteren Reihen sind die rechten dorsalen Erkennungen des 11k-Satzes, die linken dorsalen des gleichen, die rechten palmar des gleichen und die linken palmar des 11k- und HD-Datensatzes. Grüne und rote Begrenzungsboxen zeigen korrekte und inkorrekte Übereinstimmungen an.

Qualitative Ergebnisse aus dem Testen des GPA-Net-Systems. Die oberen bis unteren Reihen sind die rechten dorsalen Erkennungen des 11k-Satzes, die linken dorsalen des gleichen, die rechten palmar des gleichen und die linken palmar des 11k- und HD-Datensatzes. Grüne und rote Begrenzungsboxen zeigen korrekte und inkorrekte Übereinstimmungen an.

Die Forscher sind der Meinung, dass die Methode ein ‘starkes Potenzial für eine robuste Identifizierung der Täter schwerer Verbrechen’ hat.

Autor über maschinelles Lernen, Domänen-Spezialist in der menschlichen Bildsynthese. Ehemaliger Leiter der Forschungsinhalte bei Metaphysic.ai.