Connect with us

‘Mesteransikter’ Som Kan Omgå Over 40% Av Ansikts-ID-AuthentifiseringsSystemer

Cybersikkerhet

‘Mesteransikter’ Som Kan Omgå Over 40% Av Ansikts-ID-AuthentifiseringsSystemer

mm

Forskere fra Israel har utviklet et neuralt nettverk som kan generere ‘mester’-ansikter – ansiktsbilder som hver kan etterligne flere ID-er. Arbeidet viser at det er mulig å generere slike ‘mester-nøkler’ for mer enn 40% av befolkningen ved å bruke bare 9 ansikter syntetisert av StyleGAN Generative Adversarial Network (GAN), via tre ledende ansiktsgjenkjenningssystemer.

Paperet er et samarbeid mellom Blavatnik School of Computer Science og skolen for elektroingeniørvingen, begge ved Tel Aviv.

Ved å teste systemet, fant forskerne at ett enkelt generert ansikt kunne låse opp 20% av alle identiteter i University of Massachusetts’ Labeled Faces in the Wild (LFW) åpne kilde database, en vanlig repository brukt for utvikling og testing av ansikts-ID-systemer, og benchmark-databasen for det israelske systemet.

Den israelske system-workflowen, som bruker StyleGAN-generatoren til å iterativt søke etter 'mesteransikter'. Kilde: https://arxiv.org/pdf/2108.01077.pdf

Den israelske system-workflowen, som bruker StyleGAN-generatoren til å iterativt søke etter ‘mesteransikter’. Kilde: https://arxiv.org/pdf/2108.01077.pdf

Den nye metoden forbedrer en lignende nylig paper fra University of Siena, som krever en privilegert tilgang til maskinlæringsrammeverket. I motsetning til det nye systemet, infererer den generelle egenskapene fra offentlig tilgjengelig materiale og bruker det til å skape ansiktskarakteristika som strides over et stort antall identiteter.

Utvikling Av Mesteransikter

StyleGAN brukes først i denne tilnærmingen under en black box-optimiseringsmetode som fokuserer (ikke overraskende) på høydimensjonalt data, siden det er viktig å finne de bredeste og mest generelle ansikts-egenskapene som vil tilfredsstille et authentifiseringsystem.

Denne prosessen gjentas deretter iterativt for å omfatte identiteter som ikke var kodet i den første passeringen. I varierende testforhold, fant forskerne at det var mulig å oppnå authentifisering for 40-60% med bare ni genererte bilder.

Suksessive grupper av 'mesteransikter' oppnådd i forskningen over ulike Deknings-søke-metoder, inkludert LM-MA-ES. Den gjennomsnittlige sett-dekning (MSC, en målestokk for nøyaktighet) er notert under hver bilde.

Suksessive grupper av ‘mesteransikter’ oppnådd i forskningen over ulike Deknings-søke-metoder, inkludert LM-MA-ES. Den gjennomsnittlige sett-dekning (MSC, en målestokk for nøyaktighet) er notert under hver bilde.

Systemet bruker en evolusjonsalgoritme koblet med en neuralt prediktor som estimerer sannsynligheten for at den nåværende ‘kandidaten’ vil generalisere bedre enn p-prosentilen av kandidater generert i tidligere passeringer.

Filtrering av genererte kandidater i arkitekturen til det israelske systemet.

Filtrering av genererte kandidater i arkitekturen til det israelske systemet.

LM-MA-ES

Prosjektet bruker Limited-Memory Matrix Adaptation (LM-MA-ES) algoritmen utviklet for en 2017-initiativ ledet av Research Group on Machine Learning for Automated Algorithm Design, en tilnærming som er godt egnet for høydimensjonal black box-optimisering.

LM-MA-ES utsteder kandidater tilfeldig. Selv om dette er godt egnet for prosjektets intensjoner, er en ekstra komponent nødvendig for å avgjøre hvilke ansikter som er de beste kandidatene for kryss-identitetsauthentifisering. Derfor skapte forskerne en ‘Suksess-Prediktor’ neuralt klassifiserer for å si hva som er de beste ansiktene for oppgaven.

Rasjonale for Suksess-Prediktor brukt i det israelske ansiktsidentifikasjonsspoofing-prosjektet.

Rasjonale for Suksess-Prediktor brukt i det israelske ansiktsidentifikasjonsspoofing-prosjektet.

Evaluering

Systemet ble testet mot tre CNN-baserte ansiktsbeskrivere: SphereFace, FaceNet og Dlib, hver systemarkitektur som inneholder en likhet-målestokk og en tap-funksjon, som er nyttige i å validere systemets nøyaktighetsscore.

Suksess-Prediktor er en feed-forward neural network bestående av tre fullstendig koblete lag. Det første av disse bruker BatchNorm regulering for å sikre konsistens av data før aktivasjon. Nettverket bruker ADAM som optimizer, med en ambisiøs læringshastighet på 0,001 over batcher av 32 inndata-bilder.

Utdata fra de tre arkitekturene.

Utdata fra de tre arkitekturene.

Alle tre algoritmene testet ble trent for 26 400 fitness-funksjonskall ved å bruke samme sett med fem frø.

Forskerne hadde etablert på dette punktet at lengre treningsprosesser ikke ga noen fordel for systemet; effektivt, den israelske tilnærmingen søker å utlede nøkkeldata fra en tidlig fase av modell-trening, hvor bare de høyeste egenskapene har blitt avgjort. Det er verdt å merke seg at dette er en gave, i forhold til rammeverksøkonomi.

Etter å ha etablert baseline-resultater med Facebooks Python-baserte NeverGrad gradient-fri optimiseringsmiljø, ble systemet profilert mot en rekke algoritmer, inkludert ulike varianter av Differential Evolution heuristikk.

Forskerne fant at en ‘grådighets’-tilnærming basert på Dlib overgikk sine konkurrenter, og lyktes i å skape ni mesteransikter som kunne låse opp 42%-64% av test-datasettet. Bruk av systemets Suksess-Prediktor forbedret disse svært gunstige resultater ytterligere.

Paperet hevder at ‘ansiktsbasert authentifisering er ekstremt sårbar, selv om det ikke finnes noen informasjon om mål-identiteten’, og forskerne betrakter sin initiativ som en gyldig tilnærming til en sikkerhets-inntrengningsmetode for ansiktsgjenkjenningssystemer.

Forfatter på maskinlæring, domeneekspert på menneskesynthese. Tidligere leder for forskningsinnhold på Metaphysic.ai.