Kontakt med oss

Overvåkning

AI kan identifisere en person fra et enkelt fottrinn

mm
Passiv multipersonidentifikasjon via Deep Footstep Separation and Recognition (PURE)

Et nytt forskningsinitiativ har produsert et lavkostsystem som er i stand til å identifisere en person basert på lyden av fottrinnene deres, fra så lite som et enkelt trinn.

papir Passiv flerpersonsidentifikasjon via dyp fottrinnseparasjon og gjenkjenning (PURE), et samarbeid mellom forskere fra blant annet Nanyang Technological University og University of Kentucky, ble identifiseringsrater etablert på opptil 90 %, fra lydprøver som er ekstremt korte.

Fem karakteristiske fottrinnsprofiler fanget i PURE.

Fem karakteristiske fottrinnsprofiler fanget i PURE.

Arkitekturen for PURE er avhengig av data fra en rekke varemikrofoner, med rålydopptaket forkastet via bakgrunnen spektral subtraksjon. Der signal-til-støy-forholdet er høyt, inkludert samtale som finner sted på fangsttidspunktet, aktiveres en kildeseparasjonsalgoritme for å utføre diskret ekstraksjon av fottrinnene.

REN systemarkitektur

Skrittlyden klargjøres og analyseres via domene motstridende tilpasning, med rammeverket som omfatter en funksjonsekstraktor, en identitetsprediktor og en domenediskriminator.

Identifikasjonsnettverk REN ganganalyse

Maskinvare for PURE

Utstyret som brukes til PURE er en mikrofongruppe innebygd i en tilpasset rigg basert rundt Raspberry Pi 4.

PURE ganggjenkjenningsmaskinvare

Mikrofonene fanger opp lyd med den høyeste tilgjengelige hastigheten for 'strukturbårne' signaler (føtter som kommer i kontakt med bakken), siden disse dataene er av ekstremt kort varighet og må være så detaljerte som mulig. Imidlertid blir luftbårne fottrinn (lydføttene lager i buen mot neste kontakt med bakken) nedsamplet til 16kHz for å spare lokal prosesseringskapasitet for strukturbårne trinn.

Forskerne syntetiserte et treningsdatasett fra Footsteps Sound Effects Soundboard, så vel som fra Footsteps lydeffekter fra Epidemic Sound. Lydkomponenten fra forskjellige Ted Talks ble brukt til å produsere treningsdata for prosessen med å eksfiltrere fotspor fra bakgrunnssamtaler.

Forhindrer 'replay-angrep' i fottrinnsgjenkjenning

Et system av denne arten må være motstandsdyktig mot "replay-angrep", der en ondsinnet kan registrere et bestemt fottrinnmønster og spille det på nytt i håp om at systemet vil identifisere opptaket som en live-bruker.

For å hindre dette, analyserer PURE Time-of-Arrival (ToA) i 'kontakt' fotspor, og Angle-of-Arrival (AoA) i luftbårne fotspor.

PURE gjentatt fottrinnanalyse

Mangelen på dynamisk informasjon i gjenspilte fotspor avslører dem ganske enkelt, selv om det er nødvendig å ta hensyn til dette når dataene behandles. Ved å observere den naturlige uregelmessigheten til fottrinn, og også deres hastighet i sammenheng med miljøet (siden det er usannsynlig at man enten vil løpe eller tulle for eksempel i et kontormiljø), er det mulig å sikre at dataene som mottas er autentiske .

Prosjektet bruker stråleforming teknikker for å beregne ToA, men utvinningen av AoA er mer kompleks, og krever et R-Net nevralt nettverk som igjen bruker motstridende læring for å beregne rekkevidden til et fottrinn. Dette er i hovedsak den samme modellen som det tidligere nevrale nettverket, bortsett fra at identitetsprediktoren er erstattet med en rekkeviddeestimator.

Nøyaktighet

PURE ble testet i et bredt spekter av akustiske miljøer, og ved bruk av en rekke ganghastigheter over en rekke avstander. Etter hvert som antallet mennesker som lager fottrinn øker, faller nøyaktigheten naturlig, slik den også gjør når hastigheten til flere fottrinnkilder øker.

Men, avhengig av domenetilpasning, fant resultatene over 100 forsøk at systemet kunne identifisere en bruker fra 3-5 fottrinn med et nøyaktighetsområde fra 90.73 % til 96.53 %; fra 2-3 fottrinn med et nøyaktighetsområde fra 88.16 % til 95.92 %; og fra et enkelt fottrinn med et nøyaktighetsområde fra 81.75 % til 88.6 %.

Forskerne forutser bred anvendelighet for PURE, på grunn av den lave kostnaden for råvaremaskinvaren som er involvert, og det faktum at den også utkonkurrerer lignende systemer når det gjelder ventetid og nøyaktighet, samtidig som den er robust mot miljøforstyrrelser og replay-angrep.

Veksten av ganganalyse

Denne spesielle sfæren av maskinlæringsforskning har først og fremst sentrert seg om datasyn de siste ti årene, og har fått en kulturell fylling da brukt som plottenhet i Mission umulig: Rogue Nation (2015).

Til dags dato har ganggjenkjenningsteknologier blitt foreslått for bruk i eldreomsorg, etter kirurgi rehabilitering, og mer kontroversielt for personlig tilpasset annonsevisning i detaljhandelsmiljøer, selv om et slikt system åpenbart har potensielle bruksområder for ansattes overvåking i sikre miljøer.

I 2018 var det rapportert at kinesiske myndigheter bruker visjonsbasert ganganalyse fra AI-utviklingsselskap Watrix som en fasett i sine lukkede kretsløp for offentlige overvåkingssystemer.

Ganggjenkjenning er også implementert av overvåking reflektansen til Wi-Fi-signaler.

Imidlertid har alle disse tilnærmingene iboende begrensninger, enten de krever lysforhold som ikke kan garanteres, ulukkede utsikter, uoverkommelig dyrt spesialutstyr, altfor spesifikke lokale forhold eller kroppsbåret utstyr, blant andre hindringer.

Forfatter på maskinlæring, domenespesialist i menneskelig bildesyntese. Tidligere leder for forskningsinnhold hos Metaphysic.ai.
Personlig side: martinanderson.ai
Kontakt: [e-postbeskyttet]
Twitter: @manders_ai