Connect with us

Overvåkning

AI avdekker hemmelig aktivitet avdekket av blanke vegger

mm

Et forskningssamarbeid, inkludert bidragsytere fra NVIDIA og MIT, har utviklet en maskinlæringsmetode som kan identifisere skjulte personer bare ved å observere indirekte belysning på en nærliggende vegg, selv når personene ikke er i nærheten av lyskildene. Metoden har en nøyaktighet på nærmere 94% når det gjelder å identifisere antallet skjulte personer, og kan også identifisere den spesifikke aktiviteten til en skjult person ved å forstørre lysrefleksjoner som er usynlige for det menneskelige øye og for standardmetoder for bildeforstørring.

Umerkelige forstyrrelser av lys, forstørret av den nye metoden, som bruker konvolusjonsneurale nettverk til å identifisere områder med endring. Kilde: https://www.youtube.com/watch?v=K4PapXyX-bI

Umerkelige forstyrrelser av lys, forstørret av den nye metoden, som bruker konvolusjonsneurale nettverk til å identifisere områder med endring. Kilde: https://www.youtube.com/watch?v=K4PapXyX-bI

Den nye artikkelen har tittelen Hva du kan lære av å stirre på en blank vegg, med bidrag fra NVIDIA og MIT, samt Israel Institute of Technology.

Tidligere tilnærminger til ‘å se rundt vegger’ har avhengig av kontrollerbare lyskilder eller forhåndskunnskap om kjente kilder for okklusjon, mens den nye teknikken kan generaliseres til enhver ny rom, uten krav om omkalibrering. De to konvolusjonsneurale nettverkene som individuerer skjulte personer brukte data fra bare 20 scener.

Prosjektet er rettet mot høyrisikosituasjoner, sikkerhetskritiske situasjoner, søk- og redningsoperasjoner, generelle overvåkingsoppgaver for politiet, nødsituasjoner, for å oppdage fall blant eldre mennesker, og som et middel til å oppdage skjulte fotgjengere for autonome kjøretøy.

Passiv evaluering

Som ofte er tilfelle med datavisjonsprosjekter, var den sentrale oppgaven å identifisere, klassifisere og operasjonalisere oppfattede tilstandsforandringer i en bildestream. Å kombinere forandringene leder til signaturmønster som kan brukes enten til å identifisere et antall personer eller til å oppdage aktiviteten til en eller flere personer.

Arbeidet åpner opp muligheten for fullstendig passiv scenarievaluering, uten å måtte bruke reflekterende overflater, Wi-Fi-signaler, radar, lyd eller noen andre ‘spesielle omstendigheter’ som er nødvendig i andre forskningsinnsats de siste årene som har søkt å etablere skjult menneskelig tilstedeværelse i en farlig eller kritisk miljø.

En eksempel på en datainnsamlingssituasjon av typen som er brukt i den nye forskningen. Faktorene er nøye plassert for ikke å kaste skygge eller å direkte okkludere noen lys, og ingen reflekterende overflater eller andre 'juks' er tillatt. Kilde: https://arxiv.org/pdf/2108.13027.pdf

En eksempel på en datainnsamlingssituasjon av typen som er brukt i den nye forskningen. Kilde: https://arxiv.org/pdf/2108.13027.pdf

Effektivt, den omgivende lyset for den typiske scenariet som er tenkt for anvendelsen, ville overvelde noen mindre forstyrrelser forårsaket av reflektert lys fra personer som er skjult andre steder i scenariet. Forskerne beregner at lysforstyrrelsesbidraget fra personene ville vanligvis være mindre enn 1% av det totale synlige lyset.

Fjerning av statisk belysning

For å trekke ut bevegelse fra den tilsynelatende statiske veggbilden, er det nødvendig å beregne den temporale gjennomsnittet av videoen og fjerne det fra hver ramme. De resulterende bevegelsesmønstrene er vanligvis under støyterskelen til og med god kvalitets videoutstyr, og i virkeligheten skjer mye av bevegelsen innenfor et negativt pikselrom.

For å rette opp dette, downsampler forskerne videoen med en faktor på 16 og oppskaler den resulterende filmen med en faktor på 50, samtidig som de legger til en midtgrå base til å påvise nærværet av negative piksler (som ikke kunne regnes med ved basis video sensor støy).

Forskjellen mellom den menneskelige oppfattede veggen, og den ekstraherte forstyrrelsen av skjulte personer. Ettersom bildekvalitet er et sentralt problem i denne forskningen, vennligst se den offisielle videoen nedenfor for en høyere kvalitet bilde.

Forskjellen mellom den menneskelige oppfattede veggen, og den ekstraherte forstyrrelsen av skjulte personer.

Vinduet for å oppfatte bevegelse er svært skjørt, og kan påvirkes selv av lysblink med en 60 Hz AC-frekvens. Derfor må også denne naturlige forstyrrelsen vurderes og fjernes fra filmen før personindusert bevegelse vil dukke opp.

Til slutt produserer systemet rom-tid-plott som signaliserer et bestemt antall skjulte rombeboere – diskrete visuelle signaturer:

Signatur rom-tid-plott som representerer ulike antall skjulte personer i et rom.

Signatur rom-tid-plott som representerer ulike antall skjulte personer i et rom.

Forskjellige menneskelige aktiviteter vil også resultere i signaturforstyrrelser som kan klassifiseres og senere gjenkjennes:

Rom-tid-plott-signaturer for inaktivitet, gåing, knebøy, vifte med hendene og hopping.

Rom-tid-plott-signaturer for inaktivitet, gåing, knebøy, vifte med hendene og hopping.

For å produsere en automatisert maskinlæringsbasert arbeidsflyt for skjult persongjenkjenning, ble variert film fra 20 passende scener brukt til å trene to neurale nettverk som opererer på bredt liknende konfigurasjoner – en til å telle antallet personer i en scene, og den andre til å identifisere noen bevegelse som skjer.

Testing

Forskerne testet det trente systemet i ti usette, virkelige miljøer som var designet for å rekonstruere begrensningene som var forventet for den endelige utrullingen. Systemet kunne oppnå opptil 94,4% nøyaktighet (over 256 rammeverk – vanligvis bare over 8 sekunder med video) i klassifisering av antallet skjulte personer, og opptil 93,7% nøyaktighet (under samme betingelser) i klassifisering av aktiviteter. Selv om nøyaktigheten synker med færre kilde-rammer, er det ikke en lineær nedgang, og selv 64 rammeverk vil oppnå en 79,4% nøyaktighetsrate for ‘antall-personer’-evaluering (mot nesten 95% for fire ganger så mange rammeverk).

Selv om metoden er robust mot værbaserte endringer i belysning, sliter den i en scene belyst av en TV, eller under omstendigheter hvor personene er iført ensfargede klær som er lik veggen.

Flere detaljer om forskningen, inkludert høykvalitetsfilm av ekstraksjonene, kan ses i den offisielle videoen nedenfor.

Forfatter på maskinlæring, domeneekspert på menneskesynthese. Tidligere leder for forskningsinnhold på Metaphysic.ai.