Liity verkostomme!

Tekoäly

"Salaiset reitit", jotka voivat häiritä jalankulkijoiden tunnistusjärjestelmiä

mm

Julkaistu

 on

ChatGPT-4o: Variaatio kehotteessa: "1792 x 1024 ominaisuuskuva, joka esittää kohtisuoraa ariel-näkymää, joka katsoo alas NYC:n 42. kadun alueelle. Suurimman osan kuvasta tulee olla sininen sävy, mutta jalkakäytävän sisällä tulisi olla punaisia ​​polkuja, kuten eräänlainen karttareitti. Tee siitä kuin The Sims.

Uusi tutkimusyhteistyö Israelin ja Japanin välillä väittää, että jalankulkijoiden havaitsemisjärjestelmissä on luontaisia ​​heikkouksia, minkä ansiosta hyvin perillä olevat henkilöt voivat kiertää kasvojentunnistusjärjestelmiä navigoimalla huolellisesti suunniteltuja reittejä alueiden läpi, joilla valvontaverkot ovat vähiten tehokkaita.

Avulla julkisesti saatavilla olevaa materiaalia Tokiosta, New Yorkista ja San Franciscosta tutkijat kehittivät automatisoidun menetelmän tällaisten polkujen laskemiseen, joka perustuu suosituimpiin julkisissa verkoissa todennäköisesti käytössä oleviin esineiden tunnistusjärjestelmiin.

Tutkimuksessa käytetyt kolme risteystä: Shibuya Crossing Tokiossa, Japanissa; Broadway, New York; ja Castron alue, San Francisco. Lähde: https://arxiv.org/pdf/2501.15653

Tutkimuksessa käytetyt kolme risteystä: Shibuya Crossing Tokiossa, Japanissa; Broadway, New York; ja Castron alue, San Francisco. Lähde: https://arxiv.org/pdf/2501.15653

Tällä menetelmällä on mahdollista luoda luottamus lämpökartat jotka rajaavat kameran syötteen sisällä alueita, joilla jalankulkijat saavat vähiten todennäköisemmin positiivista kasvojentunnistusta:

Oikealla näemme tutkijoiden menetelmän luoman luottamuslämpökartan. Punaiset alueet osoittavat heikkoa luottamusta ja asennetta, kameran asentoa ja muita tekijöitä, jotka todennäköisesti vaikeuttavat kasvojen tunnistusta.

Oikealla näemme tutkijoiden menetelmän luoman luottamuslämpökartan. Punaiset alueet osoittavat heikkoa luottamusta ja asennetta, kameran asentoa ja muita tekijöitä, jotka todennäköisesti vaikeuttavat kasvojen tunnistusta.

Teoriassa tällainen menetelmä voitaisiin instrumentalisoida sijaintitietoiseksi sovellukseksi tai muuksi alustaksi, joka levittää vähiten "tunnistusystävällisiä" polkuja paikasta A paikkaan B missä tahansa lasketussa paikassa.

Uudessa asiakirjassa ehdotetaan tällaista menetelmää, jonka otsikko on Sijaintiin perustuva yksityisyyden parantamistekniikka (L-PET); se ehdottaa myös vastatoimia nimeltä Sijaintiin perustuva mukautuva kynnys (L-BAT), joka pohjimmiltaan käyttää täsmälleen samoja rutiineja, mutta käyttää sitten tietoja vahvistaakseen ja parantaakseen valvontatoimenpiteitä sen sijaan, että se suunnittelee tapoja välttää tunnustusta; ja monissa tapauksissa tällaiset parannukset eivät olisi mahdollisia ilman lisäinvestointeja valvontainfrastruktuuriin.

Tästä syystä asiakirja luo mahdollisen teknologisen kärjistymissodan niiden välillä, jotka pyrkivät optimoimaan reittejään havaitsemisen välttämiseksi ja valvontajärjestelmien kyvyn hyödyntää täysimääräisesti kasvojentunnistustekniikoita.

Aiemmat folion havaitsemismenetelmät ovat vähemmän tyylikkäitä kuin tämä ja keskittyvät niihin vastakkaisia ​​lähestymistapoja, Kuten TnT-hyökkäykset, ja painettuja kuvioita tunnistusalgoritmin sekoittamiseksi.

Vuoden 2019 teos "Automaattisten valvontakameroiden huijaaminen: kilpailevat paikat henkilöiden havaitsemiseen" osoitti kilpailevan painetun kuvion, joka pystyi vakuuttamaan tunnistusjärjestelmän siitä, että ketään ei havaita, mikä mahdollistaa eräänlaisen "näkymättömyyden". Lähde: https://arxiv.org/pdf/1904.08653

Vuoden 2019 teos "Automaattisten valvontakameroiden huijaaminen: kilpailevat paikat henkilöiden havaitsemiseen" osoitti kilpailevan painetun kuvion, joka pystyi vakuuttamaan tunnistusjärjestelmän siitä, että ketään ei havaita, mikä mahdollistaa eräänlaisen "näkymättömyyden". Lähde: https://arxiv.org/pdf/1904.08653

Uuden paperin takana olevat tutkijat huomauttavat, että heidän lähestymistapansa vaatii vähemmän valmistelua, eikä heidän tarvitse suunnitella vastakkaisia ​​puettavia esineitä (katso kuva yllä).

- paperi on otsikko Yksityisyyttä parantava tekniikka katuvideokameroiden havaitsemisen välttämiseksi käyttämättä vastustavia lisävarusteita, ja se tulee viideltä tutkijalta Ben-Gurion University of the Negevistä ja Fujitsu Limitedistä.

Menetelmä ja testit

Aikaisempien töiden mukaisesti, mm Vastuullinen naamio, AdvHat, vastustavia laastareita, ja useat muut vastaavat retket, tutkijat olettavat, että jalankulkijan "hyökkääjä" tietää, mitä esineentunnistusjärjestelmää valvontaverkossa käytetään. Tämä ei itse asiassa ole kohtuuton oletus, koska nykyaikaiset avoimen lähdekoodin järjestelmät, kuten YOLO, ovat ottaneet laajalti käyttöön valvontajärjestelmissä, kuten esim. Cisco ja Ultralytics (tällä hetkellä YOLO-kehityksen keskeinen liikkeellepaneva voima).

Paperissa oletetaan myös, että jalankulkijalla on pääsy laskettaviin paikkoihin kiinnitettyyn suoratoistoon Internetissä, mikä taas on järkevä oletus useimmissa paikoissa, joissa peittovoimakkuus todennäköisesti on.

sivustot, kuten 511ny.org, tarjoavat pääsyn moniin valvontakameroihin NYC:n alueella. Lähde: https://511ny.or

Sivustot, kuten 511ny.org, tarjoavat pääsyn moniin valvontakameroihin NYC:n alueella. Lähde: https://511ny.or

Tämän lisäksi jalankulkija tarvitsee pääsyn ehdotettuun menetelmään ja itse tapahtumapaikalle (eli risteyksille ja reiteille, joille "turvallinen" reitti muodostetaan).

L-PET:n kehittämiseksi kirjoittajat arvioivat jalankulkijoiden kulman vaikutusta kameraan; kameran korkeuden vaikutus; etäisyyden vaikutus; ja vuorokaudenajan vaikutus. Perustotuuden saamiseksi he valokuvasivat henkilöä kulmissa 0°, 45°, 90°, 135°, 180°, 225°, 270° ja 315°.

Tutkijoiden tekemät pohjatotuushavainnot.

Tutkijoiden tekemät pohjatotuushavainnot.

He toistivat nämä muunnelmat kolmella eri kamerakorkeudella (0.6 m, 1.8 m, 2.4 m) ja vaihtelevissa valaistusolosuhteissa (aamu-, iltapäivä-, yö- ja "laboratorio"-olosuhteet).

Tätä materiaalia syötetään Nopeampi R-CNN ja YOLOV3 kohteen ilmaisimien avulla, he havaitsivat, että kohteen luotettavuus riippuu jalankulkijan kulman terävyydestä, jalankulkijan etäisyydestä, kameran korkeudesta ja sää-/valaistusolosuhteista*.

Kirjoittajat testasivat sitten laajempaa kohdeilmaisimien valikoimaa samassa skenaariossa: Faster R-CNN; YOLOv3; SSD; DiffusionDet, Ja RTMDet.

Kirjoittajat toteavat:

"Huomasimme, että jalankulkijoiden asento ja ympäristön valo vaikuttavat kaikkiin viiteen kohteen ilmaisinarkkitehtuuriin. Lisäksi havaitsimme, että kolmessa viidestä mallista (YOLOv3, SSD ja RTMDet) vaikutus säilyy kaikilla ympäristön valaistustasoilla.

Laajentaakseen kattavuutta tutkijat käyttivät julkisesti saatavilla olevista liikennekameroista otettua materiaalia kolmessa paikassa: Shibuya Crossing Tokiossa, Broadway New Yorkissa ja Castron alue San Franciscossa.

Jokaisessa paikassa oli viidestä kuuteen tallennetta, noin neljä tuntia materiaalia nauhoitetta kohti. Havaitsemissuorituskyvyn analysoimiseksi poistettiin yksi kehys joka toinen sekunti ja käsiteltiin käyttämällä Faster R-CNN -objektidetektoria. Jokaiselle saatujen kehysten pikselille menetelmä arvioi kyseisessä pikselissä olevien "henkilö"-ilmaisun rajoitusruutujen keskimääräisen luotettavuuden.

"Huomasimme, että kaikissa kolmessa paikassa kohteen ilmaisimen luottamus vaihteli riippuen ihmisten sijainnista kehyksessä. Esimerkiksi Shibuya Crossing -materiaalissa on suuria heikkoluottamuksellisia alueita kauempana kamerasta sekä lähempänä kameraa, missä pylväs peittää osittain ohikulkijan.

L-PET-menetelmä on pohjimmiltaan tämä menettely, joka on luultavasti "asetettu" sellaisen polun saamiseksi kaupunkialueen läpi, joka todennäköisesti johtaa jalankulkijan onnistuneeseen tunnistamiseen.

Sitä vastoin L-BAT noudattaa samaa menettelyä sillä erolla, että se päivittää ilmaisujärjestelmän pisteet luoden takaisinkytkentäsilmukan, joka on suunniteltu välttämään L-PET-lähestymistapa ja tehostamaan järjestelmän "sokeat alueet".

(Käytännössä kattavuuden parantaminen saatujen lämpökarttojen perusteella vaatisi kuitenkin enemmän kuin vain odotetussa asennossa olevan kameran päivityksen; testauskriteerien mukaan, mukaan lukien sijainti, se vaatisi lisäkameroiden asentamista laiminlyödyn peittämiseen. alueet – siksi voidaan väittää, että L-PET-menetelmä pahentaa tämän "kylmän sodan" todellakin erittäin kalliiksi skenaarioksi)

Jokaisen pikselin keskimääräinen jalankulkijoiden havaitsemisluottamus erilaisten ilmaisinkehysten välillä Castro Streetin havaitulla alueella, analysoituna viideltä videolta. Jokainen video tallennettiin erilaisissa valaistusolosuhteissa: auringonnousu, päivä, auringonlasku ja kaksi erillistä yöasetusta. Tulokset esitetään erikseen jokaiselle valaistusskenaariolle.

Jokaisen pikselin keskimääräinen jalankulkijoiden havaitsemisluottamus erilaisten ilmaisinkehysten välillä Castro Streetin havaitulla alueella, analysoituna viideltä videolta. Jokainen video tallennettiin erilaisissa valaistusolosuhteissa: auringonnousu, päivä, auringonlasku ja kaksi erillistä yöasetusta. Tulokset esitetään erikseen jokaiselle valaistusskenaariolle.

Kun on muunnettu pikselipohjainen matriisiesitys muotoon a graafinen esitys tehtävään sopivaksi, tutkijat mukauttivat Dijkstra-algoritmi laskea jalankulkijoille optimaaliset reitit navigoidakseen alueilla, joilla valvonta on vähäistä.

Lyhimmän polun löytämisen sijaan algoritmia muokattiin havainnoinnin luotettavuuden minimoimiseksi, ja korkean luotettavuuden alueita käsiteltiin alueina, joilla on korkeampi "kustannus". Tämän mukautuksen ansiosta algoritmi pystyi tunnistamaan reitit, jotka kulkevat kuolleiden kulmien tai heikosti havaittavien alueiden läpi, ohjaten jalankulkijat tehokkaasti polkuja pitkin, joiden näkyvyys valvontajärjestelmiin oli heikentynyt.

Visualisointi, joka kuvaa kohtauksen lämpökartan muuntamista pikselipohjaisesta matriisista graafipohjaiseksi esitykseksi.

Visualisointi, joka kuvaa kohtauksen lämpökartan muuntamista pikselipohjaisesta matriisista graafipohjaiseksi esitykseksi.

Tutkijat arvioivat L-BAT-järjestelmän vaikutusta jalankulkijoiden havaitsemiseen tietojoukolla, joka on rakennettu edellä mainituista neljän tunnin julkisen jalankulkijan liikenteen tallennuksista. Kokoelman täyttämiseksi yksi kehys käsiteltiin joka toinen sekunti SSD-objektitunnistimella.

Jokaisesta kehyksestä valittiin yksi rajauslaatikko, joka sisälsi havaitun henkilön positiivisena näytteenä, ja toista satunnaista aluetta, jossa ei havaittu ihmisiä, käytettiin negatiivisena näytteenä. Nämä kaksoisnäytteet muodostivat tietojoukon kahden nopeamman R-CNN-mallin arvioimiseksi – toisessa L-BAT:lla ja toisessa ilman.

Mallien suorituskykyä arvioitiin tarkistamalla, kuinka tarkasti ne tunnistivat positiiviset ja negatiiviset näytteet: positiivisen näytteen päällekkäinen rajoitusruutu pidettiin tosi positiivisena, kun taas negatiivisen näytteen päällekkäinen rajauslaatikko merkittiin vääräksi positiiviseksi.

L-BAT:n havaitsemisluotettavuuden määrittämiseen käytetyt mittarit olivat Käyrän alla oleva alue (AUC); todellinen positiivinen korko (TPR); väärä positiivinen määrä (FPR); ja keskimääräinen todellinen positiivinen luottamus. Tutkijat väittävät, että L-BAT:n käyttö paransi havaitsemisen luotettavuutta säilyttäen samalla korkean todellisen positiivisen määrän (vaikkakin väärien positiivisten tulosten lisääntyessä hieman).

Lopuksi kirjoittajat huomauttavat, että lähestymistavalla on joitain rajoituksia. Yksi on, että heidän menetelmänsä tuottamat lämpökartat ovat erityisiä tietylle vuorokaudenajalle. Vaikka he eivät selitä sitä, tämä viittaa siihen, että tarvitaan suurempaa, monitasoista lähestymistapaa vuorokaudenajan huomioon ottamiseksi joustavammassa käyttöönotossa.

He havaitsevat myös, että lämpökartat eivät siirry eri malliarkkitehtuureihin, ja ne on sidottu tiettyyn kohteen ilmaisinmalliin. Koska ehdotettu työ on pohjimmiltaan konseptitodistus, voidaan oletettavasti kehittää myös taitavampia arkkitehtuureja tämän teknisen velan korjaamiseksi.

Yhteenveto

Kaikilla uusilla hyökkäysmenetelmillä, joiden ratkaisuna on "maksaminen uusista valvontakameroista", on etuja, koska kansalaisten kameraverkkojen laajentaminen tarkasti valvotuilla alueilla poliittisesti haastavaa, sekä edustaa huomattavaa kansalaiskulua, joka vaatii yleensä äänestäjän mandaattia.

Ehkä työn suurin kysymys on "Hyödyntävätkö suljetun lähdekoodin valvontajärjestelmät avoimen lähdekoodin SOTA-kehyksiä, kuten YOLO?". Tätä on tietysti mahdotonta tietää, koska useiden osavaltioiden ja kansalaisten kameraverkkojen (ainakin Yhdysvalloissa) virtalähteenä toimivien patentoitujen järjestelmien valmistajat väittävät, että tällaisen käytön paljastaminen saattaisi avata ne hyökkäyksille.

Siitä huolimatta valtion IT:n ja sisäisen koodin siirtyminen globaaliin ja avoimeen lähdekoodiin viittaa siihen, että kuka tahansa, joka testaa tekijöiden kiistaa (esimerkiksi) YOLOn kanssa, saattaa lyödä heti jättipotin.

 

* Normaalisti sisällytän aiheeseen liittyvät taulukkotulokset, kun ne esitetään paperissa, mutta tässä tapauksessa paperin taulukoiden monimutkaisuus tekee niistä epäselviä satunnaiselle lukijalle, ja siksi yhteenveto on hyödyllisempi.

Julkaistu ensimmäisen kerran tiistaina 28

Koneoppimisen kirjoittaja, ihmiskuvan synteesin asiantuntija. Entinen tutkimussisällön johtaja Metaphysic.ai:ssa.
Henkilökohtainen sivusto: martinanderson.ai
Ottaa yhteyttä: [sähköposti suojattu]
Twitter: @manders_ai