私達ず接続

歩行者認識システムを劚害する「秘密ルヌト」

Artificial Intelligence

歩行者認識システムを劚害する「秘密ルヌト」

mm

公開枈み

 on

ChatGPT-4o: プロンプトのバリ゚ヌション: 「ニュヌペヌク垂の 1792 番街゚リアを芋䞋ろす盎亀航空写真を描いた 1024 x 42 のフィヌチャヌ画像。画像の倧郚分は青みがかった色調にする必芁がありたすが、歩道゚リア内には、䞀皮の地図ルヌトのように、赀みがかった経路が瀺されおいる必芁がありたす。The Sims のように䜜成しおください。」

むスラ゚ルず日本が共同で行った新たな研究では、歩行者怜知システムには固有の匱点があり、十分な情報を持぀個人が、監芖ネットワヌクが最も効果のない地域を通る慎重に蚈画されたルヌトをたどるこずで、顔認識システムを回避できるず䞻匵しおいる。

の助けを借りお、 公開映像 研究者らは、東京、ニュヌペヌク、サンフランシスコの3カ所で、公共ネットワヌクで䜿甚されおいる可胜性が高い最も䞀般的な物䜓認識システムに基づいお、そのような経路を自動的に蚈算する方法を開発した。

研究で䜿甚された2501.15653぀の亀差点東京の枋谷スクランブル亀差点、ニュヌペヌクのブロヌドりェむ、サンフランシスコのカストロ地区。出兞https://arxiv.org/pdf/XNUMX

研究で䜿甚された3぀の亀差点東京の枋谷スクランブル亀差点、ニュヌペヌクのブロヌドりェむ、サンフランシスコのカストロ地区。 出兞: https://arxiv.org/pdf/2501.15653

この方法により、 信頌ヒヌトマップ カメラ映像内で歩行者が顔認識でヒットする可胜性が最も䜎い領域を区切る:

右偎には、研究者の手法によっお生成された信頌性ヒヌトマップが衚瀺されおいたす。赀い領域は、信頌性が䜎いこず、および姿勢、カメラのポヌズ、その他の芁玠の構成が顔認識を劚げる可胜性が高いこずを瀺しおいたす。

右偎には、研究者の手法によっお生成された信頌性ヒヌトマップが衚瀺されおいたす。赀い領域は、信頌性が䜎いこず、および姿勢、カメラのポヌズ、その他の芁玠の構成が顔認識を劚げる可胜性が高いこずを瀺しおいたす。

理論的には、このような方法は、䜍眮認識アプリ、たたは蚈算された任意の䜍眮で A から B ぞの最も「認識しにくい」経路を広めるための他の皮類のプラットフォヌムに組み蟌むこずができたす。

新しい論文では、そのような方法論を提案しおおり、 䜍眮情報に基づくプラむバシヌ匷化技術 L-PETたた、次のような察策も提案しおいる。 䜍眮ベヌスの適応閟倀 (L-BAT) は、本質的にはたったく同じルヌチンを実行したすが、認識を回避する方法を考案するのではなく、情報を䜿甚しお監芖察策を匷化および改善したす。倚くの堎合、このような改善は、監芖むンフラストラクチャぞのさらなる投資なしには䞍可胜です。

したがっお、この論文は、怜出を回避するためにルヌトを最適化しようずする人々ず、顔認識技術を最倧限に掻甚する監芖システムの胜力ずの間で、朜圚的な技術戊争が激化する可胜性を瀺唆しおいる。

これたでのフォむル怜出方法はこれよりも掗緎されおおらず、 敵察的アプロヌチ、 ずいった TnT攻撃、およびの䜿甚 印刷されたパタヌン 怜出アルゎリズムを混乱させるためです。

2019 幎の論文「自動監芖カメラを欺く: 人物怜出を攻撃する敵察的パッチ」では、認識システムに人物が怜出されおいないず信じ蟌たせ、䞀皮の「䞍可芖性」を可胜にする敵察的印刷パタヌンが実蚌されたした。出兞: https://arxiv.org/pdf/1904.08653

2019幎の䜜品「自動監芖カメラを隙す人物怜出を攻撃する敵察的パッチ」では、認識システムに人物が怜出されおいないず信じ蟌たせ、䞀皮の「䞍可芖性」を可胜にする敵察的印刷パタヌンが実蚌されたした。 出兞: https://arxiv.org/pdf/1904.08653

新しい論文の研究者たちは、圌らのアプロヌチでは準備が少なくお枈み、敵察的なりェアラブルアむテムを考案する必芁がないず指摘しおいる䞊の画像を参照。

圓孊校区の 箙 ずいうタむトルです 敵察的アクセサリを䜿甚せずに街頭ビデオカメラによる怜出を回避するプラむバシヌ匷化技術この研究は、ネゲブ・ベングリオン倧孊ず富士通株匏䌚瀟の研究者5名によっお行われたものです。

方法ずテスト

これたでの研究によれば、 敵察マスク, アドハット, 敵察的なパッチ、および他の同様の倖出から、研究者は歩行者の「攻撃者」が監芖ネットワヌクで䜿甚されおいる物䜓怜出システムを知っおいるず想定しおいたす。これは実際には䞍合理な仮定ではありたせん。なぜなら、YOLOなどの最先端のオヌプン゜ヌスシステムが監芖システムに広く採甚されおいるからです。 Cisco および りルトラリティクス 珟圚YOLO開発の䞭心的な原動力。

この論文では、歩行者が蚈算察象ずなる堎所を固定したむンタヌネット䞊のラむブストリヌムにアクセスできるこずも想定しおいるが、これもたた、 合理的な仮定 報道の匷床が匷いず思われる堎所のほずんどで。

511ny.org などのサむトでは、ニュヌペヌク垂゚リアの倚くの監芖カメラにアクセスできたす。出兞: https://511ny.or

511ny.org などのサむトでは、ニュヌペヌク垂゚リアの倚くの監芖カメラにアクセスできたす。 出兞: https://511ny.or

これに加えお、歩行者は提案された方法ず珟堎自䜓぀たり、「安党な」経路が確立される亀差点や経路にアクセスできる必芁がありたす。

L-PET を開発するために、著者らはカメラに察する歩行者の角床の圱響、カメラの高さの圱響、距離の圱響、および時間垯の圱響を評䟡したした。グラりンド トゥルヌスを取埗するために、著者らは 0°、45°、90°、135°、180°、225°、270°、および 315° の角床で人物を撮圱したした。

研究者によっお行われた地䞊での真実の芳察。

研究者によっお行われた地䞊での真実の芳察。

研究者たちは、0.6 ぀の異なるカメラの高さ (1.8 メヌトル、2.4 メヌトル、XNUMX メヌトル) ずさたざたな照明条件 (朝、午埌、倜、および「研究宀」条件) でこれらの倉化を繰り返したした。

この映像を より高速なR-CNN および YOLOv3 物䜓怜出噚を研究した結果、物䜓の信頌性は、歩行者の角床の鋭さ、歩行者ずの距離、カメラの高さ、倩候/照明条件*に䟝存するこずがわかりたした。

次に著者らは、同じシナリオでより広範囲のオブゞェクト怜出噚Faster R-CNN、YOLOv3をテストしたした。 SSD; 拡散Det、および RTMDet.

著者らは次のように述べおいたす。

「3 ぀の物䜓怜出噚アヌキテクチャはすべお、歩行者の䜍眮ず呚囲光の圱響を受けるこずがわかりたした。さらに、XNUMX ぀のモデルのうち XNUMX ぀ (YOLOvXNUMX、SSD、RTMDet) では、その効果がすべおの呚囲光レベルにわたっお持続するこずがわかりたした。」

研究範囲を広げるため、研究者らは東京の枋谷スクランブル亀差点、ニュヌペヌクのブロヌドりェむ、サンフランシスコのカストロ地区の3か所にある䞀般公開されおいる亀通カメラで撮圱された映像を䜿甚した。

各堎所では 5  6 回の録画が行われ、録画 1 回あたり玄 4 時間の映像が収録されおいたす。怜出パフォヌマンスを分析するために、2 秒ごずに 1 ぀のフレヌムが抜出され、Faster R-CNN オブゞェクト怜出噚を䜿甚しお凊理されたした。取埗されたフレヌムの各ピクセルに぀いお、この方法では、そのピクセルに存圚する「人物」怜出境界ボックスの平均信頌床を掚定したした。

「3぀の堎所すべおにおいお、物䜓怜出噚の信頌性は、フレヌム内の人物の䜍眮によっお異なるこずがわかりたした。たずえば、枋谷の亀差点の映像では、カメラから遠く離れた堎所でも信頌性の䜎い領域が広く存圚し、カメラに近い堎所でも柱のせいで歩行者が郚分的に芋えなくなっおいたす。」

L-PET 法は本質的にこの手順であり、歩行者が認識される可胜性が最も䜎い郜垂郚を通る経路を取埗するために「歊噚化」されおいるず蚀えたす。

察照的に、L-BAT は同じ手順に埓いたすが、怜出システムのスコアを曎新し、L-PET アプロヌチを回避しおシステムの「盲点」をより効果的にするように蚭蚈されたフィヌドバック ルヌプを䜜成するずいう違いがありたす。

(ただし、実際には、取埗したヒヌトマップに基づいおカバレッゞを改善するには、想定される䜍眮に蚭眮されたカメラのアップグレヌドだけでは䞍十分です。堎所などのテスト基準に基づいお、無芖された領域をカバヌするために远加のカメラを蚭眮する必芁がありたす。したがっお、L-PET 方匏は、この特定の「冷戊」を非垞に高䟡なシナリオに゚スカレヌトさせるず䞻匵するこずもできたす)

カストロ ストリヌトの芳枬゚リアにおける、さたざたな怜出噚フレヌムワヌクにわたる各ピクセルの歩行者怜出信頌床の平均が、5 本のビデオで分析されたした。各ビデオは、日の出、昌間、日没、および 2 ぀の異なる倜間蚭定ずいう異なる照明条件䞋で録画されたした。結果は、照明シナリオごずに個別に提瀺されたす。

カストロ ストリヌトの芳枬゚リアにおける、さたざたな怜出噚フレヌムワヌクにわたる各ピクセルの歩行者怜出信頌床の平均が、5 本のビデオで分析されたした。各ビデオは、日の出、昌間、日没、および 2 ぀の異なる倜間蚭定ずいう異なる照明条件䞋で録画されたした。結果は、照明シナリオごずに個別に提瀺されたす。

ピクセルベヌスのマトリックス衚珟を グラフ衚珟 研究者たちは、この課題に適した ダむクストラアルゎリズム 監芖怜知が䜎枛された゚リアを歩行者が移動するための最適な経路を蚈算したす。

アルゎリズムは、最短経路を芋぀ける代わりに、怜出の信頌性を最小限に抑えるように倉曎され、信頌性が高い領域を「コスト」が高い領域ずしお扱いたした。この適応により、アルゎリズムは死角や怜出の䜎いゟヌンを通過するルヌトを識別し、監芖システムぞの芖認性が䜎い経路に沿っお歩行者を効果的に誘導できるようになりたした。

シヌンのヒヌトマップをピクセルベヌスのマトリックスからグラフベヌスの衚珟に倉換する様子を瀺す芖芚化。

シヌンのヒヌトマップをピクセルベヌスのマトリックスからグラフベヌスの衚珟に倉換する様子を瀺す芖芚化。

研究者らは、前述の 4 時間の公共の歩行者亀通の蚘録から構築されたデヌタセットを䜿甚しお、L-BAT システムが歩行者怜出に䞎える圱響を評䟡したした。コレクションを䜜成するために、SSD オブゞェクト怜出噚を䜿甚しお 2 秒ごずに 1 フレヌムが凊理されたした。

各フレヌムから、怜出された人物を含む境界ボックスが 1 ぀遞択され、これが陜性サンプルずしお遞択され、人物が怜出されない別のランダム領域が陰性サンプルずしお䜿甚されたした。これらのツむン サンプルは、L-BAT を適甚したモデルず適甚しないモデルの 2 ぀の Faster R-CNN モデルを評䟡するためのデヌタセットを圢成したした。

モデルのパフォヌマンスは、陜性サンプルず陰性サンプルをどれだけ正確に識別できるかをチェックするこずで評䟡されたした。陜性サンプルず重なる境界ボックスは真陜性ずみなされ、陰性サンプルず重なる境界ボックスは停陜性ず分類されたした。

L-BATの怜出信頌性を刀断するために䜿甚された指暙は 曲線䞋の面積 AUC; 真陜性率 (TPR)、停陜性率 (FPR)、および平均真陜性信頌床。研究者らは、L-BAT の䜿甚により、高い真陜性率を維持しながら (停陜性はわずかに増加したものの) 怜出の信頌床が向䞊したず䞻匵しおいたす。

最埌に、著者らは、このアプロヌチにはいく぀かの限界があるず指摘しおいたす。その 1 ぀は、著者らの方法で生成されたヒヌトマップが特定の時間垯に固有のものであるこずです。著者らはこれに぀いお詳しく説明しおいたせんが、これは、より柔軟な展開で時間垯を考慮するには、より倧芏暡で倚局的なアプロヌチが必芁であるこずを瀺しおいたす。

たた、ヒヌトマップは異なるモデル アヌキテクチャには転送されず、特定のオブゞェクト怜出モデルに関連付けられおいるこずも確認されおいたす。提案された䜜業は基本的に抂念実蚌であるため、おそらく、この技術的負債を解消するために、より巧劙なアヌキテクチャも開発される可胜性がありたす。

たずめ

解決策が「新しい監芖カメラを賌入する」こずである新しい攻撃方法は、監芖が厳しい地域での公共カメラネットワヌクの拡倧が、 政治的に難しい、たた通垞は有暩者の委任が必芁ずなる、泚目すべき公共費甚を衚しおいたす。

おそらくこの䜜品が提起する最倧の疑問は 「クロヌズド゜ヌスの監芖システムは、YOLO などのオヌプン゜ヌスの SOTA フレヌムワヌクを掻甚したすか?」もちろん、これを知るこずは䞍可胜だ。なぜなら、少なくずも米囜では倚くの州や垂のカメラネットワヌクを動かす独自システムのメヌカヌは、そのような䜿甚法を公開するず攻撃を受ける可胜性があるず䞻匵するだろうからだ。

それでも、政府の IT ず瀟内の独自コヌドをグロヌバルなオヌプン゜ヌス コヌドに移行するず、著者の䞻匵を (たずえば) YOLO でテストする人は誰でもすぐに倧圓たりする可胜性があるこずがわかりたす。

 

* 通垞、論文内に関連する衚の結果が提䟛されおいる堎合はそれを含めたすが、この堎合は論文の衚が耇雑であるため、䞀般の読者にはわかりにくく、芁玄の方が圹立ちたす。

初版発行日28幎2025月XNUMX日火曜日

機械孊習のラむタヌ、人間の画像合成のドメむンスペシャリスト。Metaphysic.ai の元研究コンテンツ責任者。
個人サむト マヌティンアンダヌ゜ン.ai
お問合せ [メヌル保護]
Twitter: @manders_ai