スタブ 顔ID認証システムの40%以上をバイパスできる「マスターフェイス」 - Unite.AI
私達と接続

サイバーセキュリティ

顔ID認証システムの40%以上を回避できる「Master Faces」

mm
更新中 on

イスラエルの研究者らは、「マスター」顔、つまり複数の ID になりすますことができる顔画像を生成できるニューラル ネットワークを開発しました。 この研究は、StyleGAN 敵対的生成ネットワーク (GAN) によって合成された 40 つの顔だけを使用して、9 つの主要な顔認識システムを介して人口の XNUMX% 以上に対してそのような「マスター キー」を生成できることを示唆しています。

  は、テルアビブにあるブラヴァトニク コンピューター サイエンス学校と電気工学学校の共同研究です。

システムをテストしたところ、研究者らは、生成された 20 つの顔で、マサチューセッツ大学の「野生のラベル付き顔」に含まれるすべてのアイデンティティの XNUMX% のロックを解除できることを発見しました (LFW) オープンソース データベース、顔 ID システムの開発とテストに使用される共通リポジトリ、およびイスラエル システムのベンチマーク データベース。

StyleGAN ジェネレーターを使用して「マスター顔」を繰り返し検索するイスラエルのシステム ワークフロー。 出典: https://arxiv.org/pdf/2108.01077.pdf

StyleGAN ジェネレーターを使用して「マスター顔」を繰り返し検索するイスラエルのシステム ワークフロー。 出典:https://arxiv.org/pdf/2108.01077.pdf

新しい方法は同様の方法を改良したものです 最近の論文 シエナ大学の博士号を取得するには、機械学習フレームワークへの特権レベルのアクセスが必要です。対照的に、新しい方法は、公開されている資料から一般化された特徴を推測し、それを使用して膨大な数のアイデンティティにまたがる顔の特徴を作成します。

進化するマスターフェイス

スタイルGAN このアプローチでは、認証システムを満たす最も広範で一般化された顔の特徴を見つけることが重要であるため、(当然のことですが)高次元データに焦点を当てたブラック ボックス最適化手法に基づいて最初にこのアプローチで使用されます。

このプロセスは、最初のパスでエンコードされなかった ID を包含するために反復的に繰り返されます。 さまざまなテスト条件において、研究者らは、わずか 40 枚の生成された画像で 60 ~ XNUMX% の認証を取得できることを発見しました。

LM-MA-ES を含むさまざまなカバレッジ検索方法にわたる調査で取得された「マスター顔」の連続グループ。 平均セット カバレッジ (MSC、精度の指標) が各画像の下に記載されています。

LM-MA-ES を含むさまざまなカバレッジ検索方法にわたる調査で取得された「マスター顔」の連続グループ。 平均セット カバレッジ (MSC、精度の指標) が各画像の下に記載されています。

このシステムは、現在の「候補」が以前のパスで生成された候補の p パーセンタイルよりも一般化する可能性を推定するニューラル予測子と組み合わせた進化的アルゴリズムを使用します。

イスラエルのシステムのアーキテクチャで生成された候補のフィルタリング。

イスラエルのシステムのアーキテクチャで生成された候補のフィルタリング。

LM-MA-ES

このプロジェクトでは、メモリ制限マトリックス アダプテーション (LM-MA-ES) 自動アルゴリズム設計のための機械学習に関する研究グループが主導する 2017 年のイニシアチブのために開発されたアルゴリズムで、高次元のブラック ボックス最適化に適したアプローチです。

LM-MA-ES はランダムに候補を出力します。 これはプロジェクトの目的には適していますが、どの顔が相互 ID 認証の最適な候補であるかを推定するには追加のコンポーネントが必要です。 そこで研究者らは、大量の候補者をふるいにかけてタスクに最適な顔を絞り込むための「成功予測器」神経分類器を作成した。

イスラエルの顔識別スプーフィング プロジェクトで使用された成功予測ツールの理論的根拠。

イスラエルの顔識別スプーフィング プロジェクトで使用された成功予測ツールの理論的根拠。

評価

このシステムは、次の XNUMX つの CNN ベースの顔記述子に対してテストされました。 スフィアフェイス, フェイスネット & ドリブ、各システム アーキテクチャには、システムの精度スコアを検証する際に役立つ類似性メトリックと損失関数が含まれています。

成功予測ツールは、 フィードフォワード ニューラル ネットワーク XNUMX つの完全に接続された層で構成されます。 これらの用途の最初のもの BatchNorm の正規化 アクティベーション前にデータの一貫性を確保するため。 ネットワークが使用するのは、 ADAM オプティマイザーとして、0.001 個の入力画像のバッチに対して 32 という野心的な学習率を備えています。

XNUMX つのアーキテクチャからの出力。

XNUMX つのアーキテクチャからの出力。

テストされた 26,400 つのアルゴリズムはすべて、同じ XNUMX つのシード セットを使用して XNUMX 回のフィットネス関数呼び出しに対してトレーニングされました。

研究者らはこの時点までに、トレーニングプロセスが長くてもシステムにメリットがないことを確立していました。 事実上、イスラエルのアプローチは、まだ最も高度な特徴だけが識別されているモデルトレーニングの初期段階から重要なデータを導き出そうとしています。 フレームワーク経済の観点から言えば、これは一種の贈り物であることは注目に値します。

Facebook の Python ベースでベースライン結果を確立している ネバーグラッド 勾配のない最適化環境では、システムはさまざまなブランドのアルゴリズムを含む多数のアルゴリズムに対してプロファイリングされました。 差分進化 ヒューリスティック。

研究者らは、Dlib に基づく「貪欲な」アプローチが競合他社を上回り、テスト データセットの 42% ~ 64% をロック解除できる XNUMX つのマスター面の作成に成功したことを発見しました。 システムの成功予測ツールを適用すると、これらの非常に好ましい結果がさらに改善されました。

この論文は、「たとえターゲットの身元に関する情報がないとしても、顔ベースの認証は非常に脆弱である」と主張しており、研究者らは彼らの取り組みが顔認識システムのセキュリティ侵入方法論に対する有効なアプローチであると考えています。