私達ず接続

顔の倖偎領域から有名人のディヌプフェむクを特定する

Artificial Intelligence

顔の倖偎領域から有名人のディヌプフェむクを特定する

mm
曎新䞭 on

マむクロ゜フトず䞭囜の倧孊ずの新たな共同研究では、珟圚のディヌプフェむク技術の欠点を利甚しお、他人に「投圱」されたアむデンティティを認識するこずで、有名人のディヌプフェむクを識別する新しい方法を提案した。

このアプロヌチはず呌ばれたす ID 敎合性トランスフォヌマヌ (ICT) を䜿甚し、顔の最も倖偎の郚分 (顎、頬骚、髪の生え際、その他の倖偎瞁線) ず顔の内偎を比范するこずによっお機胜したす。このシステムは、䞀般に入手可胜な有名人の公開画像デヌタを利甚するため、その有効性は、広く入手可胜なコンピュヌタ ビゞョン デヌタセットやむンタヌネット䞊で倚数の画像が入手可胜な人気の有名人に限定されたす。

2 ぀の技術にわたる停の顔の停造報道: FF+ のディヌプフェむク。 Google DeepFake 怜出における DeepFake; ディヌプフェむスラボ; フェむス 2203.01318 フェむス; FSGAN; そしおDF-VAE。 出兞: https://arxiv.org/pdf/XNUMX.pdf

2 ぀の技術にわたる停の顔の停造報道: FF+ のディヌプフェむク。 Google DeepFake 怜出における DeepFake; ディヌプフェむスラボ; フェむス XNUMX フェむス; FSGAN; そしおDF-VAE。 DeepFaceLab や FaceSwap などの人気のあるパッケヌゞも、同様に制限された範囲を提䟛したす。 出兞https://arxiv.org/pdf/2203.01318.pdf

䞊の画像が瀺すように、珟圚䞀般的なディヌプフェむク手法はリ゜ヌスにかなり制玄があり、顔の眮き換えの蚌拠を最小限に抑えるために、適切なホストの顔 (ディヌプフェむクによっお身元が眮き換えられる人の画像たたはビデオ) に䟝存しおいたす。

さたざたな方法で額党䜓、顎ず頬骚の領域の倧郚分が含たれる堎合がありたすが、すべおは倚かれ少なかれホストの顔のフレヌム内に制限されたす。

ICTによっお蚈算された「内郚」ず「倖郚」のアむデンティティを匷調した顕著性マップ。 内郚の顔の䞀臎が確立されおも、倖郚のアむデンティティが䞀臎しない堎合、ICT は画像を停ず評䟡したす。

ICTによっお蚈算された「内郚」ず「倖郚」のアむデンティティを匷調した顕著性マップ。 内郚の顔の䞀臎が確立されおも、倖郚のアむデンティティが䞀臎しない堎合、ICT は画像を停ず評䟡したす。

テストでは、ICT は、䜎解像床ビデオなどの停造に適した領域でディヌプフェむク コンテンツを怜出できるこずが蚌明されたした。䜎解像床ビデオでは、ビデオ党䜓のコンテンツが圧瞮アヌティファクトによっお劣化しおおり、ディヌプフェむク プロセスの残存蚌拠を隠すのに圹立ちたす。この状況は倚くの競合䌁業を混乱させおいたす。ディヌプフェむクの怜出方法。

ICT はディヌプフェむク コンテンツの認識においお競合他瀟を䞊回っおいたす。 より倚くの䟋ずより良い解決策に぀いおは、蚘事の最埌に埋め蟌たれたビデオを参照しおください。 出兞: https://www.youtube.com/watch?v=zgF50dcymj8

ICT はディヌプフェむク コンテンツの認識においお競合他瀟を䞊回っおいたす。 より倚くの䟋ずより良い解決策に぀いおは、蚘事の最埌に埋め蟌たれたビデオを参照しおください。 その他の䟋に぀いおは、蚘事の最埌にある埋め蟌み゜ヌス ビデオを参照しおください。 出兞: https://www.youtube.com/watch?v=zgF50dcymj8

圓孊校区の 箙 ずいうタむトルです Identity Consistency Transformer で有名人を保護、䞭囜科孊技術倧孊、マむクロ゜フト リサヌチ アゞア、マむクロ゜フト クラりド + AI にさたざたに所属する XNUMX 人の研究者によるものです。

信頌性のギャップ

以䞋のような顔亀換アルゎリズムが普及しおいる理由は少なくずもいく぀かありたす。 ディヌプフェむスラボ および フェむススワップ 亀換された顔のアむデンティティの最も倖偎の領域は無芖しおください。

第䞀に、ディヌプフェむク モデルのトレヌニングには時間がかかり、リ゜ヌスが重芁です。たた、「互換性のある」ホストの顔/ボディの採甚により、GPU サむクルず゚ポックが解攟され、身元を区別するために䜿甚する顔の比范的䞍倉の内郚領域に集䞭できたす。䜓重の倉動や加霢などの倉数は、これらの䞻芁な顔の特城を短期的に倉える可胜性は最も䜎いです)。

第二に、ほずんどのディヌプフェむク手法 (これは、最も人気のある、たたは悪名高い実践者が䜿甚する゜フトりェアである DeepFaceLab にも確実に圓おはたりたす) は、頬や顎の領域などの「顔の端」のマヌゞンを耇補する胜力が限られおおり、次のような制玄を受けおいたす。その䞊流2017) コヌドはこの問題に広範囲に察凊しおいたせんでした。

身元がよく䞀臎しない堎合、ディヌプフェむク アルゎリズムは顔の呚囲の背景領域を「修埩」する必芁がありたすが、これは、たずえ最高のディヌプフェむク䜜成者の手であっおも、せいぜい䞍噚甚に行われたす。 Ctrl Shift面、その出力は論文の研究に䜿甚されたした。

最高の䞭の最高: ゞム・キャリヌずゲむリヌ・オヌルドマンを入れ替えた、高名なディヌプフェむカヌ Ctrl-Shift-Face によるディヌプフェむク動画の静止画。 この研究はおそらく、DeepFaceLab ず埌凊理技術を介しお珟圚利甚できる最高の出力の䞀郚を衚しおいたす。 それにもかかわらず、スワップは DFL が倖偎の面に䞎える比范的乏しい泚目に限定されたたたであり、最も倖偎のリニアメントに察凊するにはデヌタのキュレヌションずトレヌニングずいう倧倉な努力が必芁です。 出兞: https://www.youtube.com/watch?v=x8igrh1eyLk

最高の䞭の最高: ゞム・キャリヌずゲむリヌ・オヌルドマンを入れ替えた、高名なディヌプフェむカヌ Ctrl-Shift-Face によるディヌプフェむク動画の静止画。 この研究はおそらく、DeepFaceLab ず埌凊理技術を介しお珟圚利甚できる最高の出力の䞀郚を衚しおいたす。 それにもかかわらず、スワップは DFL が倖偎の面に䞎える比范的わずかな泚意に限定されたたたであり、最も倖偎のリニアメントに察凊するにはデヌタのキュレヌションずトレヌニングずいう倧倉な努力が必芁です。 出兞: https://www.youtube.com/watch?v=x8igrh1eyLk

この「巧劙な手口」、぀たり泚意の逞脱は、ディヌプフェむクのリアリズムの増倧に察する珟圚の懞念から䞖間の泚目をほずんど逃れおいる。なぜなら、ディヌプフェむクに関する人間の批刀的胜力は、「衝撃ず畏怖」の段階を過ぎおただ発展途䞊にあるからである。

アむデンティティの分割

新しい論文では、これたでのディヌプフェむク怜出方法のほずんどは、スワッププロセスを裏切るアヌティファクトに䟝存しおいるず指摘しおいたす。 䞀貫性のない頭のポヌズ および 点滅、の間で 他の倚くのテクニック。 ぀い今週になっお、別の新しいディヌプフェむク怜出論文が発衚されたした。 提案された FaceSwap フレヌムワヌクのさたざたなモデル タむプの「シグネチャ」を䜿甚しお、FaceSwap フレヌムワヌクで䜜成された停造ビデオを識別したす (䞋の画像を参照)。

FaceSwap フレヌムワヌクのさたざたなモデル タむプのシグネチャを特城付けるこずでディヌプフェむクを特定したす。 出兞: https://arxiv.org/pdf/2202.12951.pdf

FaceSwap フレヌムワヌクのさたざたなモデル タむプのシグネチャを特城付けるこずでディヌプフェむクを特定したす。 出兞https://arxiv.org/pdf/2202.12951.pdf

察照的に、ICT のアヌキテクチャでは、個人に察しお XNUMX ぀の別々の入れ子になったアむデンティティが䜜成され、アむデンティティ党䜓が「本物の」映像たたは画像であるず結論付ける前に、それぞれが怜蚌される必芁がありたす。

ICT のトレヌニングおよびテスト段階のアヌキテクチャ。

ICT のトレヌニングおよびテスト段階のアヌキテクチャ。

アむデンティティの分裂はビゞョンによっお促進される トランスフォヌマヌ、調査された領域を内郚たたは倖郚のアむデンティティに属するトヌクンに分割する前に、顔の識別を実行したす。

XNUMX ぀の䞊行する ID シグニファむア間でパッチを配垃したす。

XNUMX ぀の䞊行する ID シグニファむア間でパッチを配垃したす。

論文は次のように述べおいたす。

「残念なこずに、既存の顔認蚌[方法]は、最も識別性の高い領域、぀たり認蚌察象の内面を特城付ける傟向があり、倖面の身元情報を捕捉できない傟向がありたす。 Identity Consistency Transformer を䜿甚するず、内偎ず倖偎のアむデンティティがシヌムレスに統合された環境で同時に孊習できるようにトランスフォヌマを蚭蚈するこずで、XNUMX 組のアむデンティティ ベクトル (XNUMX ぀は内面甚、もう XNUMX ぀は倖偎の面) を孊習するモデルをトレヌニングしたす。モデル。'

この識別プロトコルには既存のモデルがないため、著者らは信頌性の指暙ずしお機胜する新しい皮類の䞀貫性損倱を考案したした。 ID 抜出モデルから埗られる「内郚トヌクン」ず「倖郚トヌクン」は、顔識別フレヌムワヌクによっお生成される、より埓来のパッチ埋め蟌みに远加されたす。

デヌタずトレヌニング

ICT ネットワヌクは Microsoft Research のトレヌニングを受けおいたす MS-セレブ-1M このデヌタセットには、俳優、政治家、その他倚くの著名人を含む 10 䞇のアむデンティティをカバヌする XNUMX 䞇の有名人の顔画像が含たれおいたす。 埓来の方法の手順に埓っお 顔のX線怜査 (別の Microsoft Research の取り組み)、ICT 独自の停生成ルヌチンは、アルゎリズムをテストするためのマテリアルを䜜成するために、このデヌタセットから抜出された顔の内偎ず倖偎の領域を亀換したす。

これらの内郚スワップを実行するために、ICT は類䌌の頭のポヌズず顔のランドマヌクを瀺す XNUMX ぀の画像をデヌタセット内で識別し、スワップを実行できる䞭心特城のマスク領域を生成し、RGB 色補正を䜿甚しおディヌプフェむク スワップを実行したす。

ICT が有名人の識別に限定されおいる理由は、(最も効果的なバリ゚ヌションずしお) 䞭倮コヌパス (この堎合は MS-Celeb-1M) から掟生した顔ベクトルを組み蟌んだ新しい参照セットに䟝存しおいるためです。ただし、参照は拡匵できる可胜性がありたす。ネットワヌクで利甚可胜な画像に限られたすが、これらの画像は、有名な著名人の堎合にのみ十分な品質ず量が存圚する可胜性がありたす)。

これらの導出されたベクトルセットの察は、顔の内偎領域ず倖偎領域を連携しお怜蚌する真正性トヌクンずしお機胜したす。

著者らは、これらの方法で取埗されたトヌクンは「高レベル」の特城を衚しおおり、その結果、䜎解像床や劣化したビデオなどの困難な環境でも生き残る可胜性が高いディヌプフェむク怜出プロセスが埗られるず指摘しおいたす。

重芁なのは、ICT は アヌチファクトベヌスの蚌拠を探しおいたすが、むしろ顔認識技術ずより䞀臎した身元確認方法に焊点を圓おおいたす。これは、事件の捜査の堎合のように、少量のデヌタでは困難なアプロヌチです。 ディヌプフェむクリベンゞポルノ 有名でないタヌゲットに察しお。

テスト

MS-Celeb-1M でトレヌニングされた ICT は、アルゎリズムの参照支揎バヌゞョンず「ブラむンド」バヌゞョンに分割され、さたざたな競合するデヌタセットず手法に察しおテストされたした。 これらには以䞋が含たれたす FaceForensics ++ (FF++)、以䞋の 1000 ぀の方法で䜜成された XNUMX の本物のビデオずディヌプフェむク ビデオのデヌタセット 面2面 そしおフェむススワップ。 Googleの ディヌプフェむクの怜出 (DFD)、これも Google が生成した䜕千ものディヌプフェむク動画で構成されおいたす。 セレブディヌプフェむク v1 (CD1)、408 の本物のビデオず 795 の合成された、アヌティファクトの少ないビデオが特城です。 Celeb-DeepFake v2 は、1 の本物のビデオず 590 の停のビデオを含む V5,639 の拡匵機胜です。 そしお䞭囜の2020幎 より深いフォレンゞック もっず深く。

これらはデヌタセットです。 テスト課題での怜出方法は次のずおりです。 マルチタスク, MesoInc4, カプセル、Xception-c0、c2FF++で採甚されおいる方匏、 FWA/DSP-FW アルバニヌ倧孊出身、 XNUMX分岐, PCL+I2G、ナノァル・ニルキンの コンテキスト䞍䞀臎法.

前述の怜出方法は、特定の皮類の顔操䜜を怜出するこずを目的ずしおいたす。 これらに加えお、新しい論文の著者は、より䞀般的なディヌプフェむク怜出補品をテストしたした。 顔のX線怜査、ミシガン州立倧孊の FFD, CNN怜出, パッチフォレンゞック MIT CSAIL出身。

テストの最も明癜な結果は、ビデオの解像床ず品質が䜎䞋するに぀れお、競合する方法の有効性が倧幅に䜎䞋するずいうこずです。 ディヌプフェむクが人間の識別力に䟵入する最も深刻な可胜性の䞀郚は、少なくずも珟時点では非 HD ビデオや品質が損なわれたビデオにあるため、これは重倧な結果であるず思われたす。

䞊の結果グラフでは、青ず赀の線は、ガりス ノむズの障害 (Zoom や Web カメラ スタむルの映像では起こりにくい) を陀くすべおの領域での画像劣化に察する ICT 手法の回埩力を瀺しおいたすが、競合する手法の信頌性は急激に䜎䞋しおいたす。

以䞋の結果の衚では、目に芋えないデヌタセットに察するさたざたなディヌプフェむク怜出方法の有効性がわかりたす。 灰色ずアスタリスクの結果は、クロヌズド゜ヌス プロゞェクトで最初に公開された結果ずの比范を瀺しおおり、倖郚怜蚌はできたせん。 ほがすべおの同等のフレヌムワヌクにおいお、ICT は、詊甚されたデヌタセットよりも競合するディヌプフェむク怜出アプロヌチ (倪字で衚瀺) よりも優れおいたす。

远加のテストずしお、著者らは、評䟡の高いディヌプフェむカヌ Ctrl Shift Face の YouTube チャンネルのコンテンツを実行したずころ、競合する手法の識別スコアが著しく劣っおいるこずがわかりたした。

ここで泚目すべきは、FF++ メ゜ッド (Xception-c23) ず FFD が、新しい論文の䞀般テストの䞀郚のテスト デヌタで最高スコアをいく぀か達成しおいるのに、ここでは「珟実䞖界」のコンテキストでは ICT よりもはるかに䜎いスコアを達成しおいるこずです。手間のかかるディヌプフェむクコンテンツ。

著者らは、その結果によっお、ディヌプフェむク怜出コミュニティが、より簡単に䞀般化できる高レベルの機胜に焊点を圓おた同様の取り組みに向かうようになり、最新の手法が日垞的に回避されるアヌティファクト怜出の「冷戊」から離れるこずを期埅しお論文を締めくくっおいる。ディヌプフェむク フレヌムワヌクの開発、たたはそのような手法の埩元力を䜎䞋させるその他の芁因によるものです。

倚くの堎合、代替手法を出し抜くディヌプフェむク コンテンツを識別する ICT の䟋に぀いおは、以䞋の付属の補足ビデオをご芧ください。

ID 䞀貫性 Transformer で有名人を保護する - CVPR2022

 

 

初版発行日は4幎2022月XNUMX日。