Connect with us

Andersonの視点

ディープフェイク検出メトリックとしての「確率」の使用

mm
Montage against AI-generated (GPT-1) image of Vesuvius exploding in 79AD, featuring Donald Trump from South Park season 27 episode 1, David Icke on 'Wogan' in 1991, and politician Catherine Connolly.

AI生成のビデオやオーディオが十分に優れたものになれば、視覚的なアーティファクトやその他の従来の信号に基づくディープフェイク検出器はもう機能しなくなるだろう。しかし、人々が予測可能な行動から逸脱することが非常に稀であることを考えると、ビデオやニュースのうわさが真実である可能性が高いかどうかを判断する信号として「確率」をより深く採用することができるかもしれない。

 

意見 1990年代初頭、尊敬される元イギリスのサッカー選手兼テレビのスポーツコメンテーターであるデビッド・アイクは、あるトークショーで自分が「神の息子」であるとカジュアルに明らかにした。これは、予測不可能な暴露であり、数十年間にわたって進化して、持続的な陰謀論となった。

インターネットの採用はまだ数年先のことであり、ソーシャルメディアの登場はさらに先のことだったが、アイクの有名人としての地位と新しい洞察の性質の間の純粋な不一致は、特にコンテキストや準備のない大きな転換であったため、英国民に深い影響を与えた。

20年以上が経過した後、アイクと同様の、しかしはるかに暗い、社会的ショックが起こった。愛されるチャリティーキャンペーン担当者であり、子供向けテレビ番組のホストだったジミー・サヴィルが、死後に連続的で貪欲な性的犯罪者であり、自分の純粋な公のイメージを利用して犯罪を犯していたことが発覚した。

その後の警察の捜査により、長年の性的犯罪歴を持つ多くの英国セレブが発覚し、後にハーヴェイ・ワインスタインの起訴により、米国でもセレブの性的犯罪者が発覚し、#MeToo運動に発展し、アメリカ文化に永久的に定着した。「ショック」のニュースは、最終的にディープフェイク攻撃者によって採用される新しいテンプレートを開発していた。

従来のディープフェイク検出の終焉?

社会メディアやAIが1990年代初頭に存在していたとしても、世界中の予測システムでは、アイクのトークショーでの暴露を予測することはできなかった。アイクの声明がGoogle Veo 3や、新しいハイパーリアルオーディオ/ビデオディープフェイクフレームワークの製品ではないことを、より広い聴衆に納得させるのに時間がかかったかもしれない。

ディープフェイク検出方法が、生成的なAIによって進化し、ウォーターマークやプロバンス追跡スキームの世界的な採用が、さまざまなロジスティックハードルに阻まれる場合、ディープフェイクの出力が潜在的に偽造されていることを示す共通の中心的な特徴は何でしょうか?それとも、すべてのメディアが疑わしいものとなり、Liar’s Dividendが支配する世界に自分を諦めるべきでしょうか?

ナレッジグラフ

「報告されたイベント」の信頼性と妥当性を、ディープフェイク検出の特徴的な信号として、より深く活用する時が来たと思われる。また、ビデオとオーディオの生成的なAIシステムが増加の一途を辿っているため、「フェイクニュース」(テキストベースの物語イベントとして)とフェイク画像/ビデオの個別の研究ストランドも同様に収束する時が来たのかもしれない。

「確率」というディープフェイクメトリックは、RAGを支援した事実の検証とは異なる。ここでは、AIモデルが、イベントが発生した後にウェブの結果を取得して知識を得ることができ、またその主張を裏付けることができる。

代わりに、一般的に示唆的な統計的傾向に基づいて予測を実行する。これらは、現在の問い合わせに従って、歴史的なパターンから導き出される。

この意味で、確率方法は、より現代的な機械学習のシーンにおけるより現代的なアプローチよりも、統計分析に近い。

以前は、より現代的なTransformer時代のアプローチによって隠されていたナレッジグラフが、エンタープライズの分野である程度の復活を遂げているように見え、ディープフェイク検出における「確率」メトリックの潜在的な展開に適している。

人、場所、芸術作品、イベントがラベル付きの関係を通じて結び付けられる、単純化されたナレッジグラフ。機械が現実世界のエンティティとその接続を推論できるようにする。ソース [ https://blog.langchain.com/enhancing-rag-based-applications-accuracy-by-constructing-and-leveraging-knowledge-graphs/ 

人、場所、芸術作品、イベントがラベル付きの関係を通じて結び付けられる、単純化されたナレッジグラフ。機械が現実世界のエンティティとその接続を推論できるようにする。 ソース

ナレッジグラフは、人、会社、イベント、またはアイデアなどの現実世界のものを、結び付けられた事実のネットワークにマッピングすることによって情報を組織化する方法である。

各サブエンティティはノードであり、それらを結ぶリンク(エッジ)は、それらがどのように関連しているかを記述する。たとえば、「マイクロソフト」(ノード)は、「OpenAI」(別のノード)と「クライアントである」というエッジで結ばれる。これらの接続は、グラフデータベースに保存され、主語ー述語ー目的語の構造(「マイクロソフトはOpenAIのクライアントである」)に従う。

永続的メモリ

この種の予測システムの課題は、特に有名人や公的人物以外の人物の分析の場合、完全に機能するために必要な監視の範囲である。

おそらく、現在の研究で最も近いのは、事前に犯罪の分野である。これは、さまざまなマルチモーダルインテリジェンスシグナルを「疑わしい」とラベル付けし、Person of Interest(2011-2016)やMinority Report(2002)などの出演で、AIの警備員として現れる。

Person of Interestのような全知的な監視システムは、最適な結果をもたらすだろうが、現在、西洋文化が中国の市民に課すような個人の侵入性のレベルを承認することはありそうにない。

したがって、有名人の場合、警察(および出生・死亡登録簿、税務局などの政府機関)のみが、グラフベースのワークフローに情報を提供するのに十分な関連情報を持っているだろう。ただし、彼らも、分析の対象から有名人を超えて一般市民を含めるために、CCCPS式の意志、能力、立法、リソースが必要となるだろう。

確率スコアリング

このようなシステムの潜在的な有効性は、おそらくディープフェイクコンテンツの最も明らかな(現在の)使用例に制限されるだろう:不安定化(国家が支援するディープフェイク);有名人および「未知」のポルノディープフェイク(どちらも悪意があると見なされるが、後者は一般にメディアの関心をより深く引く);詐欺オーディオ/ビデオディープフェイクを含む);および政治的人物暗殺

ナレッジベースのシステムは、さまざまな可能なイベントの確率のスケールが必要である。スケールの1つの端には、人間の共通の欠点(たとえば、疑わしい財務管理、不倫、依存症、不注意など)があり、もう1つの端には、テレビのトークショーで自分が「神の息子」であると明らかにするような出来事(または同等の規模と影響)がある。

機能の蔓延

このようなシステムの課題は、完全に機能するために必要な監視の範囲であり、特に有名人や公的人物以外の人物の分析の場合である。

おそらく、現在の研究で最も近いのは、事前に犯罪の分野である。これは、さまざまなマルチモーダルインテリジェンスシグナルを「疑わしい」とラベル付けし、Person of Interest(2011-2016)やMinority Report(2002)などの出演で、AIの警備員として現れる。

結論

このような予測システムは、偶然、天災、奇跡、または監視のない場所で計画された悪意のあるイベントには対処できない。

さらに、一般市民もカバーするために必要なデータの量と深さは、政治的な障害となるだろう。少なくとも現在のところは。

しかし、選択肢は狭まってきている。ビジョンベースの分析は、生成的なAIの前に失敗しつつあり、検証とプロバンススキームは技術的な負債と採用に対する摩擦を抱えている。これにより、Content Authenticity InitiativeMetaphysic Proのようなソリューションは、普及させるのが難しい。

RAGベースのシステムは、最も広い意味で、権威のあるソースが検証されていない主張を裏付けるかどうかを判断することしかできない。多くの大きな(真実の)ニュースストーリーは、事前のコンテキストなしに現れるため、権威のあるソースからの裏付けの欠如は、必ずしも重要ではない。

その価値は、歴史的コンテキストに重点を置いた、より大きなデータエコシステムの一部として形成される場合に証明されるかもしれない。歴史的コンテキストは、現在のAIが苦手とするものである。

 

* 2017年にデビューした初期のオートエンコーダーの出現と混同しないでください。これらは後に優れたアプローチに取って代わられました。

https://arxiv.org/abs/2511.07009

** これらは、ChatGPTやVeoシリーズのようなゲートキープされたAPIではなく、より強力な自宅用PCで自由に実行できるものです。

††† 映画やテレビ番組のプロフェッショナルな視覚効果などの、娯楽目的の正当な使用法は除きます。

2025年11月13日初めて公開されました

機械学習に関するライター、ヒューマンイメージシンセシスのドメインスペシャリスト。Metaphysic.aiの研究コンテンツ責任者を務めた。