人工知能
ディープフェイクとは何か?

ディープフェイクが作成されやすくなり、より広く使われるようになると、より多くの注目が集まっています。ディープフェイクは、AIの倫理、誤情報、情報の公開、インターネット、規制に関する議論の中心となりました。ディープフェイクについて知ることが重要です。また、ディープフェイクとは何かを直感的に理解することも重要です。この記事では、ディープフェイクの定義を明確にし、用途を検討し、ディープフェイクを検出する方法を説明し、ディープフェイクが社会に与える影響を検討します。
ディープフェイクとは何か?
ディープフェイクについてさらに議論する前に、「ディープフェイク」が実際に何を意味するかを明確にする時間を取ることが役立ちます。ディープフェイクという用語に関する混乱が多く、誤って、ディープフェイクであるかどうかに関係なく、すべての偽造メディアにこの用語が適用されることがあります。ディープフェイクとみなされるには、偽造されたメディアは、特にディープニューラルネットワークであるマシンラーニングシステムで生成されている必要があります。
ディープフェイクの重要な要素は、マシンラーニングです。マシンラーニングにより、コンピューターが自動的にビデオとオーディオを比較的短時間で簡単に生成できるようになりました。ディープニューラルネットワークは、ターゲット環境条件下で人々がどのように見え、動くかを学習するために、実在の人物の映像でトレーニングされます。トレーニングされたネットワークは、別の人物の画像に適用され、追加のコンピューターグラフィックス技術でオリジナルの映像と組み合わせられます。エンコーダーアルゴリズムは、オリジナルの顔とターゲットの顔の類似性を決定するために使用されます。顔の共通の特徴が分離されると、2番目のAIアルゴリズムであるデコーダーが使用されます。デコーダーは、エンコードされた(圧縮された)画像をオリジナルの画像の特徴に基づいて再構築します。2つのデコーダーが使用されます。1つはオリジナルの人物の顔に、もう1つはターゲットの人物の顔に使用されます。交換を行うには、人物Xの画像でトレーニングされたデコーダーに人物Yの画像が与えられます。結果として、人物Yの顔が人物Xの表情と向きに再構築されます。
現在、ディープフェイクを作成するにはまだ相当の時間がかかります。偽造者の作成者は、モデル内のパラメータを手動で調整するのに長い時間を費やす必要があります。サブオプティマルなパラメータは、目立つ不完全性と画像のグリッチを引き起こし、偽造の真の性質を明らかにします。
ディープフェイクのほとんどは、生成対抗ネットワーク (GAN) というタイプのニューラルネットワークで作成されているとよく考えられていますが、現在作成されている多くのディープフェイク (おそらくほとんど) は、GAN に頼っていません。GAN は初期のディープフェイクの作成において重要な役割を果たしましたが、SUNY バッファローの Siwei Lyu によると、ほとんどのディープフェイク ビデオは代替方法で作成されています。
GAN をトレーニングするには大量のトレーニング データが必要であり、GAN は他の画像生成技術よりも画像をレンダリングするのに長い時間がかかります。GAN は静的な画像よりもビデオを生成するのに適しています。GAN にはフレーム間の一貫性を維持するのに難があります。エンコーダーと複数のデコーダーを使用してディープフェイクを作成する方が一般的です。
ディープフェイクは何に使われるのか?
インターネット上で見られる多くのディープフェイクは、ポルノグラフィックな性質を持っています。AI企業のDeeptraceによる調査によると、2019年9月に収集された約15,000のディープフェイクビデオのうち、約95%がポルノグラフィックな性質を持っていたことが分かりました。この事実の心配される意味は、技術が使用しやすくなると、偽の復讐ポルノの事件が増える可能性があることです。
しかし、すべてのディープフェイクがポルノグラフィックな性質を持っているわけではありません。ディープフェイク技術には、より正当な用途があります。オーディオディープフェイク技術は、病気やけがで声が損なわれたり失われたりした人々が、通常の声を放送するのを助けることができます。ディープフェイクは、危険な状況にある人々の顔を隠しながら、唇や表情を読むことを許可するために使用できます。ディープフェイク技術は、外国語映画の吹き替えを改善したり、古い損傷したメディアを修復したり、芸術の新しいスタイルを作成したりするために使用できます。
非ビデオディープフェイク
多くの人が「ディープフェイク」という用語を聞くと、偽のビデオを想像するかもしれませんが、偽のビデオはディープフェイク技術で生成される唯一の種類のメディアではありません。ディープフェイク技術は、写真やオーディオの偽造も生成します。前述のように、GANは頻繁に偽の画像を生成するために使用されます。ディープフェイクアルゴリズムで生成されたプロフィール画像を持つ多くの偽のLinkedInおよびFacebookプロファイルが存在すると考えられています。
オーディオディープフェイクも作成できます。ディープニューラルネットワークは、有名人や政治家を含むさまざまな人のボイスクローン/ボイススキンを生成するためにトレーニングされます。オーディオディープフェイクの有名な例の1つは、AI企業のDessaがAIモデルを使用して、ポッドキャストホストのJoe Roganの声を再現したときです。
ディープフェイクの見分け方
ディープフェイクがより洗練されていくにつれて、偽のメディアと本物のメディアを区別することはより困難になります。現在、いくつかの特徴を確認することで、ビデオが潜在的なディープフェイクであるかどうかを判断できます。たとえば、唇の動きと音声の同期が悪い、動きが自然でない、顔の周りにちらつきがある、髪、歯、反射などの細かい詳細が歪んでいる、などです。ディープフェイクの他の潜在的な兆候には、ビデオの他の部分の品質が低い、目が正常に瞬かない、などがあります。
これらの兆候は現在、ディープフェイクを発見するのに役立ちますが、ディープフェイク技術が進歩すると、信頼性の高いディープフェイク検出の唯一の選択肢は、偽と本物のメディアを区別するようにトレーニングされた他のAIになります。
Amazon、Facebook、Microsoftを含む多くのテクノロジー企業は、ディープフェイクを検出する方法を研究しています。先月、3つのテクノロジー企業が支援するディープフェイク検出チャレンジが開始されました。世界中の研究チームはディープフェイクを検出する方法に取り組み、最も優れた検出方法を開発するために競争しました。GoogleやJigsawの研究者などの他の研究グループは、オープンソースのデータセットを提供し、他の人々にディープフェイク検出方法を開発するよう奨励しています。Dessaは、ディープフェイク検出技術を洗練し、検出モデルがインターネット上で見つかったディープフェイクビデオで動作することを保証しようとしています。
ディープフェイクの蔓延に対処するために、他の戦略も調査されています。たとえば、ビデオを他の情報源と照合することで、検証できます。別の角度から撮影されたイベントのビデオを検索したり、ビデオの背景詳細(天気パターンや場所など)を検証したりできます。さらに、ブロックチェーンのオンライン台帳システムを使用して、ビデオが最初に作成されたときに登録し、元のオーディオと画像を保持して、派生ビデオがいつでも操作を確認できるようにすることができます。
最終的に、ディープフェイクを検出する信頼性の高い方法が開発され、ディープフェイク技術の最新の進歩に追いつくことが重要です。ディープフェイクの影響が正確に何であるかはわかりませんが、ディープフェイク(およびその他の種類の偽造メディア)を検出する信頼性の高い方法がない場合、誤情報が広まり、人々の社会や制度に対する信頼が損なわれる可能性があります。
ディープフェイクの影響
ディープフェイクを制限なしに広めることの危険性は何ですか?
ディープフェイクが現在引き起こす最大の問題の1つは、非同意ポルノグラフィです。人々の顔をポルノグラフィックなビデオや画像と組み合わせて作成されます。AI倫理学者は、ディープフェイクが偽の復讐ポルノの作成に使用されることを心配しています。さらに、ディープフェイクは、人々を論争的で損なわれる状況に置くために使用できます。
企業やサイバーセキュリティ専門家は、ディープフェイクが詐欺、詐術、強要を促進するために使用されることを心配しています。とある事件では、ディープフェイクオーディオが、社員を騙して金銭を移転させるために使用されました。
ディープフェイクが上記のものよりもさらに有害な影響を及ぼす可能性もあります。ディープフェイクは、一般的にメディアに対する人々の信頼を損ない、人々が本当のニュースと偽のニュースを区別することを困難にします。ウェブ上の多くのビデオが偽造されている場合、政府、企業、その他の組織が、真正な論争や非倫理的な行為について疑問を投げかけやすくなります。
政府の場合、ディープフェイクは民主主義の運営に対する脅威となる可能性もあります。民主主義では、市民が信頼性の高い情報に基づいて政治家について十分な情報を得る必要があります。誤情報は民主主義のプロセスを損ないます。たとえば、ガボンの大統領アリ・ボンゴは、おそらく偽のビデオに出演し、ガボン市民に安心感を与えようとしました。大統領は長期間病気と見なされていたため、彼の突然の出演はクーを試みるきっかけとなりました。ドナルド・トランプ大統領は、オーディオ録音が偽物であると主張しましたが、それを「ロッカールームでの話」とも表現しました。アンドリュー王子は、エミリー・マイティリスの弁護士によって提供された画像が偽物であると主張しましたが、弁護士はその真正性を主張しました。
最終的に、ディープフェイク技術には正当な用途がありますが、技術の誤用により多くの潜在的な危害が生じる可能性があります。したがって、メディアの真実性を判断する方法が開発され、維持されることが非常に重要です。












