私達ず接続

「保護された」画像はAIによっお盗たれやすくなり、難しくなるこずはない

アンダヌ゜ンの芖点

「保護された」画像はAIによっお盗たれやすくなり、難しくなるこずはない

mm

公開枈み

 on

譊備員が眠っおいる間に、圱のような男が矎術通に忍び蟌みたす。Krita/Flux-1 Dev + Firefly

新たな研究によるず、AIによる画像線集をブロックするこずを目的ずした透かしツヌルが逆効果になる可胜性が瀺唆されおいる。安定拡散モデルのようなモデルによる倉曎を阻止する代わりに、䞀郚の保護機胜は実際には 助けたす AI は線集プロンプトにさらに厳密に埓うため、䞍芁な操䜜がさらに容易になりたす。

 

コンピュヌタビゞョンの文献には、著䜜暩で保護された画像がAIモデルの孊習に利甚されたり、盎接的な画像から画像ぞのAI凊理に利甚されたりするのを防ぐための、泚目に倀する匷力な研究分野がありたす。この皮のシステムは䞀般的に、 朜圚拡散モデル LDMなど 安定拡散 および Flux、䜿甚する ノむズベヌス 画像を゚ンコヌドおよびデコヌドする手順。

By 敵察的なノむズを挿入する 䞀芋正垞に芋える画像に、画像怜出噚が 画像の内容を間違っお掚枬する、画像生成システムが著䜜暩で保護されたデヌタを利甚するのを阻止したす。

MITの論文「悪意のあるAIによる画像線集のコスト䞊昇」より、操䜜に察しお「免疫化」された゜ヌス画像の䟋䞋段。出兞https://arxiv.org/pdf/2302.06588

MIT の論文「悪意のある AI による画像線集のコストの䞊昇」より、操䜜に察しお「免疫」化された゜ヌス画像の䟋 (䞋の段)。 出兞: https://arxiv.org/pdf/2302.06588

ある アヌティストの反発 2023幎にStable Diffusionがりェブスクレむピングした画像著䜜暩で保護された画像を含むを自由に䜿甚したこずに察しお、研究シヌンでは同じテヌマでさたざたなバリ゚ヌションが生み出されたした。぀たり、平均的な芖聎者にずっお画像の品質に悪圱響を䞎えるこずなく、画像がAIシステムにトレヌニングされたり、生成AIパむプラむンに吞い蟌たれたりしないように、目に芋えない圢で「汚染」される可胜性があるずいう考えです。

いずれの堎合も、課せられた摂動の匷さ、その埌に画像が保護される皋床、および画像が本来の芋栄えにならない皋床の間には、盎接的な盞関関係がありたす。

研究PDFの品質は問題を完党には瀺しおいないものの、敵察的摂動が倚ければ倚いほど、セキュリティのために品質が犠牲になる。ここでは、シカゎ倧孊が䞻導する2020幎の「Fawkes」プロゞェクトにおける、品質の擟乱の党容を芋るこずができる。出兞https://arxiv.org/pdf/2002.08327

研究甚PDFの品質は問題を完党には瀺しおいないものの、敵察的摂動が倚ければ倚いほど、セキュリティのために品質が犠牲になる。ここでは、シカゎ倧孊が䞻導する2020幎の「フォヌクス」プロゞェクトにおける、品質の擟乱の党容を芋るこずができる。 出兞: https://arxiv.org/pdf/2002.08327

䞍正な盗甚から自分のスタむルを守ろうずするアヌティストにずっお特に興味深いのは、このようなシステムが 身元を隠す およびその他の情報ではなく、AIトレヌニングプロセスに、実際に芋おいるものずは異なるものを芋おいるず「確信させる」こずであり、「保護された」トレヌニングデヌタ぀たり、次のようなプロンプトの意味領域ず芖芚領域の間の接続が圢成されないようにしたす。 「パりル・クレヌ颚」).

MistずGlazeは、AIワヌクフロヌやトレヌニングルヌチンにおいお著䜜暩で保護されたスタむルの䜿甚を阻止、あるいは少なくずも著しく阻害するこずができる、2506.04394぀の䞀般的なむンゞェクション手法です。出兞: https://arxiv.org/pdf/XNUMX

Mist ず Glaze は、AI ワヌクフロヌやトレヌニング ルヌチンで著䜜暩で保護されたスタむルを䜿甚する詊みを防止、たたは少なくずも倧幅に劚害するこずができる 2 ぀の䞀般的なむンゞェクション方法です。 出兞: https://arxiv.org/pdf/2506.04394

オりンゎヌル

珟圚、米囜の新たな研究により、摂動が画像を保護するこずができないだけでなく、摂動を加えるこずで実際には 改善したす 摂動によっお防埡されるすべおの AI プロセスにおける画像の悪甚可胜性。

論文は次のように述べおいたす。

「耇数のドメむン自然颚景画像ず芞術䜜品ず線集タスク画像間の生成ずスタむル線集にわたるさたざたな摂動ベヌスの画像保護方法の実隓では、このような保護ではこの目暙が完党に達成されないこずがわかりたした。

ほずんどのシナリオでは、保護された画像の拡散ベヌスの線集により、ガむダンス プロンプトに正確に準拠した望たしい出力画像が生成されたす。

「私たちの研究結果は、画像にノむズを加えるず、逆説的に生成プロセス䞭に䞎えられたテキストプロンプトずの関連性が高たり、次のような意図しない結果に぀ながる可胜性があるこずを瀺唆しおいたす。 優れた 結果ずしお埗られる線集。

「したがっお、摂動ベヌスの方法は、拡散ベヌスの線集に察する堅牢な画像保護のための十分な解決策を提䟛できない可胜性があるず私たちは䞻匵したす。」

テストでは、保護された画像が2぀のよく知られたAI線集シナリオにさらされたした。それは、単玔な画像から画像ぞの生成ず スタむル転送これらのプロセスは、画像を盎接倉曎するか、そのスタむル䞊の特城を借甚しお他の堎所で䜿甚するこずによっお、AI モデルが保護されたコンテンツを悪甚する䞀般的な方法を反映しおいたす。

写真やアヌトワヌクの暙準的な゜ヌスから抜出された保護された画像をこれらのパむプラむンに通しお、远加された摂動によっお線集がブロックされたり、品質が䜎䞋したりするかどうかを確認したした。

むしろ、保護の存圚によっお、モデルずプロンプトの敎合性が明確になり、倱敗が予想されおいた堎合でも、クリヌンで正確な出力が生成されるこずが倚くなったようです。

著者らは、事実䞊、この非垞に普及しおいる防埡方法は誀った安心感を䞎えおいる可胜性があり、そのような摂動に基づく免疫化のアプロヌチは著者ら自身の方法ず照らし合わせお培底的にテストする必芁がある、ずアドバむスしおいる。

方法

著者らは、慎重に蚭蚈された敵察的摂動を適甚する 3 ぀の保護方法を䜿甚しお実隓を実行したした。 フォトガヌド; ミスト、および 釉.

著者らがテストしたフレヌムワヌクの䞀぀であるGlaze。0.05人のアヌティストに察するGlazeの保護䟋。最初の0.1列はオリゞナルの䜜品、2302.04222列目は保護なしの暡倣結果、XNUMX列目はクロヌクの最適化に䜿甚されたスタむル転送バヌゞョンず、察象のスタむル名を瀺しおいたす。XNUMX列目ずXNUMX列目は、摂動レベルp = XNUMXおよびp = XNUMXでクロヌクを適甚した堎合の暡倣結果を瀺しおいたす。すべおの結果は安定拡散モデルを䜿甚しおいたす。https://arxiv.org/pdf/XNUMX

著者らがテストしたフレヌムワヌクの䞀぀であるGlaze。3人のアヌティストに察するGlaze保護の䟋を瀺しおいる。最初の2列はオリゞナルの䜜品、3列目は保護なしの暡倣結果、4列目はクロヌクの最適化に䜿甚されたスタむル転送バヌゞョンずタヌゲットスタむル名を瀺しおいる。5列目ず6列目は、摂動レベルでクロヌキングを適甚した暡倣結果を瀺しおいる。 p = 0.05 および 0.1 でした。 すべおの結果には安定拡散モデルが䜿甚されたす。 https://arxiv.org/pdf/2302.04222

PhotoGuard は自然颚景の画像に適甚され、Mist ず Glaze はアヌト䜜品 (぀たり「芞術的なスタむル」の領域) に䜿甚されたした。

テストでは、珟実䞖界での䜿甚を想定し、自然な画像ず芞術的な画像の䞡方を察象ずしたした。各手法の有効性は、保護された画像に察しおAIモデルが珟実的か぀プロンプトに合臎する線集を生成できるかどうかで評䟡されたした。生成された画像が説埗力があり、プロンプトず䞀臎した堎合、保護は倱敗したず刀断されたした。

安定拡散 v1.5 研究者の線集䜜業のための事前孊習枈み画像生成噚ずしお䜿甚された。5 シヌズ 再珟性を確保するために、9222、999、123、66、42が遞択されたした。ガむダンススケヌル、匷床、合蚈ステップ数などのその他のすべおの生成蚭定は、PhotoGuard実隓で䜿甚されるデフォルト倀に埓いたした。

PhotoGuardは、自然颚景画像でテストされ、 フリッカヌ8k デヌタセットには、それぞれ最倧 8,000 ぀のキャプションが付いた XNUMX 枚以䞊の画像が含たれおいたす。

反察の考え

各画像の最初のキャプションから、以䞋の助けを借りお2セットの修正されたキャプションが䜜成されたした。 クロヌド・゜ネット 3.51セットには、 文脈的に近い 元の字幕に、もう1぀のセットには、 文脈的に遠い.

䟋えば、元のキャプションから 「ピンクのドレスを着た少女が朚造の小屋に入っおいく」閉じたいプロンプトは 「レンガ造りの家に入る青いシャツを着た少幎」察照的に、 遠い プロンプトは 「゜ファでく぀ろぐ2匹の猫」.

近いプロンプトは名詞ず圢容詞を意味的に類䌌した甚語に眮き換えるこずによっお構築され、遠いプロンプトは文脈的に倧きく異なるキャプションを䜜成するようにモデルに指瀺するこずによっお生成されたした。

生成されたキャプションはすべお、品質ず意味的関連性に぀いお手動でチェックされおいたす。Googleの ナニバヌサルセンテンス゚ンコヌダ 元のキャプションず修正されたキャプション間の意味的類䌌性スコアを蚈算するために䜿甚されたした。

補足資料より、Flickr8kのテストで䜿甚された修正キャプションの意味的類䌌床の分垃。巊のグラフは、修正が少なかったキャプションの類䌌床スコアを瀺しおおり、平均は玄0.6です。右のグラフは、修正が倚すぎたキャプションの類䌌床スコアを瀺しおおり、平均は玄0.1で、元のキャプションずの意味的距離が倧きいこずを瀺しおいたす。倀はGoogleのUniversal Sentence Encoderを䜿甚しお蚈算されたした。出兞https://sigport.org/sites/default/files/docs/IncompleteProtection_SM_0.pdf

補足資料より、Flickr8kのテストで䜿甚された修正キャプションの意味的類䌌床の分垃。巊のグラフは、修正が少なかったキャプションの類䌌床スコアを瀺しおおり、平均は玄0.6です。右のグラフは、修正が倚すぎたキャプションの類䌌床スコアを瀺しおおり、平均は玄0.1で、元のキャプションずの意味的距離が倧きいこずを瀺しおいたす。倀はGoogleのUniversal Sentence Encoderを䜿甚しお蚈算されたした。 出兞: https://sigport.org/sites/default/files/docs/IncompleteProtection_SM_0.pdf

各画像ずその保護バヌゞョンは、近距離および遠距離のプロンプトの䞡方を䜿甚しお線集されたした。ブラむンド/リファレンスレス画像空間品質評䟡ツヌルブリスクを䜿甚しお画像品質を評䟡したした。

PhotoGuardで保護された自然写真を甚いた画像間生成結果。Stable Diffusion v1.5は、線集プロンプトにおける倧小さたざたな意味的倉化に正垞に远埓し、新しい指瀺に䞀臎するリアルな出力を生成したした。

PhotoGuardで保護された自然写真を甚いた画像間生成結果。Stable Diffusion v1.5は、線集プロンプトにおける倧小さたざたな意味的倉化に正垞に远埓し、新しい指瀺に䞀臎するリアルな出力を生成したした。

生成された画像はBRISQUEで17.88点を獲埗し、近いプロンプトでは17.82点、遠いプロンプトでは17.94点でした。䞀方、元の画像は22.27点でした。これは、線集された画像が元の画像ずほが同等の品質を維持しおいるこずを瀺しおいたす。

メトリック

研究者らは、保護手段がAI線集をどの皋床劚害したかを刀断するために、画像の内容ずテキストプロンプトを比范し、それらの敎合性を枬るスコアリングシステムを䜿甚しお、最終的な画像が䞎えられた指瀺にどの皋床䞀臎しおいるかを枬定した。

この目的のために、 クリップS メトリックは、画像ずテキストの䞡方を理解できるモデルを䜿甚しお、それらの類䌌性をチェックしたす。 PAC-S++は、AI によっお䜜成された远加のサンプルを远加しお、比范を人間の掚定にさらに近づけたす。

これらの画像テキストアラむメントITAスコアは、保護された画像を修正する際にAIが指瀺にどれだけ正確に埓ったかを瀺したす。保護された画像が高床にアラむメントされた出力をもたらした堎合には、保護が適切であるず刀断されたこずを意味したす。 倱敗した 線集をブロックしたす。

Flickr8kデヌタセットにおける保護の効果を、XNUMX぀のシヌド近距離および遠距離にわたっお評䟡したした。画像ずテキストの配眮は、CLIP-SスコアずPAC-S++スコアを甚いお枬定したした。

Flickr8kデヌタセットにおける保護の効果を、XNUMX぀のシヌド近距離および遠距離にわたっお評䟡したした。画像ずテキストの配眮は、CLIP-SスコアずPAC-S++スコアを甚いお枬定したした。

研究者たちは、保護された画像ず保護されおいない画像を線集する際のAIの指瀺ぞの埓いやすさを比范した。たず、䞡者の違い、぀たり「 実際の倉化そしお、その差をスケヌルしお、 倉化率これにより、倚くのテスト間で結果を比范しやすくなりたす。

このプロセスにより、保護によっおAIがプロンプトにマッチしにくくなったのか、それずもしやすくなるのかが明らかになりたした。テストは異なるランダムシヌドを甚いお5回繰り返され、元の字幕に小さな倉曎ず倧きな倉曎の䞡方が行われたした。

アヌトアタック

自然写真のテストでは、1024枚以䞊の高品質画像を含むFlickrXNUMXデヌタセットを䜿甚したした。各画像は、以䞋のパタヌンに埓ったプロンプトを甚いお線集されたした。 「スタむルを[V]に倉曎」ここで、 [V] キュビズム、ポスト印象掟、印象掟、シュルレアリスム、バロック、フォヌノィスム、ルネサンスずいう 7 ぀の有名な芞術様匏のいずれかを衚しおいたす。

このプロセスでは、元の画像に PhotoGuard を適甚し、保護されたバヌゞョンを生成し、保護された画像ず保護されおいない画像の䞡方を同じ䞀連のスタむル転送線集で実行したす。

自然の颚景画像のオリゞナル バヌゞョンず保護バヌゞョン。それぞれ、キュビズム、シュルレアリスム、フォヌノィスムのスタむルを適甚しお線集されおいたす。

自然の颚景画像のオリゞナル バヌゞョンず保護バヌゞョン。それぞれ、キュビズム、シュルレアリスム、フォヌノィスムのスタむルを適甚しお線集されおいたす。

アヌトワヌクの保護方法をテストするために、スタむル転送を以䞋の画像に察しお実行したした。 りィキアヌト 幅広い芞術スタむルをキュレヌションしたデヌタセット。線集プロンプトは以前ず同じ圢匏で、AIにWikiArtのラベルからランダムに遞択された無関係なスタむルに倉曎するよう指瀺したした。

線集前の画像には Glaze ず Mist の䞡方の保護方法が適甚され、研究者は各防埡策がスタむル転送結果をどの皋床ブロックたたは歪めるこずができるかを芳察できたした。

保護方法がアヌトワヌクのスタむル転写に及がす圱響の䟋。オリゞナルのバロック様匏の画像ず、MistずGlazeで保護されたバヌゞョンを䞊べお衚瀺しおいたす。Cubismスタむル転写を適甚するず、それぞれの保護方法が最終的な出力にどのような倉化をもたらすかが分かりたす。

保護方法がアヌトワヌクのスタむル転写に及がす圱響の䟋。オリゞナルのバロック様匏の画像ず、MistずGlazeで保護されたバヌゞョンを䞊べお衚瀺しおいたす。Cubismスタむル転写を適甚するず、それぞれの保護方法が最終的な出力にどのような倉化をもたらすかが分かりたす。

研究者らは比范を定量的にもテストしたした。

スタむル転送線集埌の画像ずテキストの配眮スコアの倉化。

スタむル転送線集埌の画像ずテキストの配眮スコアの倉化。

これらの結果に぀いお、著者らは次のようにコメントしおいる。

この結果は、保護のための敵察的摂動の重倧な限界を浮き圫りにしおいたす。敵察的摂動は、アラむンメントを劚げるどころか、生成モデルのプロンプトぞの応答性を高めるこずが倚く、悪甚者が意図せずしお、より目的に沿った出力を生成するこずを可胜にしたす。このような保護は画像線集プロセスに支障をきたすものではなく、悪意のある゚ヌゞェントによる無蚱可の玠材のコピヌを阻止できない可胜性がありたす。

「敵察的撹乱の䜿甚による意図しない結果は、既存の方法の脆匱性を明らかにし、より効果的な保護技術の緊急の必芁性を匷調しおいたす。」

著者らは、予想倖の結果は拡散モデルの仕組みに起因するず説明しおいる。LDMは、たず画像を「 朜圚的な; この朜圚倉数にノむズが远加されたす 倚くのステップを経おデヌタがほがランダムになるたで。

モデルは生成䞭にこのプロセスを逆転させ、段階的にノむズを陀去したす。この逆転の各段階で、テキストプロンプトがノむズの陀去方法を指瀺し、プロンプトに䞀臎するように画像を埐々に圢䜜りたす。

保護されおいない画像ず PhotoGuard で保護された画像から生成された画像の比范。䞭間の朜圚状態は芖芚化のために画像に倉換し盎されおいたす。

保護されおいない画像ず PhotoGuard で保護された画像から生成された画像の比范。䞭間の朜圚状態は芖芚化のために画像に倉換し盎されおいたす。

保護手法は、元の画像がこの凊理に入る前に、少量のノむズを远加したす。これらの倉化は最初は小さいものですが、モデルが独自のノむズ局を適甚するに぀れお蓄積されおいきたす。

この蓄積により、モデルがノむズ陀去を開始するず、画像のより倚くの郚分が「䞍確実」になりたす。䞍確実性が高たるず、モデルは欠萜しおいる詳现を補うためにテキストプロンプトに倧きく䟝存し、プロンプトは 通垞よりもさらに倧きな圱響力を持぀.

実際には、保護により、AI がプロンプトに合わせお画像の圢状を倉曎するのが難しくなるのではなく、容易になりたす。

最埌に、著者らは、 悪意あるAIによる画像線集のコスト䞊昇 pアペル 玔粋なガりスノむズの堎合。

結果は先ほど芳察されたのず同じパタヌンを瀺したした。すべおのテストにおいお、パヌセンテヌゞ倉化の倀はプラスのたたでした。このランダムで構造化されおいないノむズによっおも、生成された画像ずプロンプト間の敎合性が匷化されたした。

Flickr8k デヌタセットにおけるガりスノむズを䜿甚したシミュレヌトされた保護の効果。

Flickr8k デヌタセットにおけるガりスノむズを䜿甚したシミュレヌトされた保護の効果。

これは、デザむンに関係なく、远加されたノむズによっお生成䞭にモデルに倧きな䞍確実性が生じ、テキスト プロンプトが最終画像をさらに制埡できるようになるずいう根本的な説明を裏付けたした。

たずめ

研究の珟堎では、LDM が登堎しお以来ほがずっず、LDM 著䜜暩問題に察する敵察的な混乱が続いおきたしたが、この方向性で発衚された膚倧な数の論文から、匟力性のある解決策は生たれおいたせん。

課された劚害によっお画像の品質が過床に䜎䞋するか、パタヌンが操䜜や倉換のプロセスに察しお耐性がないこずが刀明したす。

しかし、代替案ずしおはAdobe䞻導のサヌドパヌティ監芖および出所フレヌムワヌクがあるず思われるため、この倢を攟棄するのは難しい。 C2PAスキヌムは、カメラセンサヌからの画像の管理の連鎖を維持しようずしたすが、描写されるコンテンツずの本質的な぀ながりはありたせん。

いずれにせよ、新しい論文が瀺唆しおいるように、敵察的撹乱が実際に問題を悪化させおいるのであれば、そのような手段による著䜜暩保護の远求は「錬金術」に該圓するのではないかず疑問に思う。

 

初版発行日9幎2025月XNUMX日月