Anderson'ın Açısı

Yapay Zeka Tarafından Oluşturulan Görsellerde Telif Hakkı Korumasının Otomatikleştirilmesi

Yayınlanan Şubat 24, 2025

Martin Anderson

ChatGPT-4o: ' Yargıç perukları takmış üç robottan oluşan bir İngiliz yüksek mahkeme mahkemesinin önden görünümünün 1792x1024px görüntüsü. Hepsi 8x10'luk bir fotoğrafı inceliyorlar, ancak fotoğrafın ne olduğunu göremiyoruz çünkü arkası bize dönük. HQ, sinematik kare'

Tartışıldığı gibi, anlatıldığı gibi geçen haftaPopüler üretken AI sistemlerinin arkasındaki temel temel modeller bile, telif hakkını ihlal eden içerikler üretebilir. yetersiz veya uyumsuz küratörlükve eğitim verilerinde aynı görüntünün birden fazla versiyonunun bulunması, aşırı oturmave tanınabilir reprodüksiyonların olasılığını artırmak.

Üretken AI alanına hakim olma çabalarına ve fikri mülkiyet ihlallerini engelleme yönündeki artan baskılara rağmen MidJourney ve OpenAI'nin DALL-E gibi büyük platformlar, zorluklarla yüzleşmek telif hakkıyla korunan içeriğin kasıtsız olarak yeniden üretilmesinin önlenmesinde:

Üretken sistemlerin telif hakkıyla korunan verileri yeniden üretme kapasitesi medyada düzenli olarak karşımıza çıkmaktadır.

Yeni modeller ortaya çıktıkça ve Çin modelleri hakimiyet kazanmak, temel modellerde telif hakkıyla korunan materyalin bastırılması zorlu bir ihtimaldir; aslında, pazar lideri open.ai geçen yıl bunun 'imkansız' telif hakkıyla korunan veriler olmadan etkili ve kullanışlı modeller yaratmak.

Önceki Teknik

Telif hakkıyla korunan materyalin yanlışlıkla üretilmesiyle ilgili olarak, araştırma sahnesi, kaynak verilere porno ve diğer NSFW materyallerinin dahil edilmesiyle benzer bir zorlukla karşı karşıyadır: kişi bilginin faydasını ister (yani, doğru insan anatomisitarihi olarak her zaman var olan çıplaklık çalışmalarına dayalı) bunu kötüye kullanma kapasitesi olmadan.

Benzer şekilde, model yapımcıları, hiper ölçekli setlere giren telif hakkıyla korunan materyalin geniş kapsamının avantajını isterler. Laion, modelin fikri mülkiyet haklarını ihlal etme kapasitesini gerçekten geliştirmemesi.

Telif hakkıyla korunan materyalin kullanımını gizlemeye çalışmanın etik ve yasal risklerini göz ardı ederek, ikinci durum için filtreleme yapmak önemli ölçüde daha zordur. NSFW içerik genellikle belirgin düşük seviyeli gizli Özellikler gerçek dünya materyaliyle doğrudan karşılaştırmalar gerektirmeden giderek daha etkili filtrelemeyi mümkün kılan. Buna karşılık, gizli yerleştirmeler Milyonlarca telif hakkıyla korunan eseri tanımlayan işaretler, kolayca tanımlanabilir işaretleyiciler kümesine indirgenmediğinden, otomatik tespit çok daha karmaşık hale gelir.

KopyalaHakim

İnsan yargısı, hem veri kümelerinin düzenlenmesinde hem de API tabanlı MidJourney gibi portalların kullanıcılarına IP kilitli materyalin iletilmesini önlemek için tasarlanmış son işlem filtrelerinin ve 'güvenlik' tabanlı sistemlerin oluşturulmasında ve ChatGPT'nin görüntü oluşturma kapasitesinde nadir ve pahalı bir metadır.

Bu nedenle İsviçre, Sony AI ve Çin arasında yeni bir akademik iş birliği sunuluyor KopyalaHakim – telif hakkı ihlaline dair olası işaretler açısından girdileri inceleyebilen, işbirliği yapan ChatGPT tabanlı 'hakimlerden' oluşan ardışık grupları düzenlemenin otomatik bir yöntemi.

CopyJudge çeşitli IP-sınırlama AI nesillerini değerlendirir. Kaynak: https://arxiv.org/pdf/2502.15278

CopyJudge çeşitli IP-sınırlama yapay zeka nesillerini değerlendirir. Kaynak: https://arxiv.org/pdf/2502.15278

CopyJudge, telif hakkıyla korunan görseller ile metinden görsele yayılma modelleri tarafından üretilen görseller arasındaki önemli benzerliği belirlemek için büyük görüntü-dil modelleri (LVLM) kullanan otomatik bir çerçeveyi etkili bir şekilde sunar.

CopyJudge yaklaşımı, telif hakkını ihlal eden istemleri optimize etmek için takviyeli öğrenmeyi kullanır ve daha sonra bu istemlerden gelen bilgileri, telif hakkıyla korunan görselleri çağırma olasılığı daha düşük olan yeni istemler oluşturmak için kullanır.

CopyJudge yaklaşımı, telif hakkını ihlal eden istemleri optimize etmek için takviyeli öğrenme ve diğer yaklaşımları kullanır ve daha sonra bu istemlerden gelen bilgileri kullanarak telif hakkıyla korunan görselleri çağırma olasılığı daha düşük yeni istemler oluşturur.

Çevrimiçi yapay zeka tabanlı birçok görüntü oluşturucu, kullanıcıların istemlerini NSFW, telif hakkıyla korunan materyal, gerçek kişilerin yeniden canlandırılması ve çeşitli diğer yasaklı alan adları için filtrelese de CopyJudge, kullanıcının gönderimini doğrudan engelleme amacı olmadan, izin verilmeyen görüntüleri uyandırma olasılığı en düşük olan 'temizlenmiş' istemler oluşturmak için geliştirilmiş 'ihlal eden' istemler kullanır.

Bu yeni bir yaklaşım olmasa da, API tabanlı üretken sistemlerin kullanıcı girdisini reddetmesini (en azından kullanıcıların geliştirme yapmasına izin verdiği için) bir nebze olsun engellemeye yardımcı olur. arka kapı erişimi (deney yoluyla reddedilen nesillere).

Bu tür yeni bir istismar (geliştiricileri tarafından kapatıldı) kullanıcıların, görüntüden videoya iş akışında yüklenen görüntüye belirgin bir haç veya çarmıh ekleyerek Kling üretici yapay zeka platformunda pornografik materyal üretmesine olanak sağlıyordu.

Kling geliştiricileri tarafından 2024 sonlarında kapatılan bir boşlukta, kullanıcılar videonun başında bir haç veya çarmıha gerilmenin belirgin olmasını talep ederek sistemin yasaklı NSFW videoları üretmesini zorlayabilirdi. Artık süresi dolan bu hack'in arkasındaki mantıkla ilgili henüz bir açıklama yapılmamış olsa da, bunun çarmıha gerilme tasvirlerinde 'kabul edilebilir' dindar Hristiyan (erkek) çıplaklığına izin vermek için tasarlandığını ve bir 'çapraz' resminin çağrılmasının daha geniş NSFW çıktısını etkili bir şekilde 'açtığını' hayal edebiliriz; ancak bunu asla bilemeyiz! Kaynak: Discord

Kling geliştiricileri tarafından 2024 sonlarında kapatılan bir açıkta, kullanıcılar I2V tohum görüntüsüne bir çarpı veya haç ekleyerek sistemin yasaklı NSFW çıktısı üretmesini zorlayabilirdi. Bu artık süresi dolmuş hack'in arkasındaki mantık hakkında henüz bir açıklama yapılmadı. Kaynak: Discord

Bu gibi durumlar, çevrimiçi üretken sistemlerde hızlı bir temizlemeye ihtiyaç duyulduğunu vurgular, özellikle de temel modelin yasaklı kavramları kaldırmak için değiştirildiği makine öğrenmesinin ortadan kaldırılması gibi. istenmeyen etkiler Son modelin kullanılabilirliği üzerine.

Daha az radikal çözümler arayan CopyJudge sistemi, görüntüleri kompozisyon ve renk gibi temel öğelere ayırmak, telif hakkı olmayan kısımları filtrelemek ve kalanları karşılaştırmak için yapay zekayı kullanarak insan tabanlı yasal kararları taklit eder. Ayrıca, istemleri ayarlamak ve görüntü oluşturmayı değiştirmek için yapay zeka destekli bir yöntem içerir ve yaratıcı içeriği korurken telif hakkı sorunlarından kaçınmaya yardımcı olur.

Yazarlar, deneysel sonuçların CopyJudge'ın bu konudaki en son teknoloji yaklaşımlarla eşdeğer olduğunu gösterdiğini ve sistemin üstün performans gösterdiğini ileri sürüyorlar. genelleme ve önceki çalışmalarla karşılaştırıldığında yorumlanabilirlik.

MKS yeni kağıt başlıklı CopyJudge: Metinden Görüntüye Yayılma Modellerinde Otomatik Telif Hakkı İhlali Tanımlama ve Azaltmave EPFL, Sony AI ve Çin'in Westlake Üniversitesi'ndeki beş araştırmacıdan geliyor.

Yöntem

CopyJudge, otomatik yargıçlardan oluşan dönen mahkemeler oluşturmak için GPT'yi kullansa da yazarlar, sistemin OpenAI'nin ürünü için optimize edilmediğini ve bunun yerine çok sayıda alternatif Büyük Görüntü Dil Modeli'nin (LVLM) kullanılabileceğini vurguluyor.

İlk olarak, yazarların soyutlama-filtrasyon-karşılaştırma çerçevesinin, aşağıdaki şemanın sol tarafında gösterildiği gibi kaynak görüntüleri bileşen parçalarına ayırması gerekmektedir:

CopyJudge iş akışının başlangıç aşaması için kavramsal şema.

Sol alt köşede, telif hakkıyla korunan bir esere özgü olabilecek özellikleri tespit etmeye çalışan, ancak kendi başına bir ihlal olarak nitelendirilemeyecek kadar genel olan görüntü bölümlerini parçalayan bir filtreleme aracı görüyoruz.

Daha sonra filtrelenmiş elemanları değerlendirmek için birden fazla LVLM kullanılır; bu yaklaşımın 2023 CSAIL gibi makalelerde etkili olduğu kanıtlanmıştır teklif Çoklu Aracı Tartışması Yoluyla Dil Modellerinde Gerçeklik ve Muhakemenin İyileştirilmesi, ve SohbetEvalYeni makalede kabul edilen diğer çeşitli hususlar arasında.

Yazarlar şunları belirtiyor:

'[Biz] her LVLM'nin bir sonraki kararı vermeden önce [diğer] LVLM'lerden [yanıtları] aldığı tamamen bağlantılı senkron bir iletişim tartışma yaklaşımını benimsiyoruz. Bu, modeller değerlendirmelerini akranları tarafından sunulan yeni içgörülere göre uyarladıkça analizin güvenilirliğini ve derinliğini güçlendiren dinamik bir geri bildirim döngüsü yaratır.

'Her LVLM, diğer LVLM'lerden gelen yanıtlara göre puanını ayarlayabilir veya değiştirmeden tutabilir.'

İnsanlar tarafından puanlanan birden fazla görüntü çifti de, bağlam içi öğrenme yoluyla birkaç çekimle sürece dahil edilir.

Döngüdeki 'mahkemeler' kabul edilebilirlik aralığında bir fikir birliği puanına ulaştıklarında, sonuçlar sonuçları nihai bir puana sentezleyen bir 'meta yargıç' olan LVLM'ye iletilir.

Hafifletme

Yazarlar daha sonra daha önce anlatılan acil müdahale sürecine yoğunlaştılar.

CopyJudge'ın istemleri ve gizli gürültüyü iyileştirerek telif hakkı ihlalini azaltma şeması. Sistem, yinelemeli geri bildirime göre istemleri yinelemeli olarak ayarlar ve ihlal riskini azaltmak için gizli değişkenleri değiştirmek için takviyeli öğrenmeyi kullanır.

CopyJudge'ın uyarıları ve gizli gürültüyü iyileştirerek telif hakkı ihlallerini azaltma şeması. Sistem, uyarılar geliştikçe gizli değişkenleri değiştirmek için takviyeli öğrenmeyi kullanarak uyarıları yinelemeli olarak ayarlıyor ve bu sayede ihlal riskini azaltıyor.

Hızlı azaltma için kullanılan iki yöntem şunlardır: LVLM tabanlı hızlı denetim; burada, etkili, ihlal etmeyen istemler GPT kümeleri arasında yinelemeli olarak geliştirilir; bu, model mimarisine dahili erişim gerektirmeyen, tamamen 'kara kutu' bir yaklaşımdır; ve takviye öğrenmeTelif hakkını ihlal eden çıktıları cezalandırmak için ödülün tasarlandığı, temelli (RL tabanlı) yaklaşım.

Veriler ve Testler

CopyJudge'ı test etmek için çeşitli veri kümeleri kullanıldı; bunlar arasında şunlar yer alır: D-Temsilcisiİnsanların 0-5 arasında puanladığı gerçek ve sahte resim çiftlerini içeren.

Hugging Face'deki D-Rep veri setini keşfetme. Bu koleksiyon gerçek ve oluşturulmuş görüntüleri eşleştiriyor. Kaynak: https://huggingface.co/datasets/WenhaoWang/D-Rep/viewer/default/

Hugging Face'deki D-Rep veri setini keşfetme. Bu koleksiyon gerçek ve oluşturulmuş görüntüleri eşleştirir. Kaynak: https://huggingface.co/datasets/WenhaoWang/D-Rep/viewer/default/

CopyJudge şeması, 4 veya daha fazla puan alan D-Rep görüntülerini ihlal örnekleri olarak değerlendirdi, geri kalanını ise IP ile alakasız olarak tuttu. Veri setindeki 4000 resmi görüntü, test görüntüleri olarak kullanıldı. Ayrıca araştırmacılar, Wikipedia'dan 10 ünlü çizgi film karakteri için görüntüler seçti ve düzenledi.

Potansiyel olarak ihlal edici görüntüler üretmek için kullanılan üç yayılma tabanlı mimari Kararlı Difüzyon V2; Kandinsky2-2; Ve Kararlı Difüzyon XLYazarlar her bir modelden ihlal eden bir görüntü ve ihlal etmeyen bir görüntü seçerek 60 pozitif ve 60 negatif örnek elde ettiler.

Karşılaştırma için seçilen temel yöntemler şunlardı: L₂ norm; Öğrenilmiş Algısal Görüntü Yama Benzerliği (LPİP'ler); SSCD; RLCP; Ve PDF-Gömme. Metrikler, Doğruluk ve F1 skoru ihlal kriteri olarak kullanıldı.

GPT-4o, CopyJudge'ın dahili tartışma ekiplerini doldurmak için kullanıldı ve herhangi bir belirli gönderilen görüntü üzerinde en fazla beş yineleme için üç aracı kullanıldı. D-Rep'teki her derecelendirmeden rastgele üç görüntü insan olarak kullanıldı öncekiler acentelerin dikkate alması için.

CopyJudge'ın ilk turdaki ihlal sonuçları.

Yazarlar bu sonuçlar hakkında şu yorumu yapıyor:

'[Bu] geleneksel görüntü kopyası tespit yöntemlerinin telif hakkı ihlali tanımlama görevinde sınırlamalar sergilediği açıktır. Yaklaşımımız çoğu yöntemden önemli ölçüde daha iyi performans göstermektedir. D-Rep'ten 36,000 örnek üzerinde eğitilen son teknoloji yöntemi PDF-Emb için D-Rep'teki performansımız biraz daha düşüktür.

'Ancak, Karikatür IP ve Sanat Eserleri veri setindeki zayıf performansı, genelleme yeteneğinin eksikliğini ortaya koyarken, yöntemimiz veri setleri arasında eşit derecede mükemmel sonuçlar ortaya koymaktadır.'

Yazarlar ayrıca CopyJudge'ın geçerli ve ihlal edici davalar arasında 'nispeten' daha belirgin bir sınır çizdiğini de belirtiyorlar:

Yeni makalenin ek materyalinde, test turlarından daha fazla örnek yer alıyor.

Araştırmacılar, yöntemlerini Sony'nin yapay zeka destekli bir yöntemiyle karşılaştırdılar işbirliği 2024'ten itibaren başlıklı Yayılma Modellerinde Ezberlemenin Tespiti, Açıklanması ve AzaltılmasıBu çalışmada, çıkarım anında telif hakkıyla korunan verileri ortaya çıkarmak için 200 ezberlenmiş (yani aşırı uydurulmuş) görüntü içeren ince ayarlı bir Kararlı Difüzyon modeli kullanıldı.

Yeni çalışmanın yazarları, kendi hızlı azaltma yöntemlerinin, 2024 yaklaşımına kıyasla, ihlale neden olma olasılığı daha düşük görüntüler üretebildiğini buldular.

CopyJudge ile ezber azaltma çalışmalarının sonuçları 2024 çalışmasıyla karşılaştırıldı.

Yazarların buradaki yorumları şöyle:

'[Bizim] yaklaşımımız, benzer, biraz daha düşük bir eşleşme doğruluğu sağlarken, ihlale neden olma olasılığı daha düşük görüntüler üretebilir. [Aşağıdaki görselde] görüldüğü gibi, yöntemimiz, ezberlemeyi azaltma veya oldukça sapmalı görüntüler oluşturma gibi [önceki] yöntemin eksikliklerini etkili bir şekilde ortadan kaldırıyor.'

Ezberlemeyi azaltmadan önce ve sonra üretilen görsellerin ve istemlerin karşılaştırılması.

Yazarlar, ihlalin azaltılmasına ilişkin daha fazla test yürüttüler ve şunları incelediler: açık ve dolaylı olarak ihlali.

Açık ihlal istemler doğrudan telif hakkıyla korunan materyale atıfta bulunduğunda ortaya çıkar, örneğin 'Mickey Mouse'un bir görüntüsünü oluştur'Bunu test etmek için araştırmacılar 20 karikatür ve sanat eseri örneği kullandılar ve Stable Diffusion v2'de açıkça ad veya yazar atıfları içeren istemlerle ihlal edici görseller oluşturdular.

Yazarların Gizli Kontrol (LC) yöntemi ile önceki çalışmanın Hızlı Kontrol (PC) yöntemi arasında, açık ihlali tasvir eden görüntüler oluşturmak için Sabit Yayılım kullanılarak çeşitli varyasyonlarda bir karşılaştırma.

Yazarların Gizli Kontrol (LC) yöntemi ile önceki çalışmanın Hızlı Kontrol (PC) yönteminin, açık ihlali gösteren görüntüler oluşturmak için Kararlı Yayılım kullanılarak çeşitli varyasyonlarda karşılaştırılması.

Zımni ihlal telif hakkıyla ilgili açık referansların bulunmadığı ancak yine de belirli tanımlayıcı unsurlar nedeniyle ihlal edici bir görüntüyle sonuçlanan bir istemde ortaya çıkar. Bu senaryo, telif hakkıyla ilgili istemleri tanımlamak ve engellemek için genellikle içerik algılama sistemleri içeren ticari metinden görüntüye modelleri için özellikle önemlidir.

Bunu araştırmak için yazarlar, açık ihlal testinde olduğu gibi aynı IP kilitli örnekleri kullandılar, ancak DALL-E 3 kullanarak doğrudan telif hakkı referansları olmadan ihlal eden görseller ürettiler (makalede, modelin yerleşik güvenlik algılama modülünün, filtrelerini tetikleyen belirli istemleri reddettiği gözlemlendiği belirtiliyor).

DALLE-3 kullanılarak yapılan örtük ihlal, ihlal ve CLIP puanlarıyla birlikte.

Yazarlar şunları belirtiyor:

'[Bu] yöntemimizin hem açık hem de örtük ihlaller için ihlal olasılığını önemli ölçüde azalttığı, yalnızca CLIP Puanında hafif bir düşüş olduğu görülebilir. Yalnızca gizli kontrolden sonraki ihlal puanı, uyarıyı değiştirmeden ihlal etmeyen gizli bilgileri almak oldukça zor olduğundan, uyarı kontrolünden sonrakinden nispeten daha yüksektir. Ancak, daha yüksek görüntü-metin eşleştirme kalitesini korurken ihlal puanını yine de etkili bir şekilde azaltabiliriz.

'[Aşağıdaki görsel], kullanıcı gereksinimlerini korurken fikri mülkiyet ihlalinden kaçındığımızı gözlemleyebileceğimiz görselleştirme sonuçlarını göstermektedir.'

IP ihlalinin azaltılmasından önce ve sonra oluşturulan görüntüler.

Sonuç

Çalışma, yapay zeka tarafından oluşturulan görüntülerde telif hakkı korumasına yönelik umut verici bir yaklaşım sunsa da, ihlal tespiti için büyük görsel dil modelleri (LVLM) kullanılması, yapay zeka tarafından yönlendirilen kararların her zaman yasal standartlarla uyumlu olmayabileceği için önyargı ve tutarlılık konusunda endişelere yol açabilir.

Belki de en önemlisi, proje, yapay zekanın yorumlamakta zorlanabileceği öznel ve bağlamsal faktörleri sıklıkla içeren gerçek dünyadaki yasal kararlara rağmen, telif hakkı uygulamasının otomatikleştirilebileceğini de varsayıyor.

Gerçek dünyada, özellikle yapay zeka çıktıları etrafında hukuki mutabakat otomasyonunun, bundan çok daha uzun bir süre boyunca tartışmalı bir konu olmaya devam etmesi ve bu çalışmada ele alınan alanın kapsamının çok ötesinde kalması muhtemel görünüyor.

İlk yayın tarihi Pazartesi, 24 Şubat 2025