Bizimle iletişime geçin

Yapay Zeka

Görüntü İşleme Veri Kümeleri için DRM

mm

Tarih, bilgisayarlı görüş araştırmalarının 'açık' çağının, yeniden üretilebilirliğin ve olumlu akran değerlendirmesinin yeni bir girişimin geliştirilmesinde merkezi öneme sahip olduğu, sonunda, kapalı mekanizmaların ve duvarlarla çevrili platformların rakiplerin yüksek veri seti geliştirme maliyetlerini baltalamasını veya maliyetli bir projeyi kendi (belki de daha üstün) sürümlerini geliştirmek için bir basamak taşı olarak kullanmasını engellediği yeni bir fikri mülkiyet koruma çağına yol açması gerektiğini gösteriyor.

Günümüzde korumacılığa doğru büyüyen eğilim, esas olarak API erişiminin arkasına tescilli merkezi çerçevelerin yerleştirilmesiyle destekleniyor; burada kullanıcılar seyrek token'lar veya istekler gönderiyor ve çerçevenin yanıtlarını değerli kılan dönüşümsel süreçler tamamen gizleniyor.

Diğer durumlarda, nihai modelin kendisi yayınlanabilir, ancak onu değerli kılan önceden eğitilmiş ağırlıklar gibi merkezi bilgiler olmadan yayınlanabilir. birkaç milyona mal olmuş olabilir üretmek; veya tescilli bir veri kümesinden yoksun olmak veya bir alt kümenin bir dizi açık veri kümesinden nasıl üretildiğine dair kesin ayrıntılara sahip olmamak. OpenAI'nin dönüştürücü Doğal Dil modeli GPT-3 örneğinde, her iki koruma önlemi de şu anda kullanımda olduğundan, modelin taklitçileri, örneğin, GPT Neo, ürünün bir tahminini ellerinden geldiğince bir araya getirmek.

Kopya Korumalı Görüntü Veri Kümeleri

Ancak, söz konusu sistemi yalnızca yetkili kullanıcıların (örneğin ücretli kullanıcıların) kârlı bir şekilde kullanabilmesini sağlayarak, "korumalı" bir makine öğrenimi çerçevesinin bir miktar taşınabilirlik kazanmasını sağlayacak yöntemlere olan ilgi giderek artmaktadır. Bu, genellikle veri kümesinin programatik bir şekilde şifrelenmesini içerir; böylece eğitim sırasında yapay zeka çerçevesi tarafından "temiz" okunur, ancak başka bir bağlamda tehlikeye atılır veya kullanılamaz hale gelir.

Böyle bir sistem, Anhui'deki Çin Bilim ve Teknoloji Üniversitesi ve Şangay'daki Fudan Üniversitesi'ndeki araştırmacılar tarafından daha yeni önerildi. Başlıklı Tersine Çevrilebilir Görüntü Veri Kümesi Koruması, kâğıt otomatik olarak ekleyen bir işlem hattı sunar rakip örnek pertürbasyon bir görüntü veri kümesine, böylece korsanlık durumunda eğitim için yararlı bir şekilde kullanılamaz, ancak koruma tamamen gizli bir belirteç içeren yetkili bir sistem tarafından filtrelenir.

Makaleden: 'değerli' bir kaynak görüntü, 'yetkili' bir kullanıcı için sistematik ve tamamen otomatik olarak kaldırılan ters örnek teknikleriyle etkili bir şekilde eğitilemez hale getirilir. Kaynak: https://arxiv.org/pdf/2112.14420.pdf

Makaleden: 'Değerli' bir kaynak görüntü, saldırgan örnek teknikleriyle etkili bir şekilde eğitilemez hale getirilir ve bozulmalar 'yetkili' bir kullanıcı için sistematik ve tamamen otomatik olarak kaldırılır. Kaynak: https://arxiv.org/pdf/2112.14420.pdf

Korumayı etkinleştiren mekanizmaya tersinir ters örnek oluşturucu (RAEG) adı verilir ve etkin bir şekilde gerçek ağda şifreleme anlamına gelir. KULLANILABİLİRLİK Görüntülerin sınıflandırılması amacıyla, tersine çevrilebilir veri gizleme (RDH). Yazarlar şunları belirtiyor:

'Bu yöntem, öncelikle mevcut AE yöntemlerini kullanarak düşmanca görüntüyü oluşturur, ardından düşmanca bozulmayı düşmanca görüntüye gömer ve RDH kullanarak stego görüntüyü oluşturur. Tersinirlik özelliği sayesinde, düşmanca bozulma ve orijinal görüntü kurtarılabilir.'

Veri kümesinden alınan orijinal görüntüler, sınıflandırma sistemlerini aldatmak için hazırlanmış, düşmanca etkilenmiş görüntüler üretmek için U şeklinde bir tersine çevrilebilir sinir ağına (INN) beslenir. Bu, tipik özellik çıkarımının altının oyulacağı ve cinsiyet gibi özelliklerin ve diğer yüz tabanlı özelliklerin sınıflandırılmasını zorlaştıracağı anlamına gelir (yine de mimari, yalnızca yüz tabanlı materyalden ziyade bir dizi etki alanını destekler).

Rekonstrüksiyondan önce görüntüler üzerinde farklı türden saldırıların gerçekleştirildiği bir RAEG ters çevirme testi. Saldırı yöntemleri, Gauss Bulanıklığı ve JPEG eserlerini içerir.

Rekonstrüksiyondan önce görüntüler üzerinde farklı türden saldırıların gerçekleştirildiği bir RAEG ters çevirme testi. Saldırı yöntemleri, Gauss Bulanıklığı ve JPEG eserlerini içerir.

Bu nedenle, GAN tabanlı yüz oluşturma veya yüz tanıma amaçları için tasarlanmış bir çerçevede 'bozuk' veya 'şifrelenmiş' veri kümesini kullanmaya çalışıldığında, ortaya çıkan model, bozulmamış görüntüler üzerinde eğitilmiş olsaydı olacağından daha az etkili olacaktır.

Görüntüleri Kilitleme

Ancak bu, popüler bozulma yöntemlerinin genel uygulanabilirliğinin yalnızca bir yan etkisidir. Aslında, öngörülen kullanım senaryosunda, hedef çerçeveye yetkili erişim durumu dışında veriler sekteye uğrayacaktır, çünkü temiz verilerin merkezi "anahtarı" hedef mimari içindeki gizli bir belirteçtir.

Bu şifrelemenin bir bedeli var; araştırmacılar orijinal görüntü kalitesindeki kaybı 'hafif bozulma' olarak nitelendiriyor ve şöyle diyor: 'Önerilen yöntem orijinal görüntüyü neredeyse mükemmel bir şekilde geri getirebilirken, önceki yöntemler yalnızca bulanık bir sürümü geri getirebiliyor.'

Söz konusu önceki yöntemler Kasım 2018'den kâğıt Yetkisiz Yapay Zeka Beni Tanıyamaz: Tersine Çevrilebilir Düşman Örneği, iki Çin üniversitesi ve RIKEN Gelişmiş İstihbarat Merkezi Projesi (AIP) arasındaki bir işbirliği; Ve Tersinir Görüntü Dönüşümüne Dayalı Tersinir Düşman Saldırısı, 2019 kağıt ayrıca Çin akademik araştırma sektöründen.

Yeni makalenin araştırmacıları, ilk yaklaşımın ara müdahaleye karşı çok hassas ve atlatılması çok kolay olduğunu, ikinci yaklaşımın ise aşırı bozulmaya neden olduğunu gözlemleyerek, bu önceki yaklaşımlara kıyasla geri yüklenen görüntülerin kullanılabilirliğinde kayda değer gelişmeler kaydettiğini iddia ediyor. orijinal görüntülerin (yetkilendirilmiş) eğitim zamanında kullanılması, sistemin uygulanabilirliğini zayıflatır.

Mimari, Veriler ve Testler

Yeni sistem bir üreteç, pertürbasyon uygulayan bir saldırı katmanı, önceden eğitilmiş hedef sınıflandırıcılar ve bir ayırt edici elemandan oluşuyor.

RAEG mimarisi. Sol-ortada, kaynak görüntülerde işlenen tedirgin özellikleri tanımlayarak ve bunları iskonto ederek, eğitim zamanında görüntünün bozulmasını gidermeye izin verecek olan 'Iprt' gizli belirtecini görüyoruz.

RAEG mimarisi. Sol-orta, 'I' gizli belirtecini görüyoruzprt', kaynak görüntülerde işlenen tedirgin özellikleri tanımlayarak ve bunları indirerek, eğitim zamanında görüntünün bozulmasını gidermeye izin verecek.

Aşağıda, üç veri kümesi kullanılarak önceki iki yaklaşımla yapılan bir test karşılaştırmasının sonuçları verilmiştir: ÜnlüA-100; Caltech-101; Ve Mini ImageNet.

Üç veri seti, 32 dönem boyunca bir hafta boyunca bir NVIDIA RTX 3090 üzerinde 50 toplu iş boyutuyla hedef sınıflandırma ağları olarak eğitildi.

Yazarlar, RAEG'nin aktif olarak düşmanca örnekler üretebilen tersine çevrilebilir bir sinir ağı sunan ilk çalışma olduğunu iddia ediyor.

 

İlk olarak 4 Ocak 2022'de yayınlandı.

 

Makine öğrenimi yazarı, insan görüntü sentezi alanında uzman. Metaphysic.ai'de eski araştırma içeriği başkanı.
Kişisel sitesi: martinanderson.ai
İletişim [e-posta korumalı]
Twitter: @manders_ai