saplama AI Tabanlı Etiketleme ile Deepfake Veri Kaynaklarını Belirleme - Unite.AI
Bizimle iletişime geçin

Yapay Zeka

AI Tabanlı Etiketleme ile Deepfake Veri Kaynaklarını Belirleme

mm
Güncellenmiş on

Çin, Singapur ve ABD'deki araştırmacılar arasındaki bir işbirliği, yüz fotoğraflarını o kadar güçlü bir şekilde "etiketlemek" için dayanıklı bir sistem üretti; deepfake eğitim süreci, sentetik görüntü oluşturma sistemlerinin meşru olmayan bir şekilde kazınmış kaynak verilerini 'anonimleştirme' becerisine zarar verebilecek IP iddialarının önünü açıyor.

başlıklı sistem, Sahte Etiketleyici, görsel olarak ayırt edilemeyen kimlik bilgilerini görüntülere yeterince düşük bir seviyede gömmek için bir kodlayıcı/kod çözücü işlemi kullanır; soyutlama örneğin göz veya ağız verileri gibi bozulmadan işler.

FakeTagger mimarisine genel bakış. Kaynak veriler, tipik bir derin sahte iş akışıyla maskelenecek olan arka plan öğelerini göz ardı ederek, 'yedek' bir yüz özelliği oluşturmak için kullanılır. Mesaj, sürecin diğer ucunda kurtarılabilir ve uygun bir tanıma algoritması aracılığıyla tanımlanabilir. Kaynak: http://xujuefei.com/felix_acmmm21_faketagger.pdf

FakeTagger mimarisine genel bakış. Kaynak veriler, tipik bir derin sahte iş akışıyla maskelenecek olan arka plan öğelerini göz ardı ederek, 'yedek' bir yüz özelliği oluşturmak için kullanılır. Mesaj, sürecin diğer ucunda kurtarılabilir ve uygun bir tanıma algoritması aracılığıyla tanımlanabilir. Kaynak: http://xujuefei.com/felix_acmmm21_faketagger.pdf

Araştırma, Wuhan'daki Siber Bilimler ve Mühendislik Okulu, Çin Eğitim Bakanlığı'ndaki Havacılık Bilgi Güvenliği ve Güvenilir Bilgi İşlem Ana Laboratuvarı, ABD'deki Alibaba Group, Boston'daki Northeastern Üniversitesi ve Singapur'daki Nanyang Teknoloji Üniversitesi'nden geliyor.

FakeTagger ile yapılan deneysel sonuçlar, dört yaygın derin sahte metodoloji türünde neredeyse %95'e varan bir yeniden tanımlama oranına işaret ediyor: kimlik takası (ör. Derin Yüz Laboratuvarı, Yüz nakli); yüz canlandırma; öznitelik düzenleme; ve toplam sentez.

Deepfake Tespitinin Eksiklikleri

Son üç yılın getirdiği bir ürün Deepfake tanımlama metodolojilerine yönelik yeni yaklaşımlar arasında, bu yaklaşımların tümü, deepfake iş akışlarının düzeltilebilir eksikliklerine odaklanır. göz parlaması yetersiz eğitimli modellerde ve yanıp sönme eksikliği yetersiz çeşitlilikte yüz kümelerine sahip önceki deepfake'lerde. Yeni anahtarlar belirlendikçe, ücretsiz ve açık kaynaklı yazılım depoları, ya kasıtlı olarak ya da deepfake tekniklerindeki gelişmelerin bir yan ürünü olarak bunların önüne geçti.

Yeni makale, Facebook'un en son derin sahte tespit yarışmasından (DFDC) üretilen en etkili post-facto tespit yönteminin, vahşi ortamda derin sahteleri tespit etme açısından %70 doğrulukla sınırlı olduğunu gözlemliyor. Araştırmacılar, bu temsili başarısızlığı, yeni ve yenilikçi GAN ve kodlayıcı/kod çözücü deepfake sistemleri ve genellikle bozulmuş deepfake ikameleri kalitesi.

İkinci durumda, bunun nedeni deepfaker'ların düşük kaliteli çalışması veya videolar, bant genişliği maliyetlerini sınırlamak ve videoları gönderimlerden çok daha düşük bit hızlarında yeniden kodlamak isteyen paylaşım platformlarına yüklendiğinde sıkıştırma yapaylıkları olabilir. . İronik olarak, bu sadece görüntü bozulmasını değil değil bir deepfake'in görünürdeki özgünlüğüne müdahale edebilir, ancak deepfake videosu gerçek olarak algılanan yaygın, düşük kaliteli bir görsel deyime dahil edildiğinden, aslında illüzyonu artırabilir.

Model Tersine Çevirmeye Yardımcı Olarak Kalıcı Etiketleme

Makine öğrenimi çıktısından kaynak verilerinin belirlenmesi nispeten yeni ve büyüyen bir alandır ve hükümetlerin şu anda mevcut olduğu gibi, fikri mülkiyete dayalı davalarda yeni bir dönemi mümkün kılan bir alandır. müsamahakâr ekran kazıma düzenlemeleri (küresel bir yapay zeka 'silahlanma yarışı' karşısında ulusal araştırma üstünlüğünü bastırmamak için tasarlanmış), sektör ticarileştikçe daha katı yasalara dönüşüyor.

Modeli ters çevirme Doğal Dil Üretimi (NLG) ve görüntü sentezi dahil olmak üzere bir dizi alanda sentez sistemleri tarafından üretilen çıktıdan kaynak verilerin haritalanması ve tanımlanması ile ilgilenir. Modelin ters çevrilmesi, özellikle bulanık, pikselli veya başka bir Üretken Çekişmeli Ağın veya DeepFaceLab gibi kodlayıcı/kod çözücü dönüşüm sisteminin soyutlama sürecinden geçmiş yüzlerin yeniden tanımlanmasında etkilidir.

Yeni veya mevcut yüz görüntülerine hedefli etiketleme eklemek, tersine çevirme tekniklerini modellemek için potansiyel olarak yeni bir yardımcıdır. Damgalama ortaya çıkan bir alan.

Olay Sonrası Etiketleme

FakeTagger, bir işlem sonrası yaklaşımı olarak tasarlanmıştır. Örneğin, bir kullanıcı bir sosyal ağa bir fotoğraf yüklediğinde (bu genellikle bir tür optimizasyon sürecini içerir ve nadiren orijinal görüntünün doğrudan ve bozulmamış bir şekilde aktarılmasını içerir), algoritma yüze sözde silinmez özellikler uygulamak için görüntüyü işler. .

Alternatif olarak, büyük stok fotoğraf ve ticari resim toplama sitelerinin aradığı gibi, son yirmi yılda birkaç kez olduğu gibi, algoritma tarihsel görüntü koleksiyonlarına uygulanabilir. yöntemleri izinsiz yeniden kullanılmış içeriği belirlemek için.

FakeTagger, çeşitli derin sahte işlemlerden kurtarılabilir kimlik özelliklerini yerleştirmeye çalışır.

FakeTagger, çeşitli derin sahte işlemlerden kurtarılabilir kimlik özelliklerini yerleştirmeye çalışır.

Geliştirme ve Test

Araştırmacılar, FakeTagger'ı, en yaygın kullanılan veri havuzu DeepFaceLab; Stanford'lar Yüz2Yüzyüz ifadelerini görüntüler ve kimlikler arasında aktarabilen; Ve STGAN, yüz niteliklerini düzenleyebilen.

Test yapıldı CelebA-HQ30,000 x 1024 piksele kadar çeşitli çözünürlüklerde ünlülerin 1024 yüz resmini içeren popüler bir kazınmış halka açık depo.

Temel olarak, araştırmacılar, uygulanan etiketlerin derin sahte iş akışlarının eğitim süreçlerinde hayatta kalıp kalamayacağını görmek için başlangıçta geleneksel görüntü filigranlama tekniklerini test ettiler, ancak yöntemler dört yaklaşımda da başarısız oldu.

FakeTagger'ın gömülü verileri, kodlayıcı aşamasında, U-Net biyomedikal Görüntü segmentasyonu için evrişimli ağ, 2015'te piyasaya sürüldü. Ardından, çerçevenin kod çözücü bölümü gömülü bilgileri bulmak için eğitildi.

Süreç, yukarıda belirtilen FOSS uygulamalarını/algoritmalarını kullanan bir GAN simülatöründe, her bir sistemin iş akışlarına ayrı veya özel erişimi olmayan bir kara kutu ortamında denendi. Ünlü resimlerine rastgele sinyaller eklendi ve her bir resim için ilgili veri olarak kaydedildi.

Bir kara kutu ayarında, FakeTagger dört uygulamanın yaklaşımına göre %88.95'i aşan bir doğruluk elde etmeyi başardı. Paralel beyaz kutu senaryosunda, doğruluk neredeyse %100'e yükseldi. Bununla birlikte, bu, FakeTagger'ı doğrudan içeren derin sahte yazılımların gelecekteki yinelemelerini gösterdiğinden, yakın gelecekte olası bir senaryo değildir.

Maliyeti Saymak

Araştırmacılar, FakeTagger için en zorlu senaryonun, CLIP tabanlı özet oluşturma gibi tam görüntü sentezi olduğunu, çünkü böyle bir durumda girdi eğitim verilerinin çok derin soyutlama düzeylerine tabi olduğunu belirtiyorlar. Ancak bu, kimlik tanımlayıcı yüz özelliklerinin aslına sadık bir şekilde yeniden üretilmesine bağlı olduğundan, son yıllarda manşetlere hakim olan derin sahte iş akışları için geçerli değildir.

Makale ayrıca, saldırganların böyle bir etiketleme sistemini bozmak için yapay gürültü ve gren gibi pertürbasyonlar eklemeye çalışabileceklerini, ancak bunun derin sahte çıktının orijinalliği üzerinde zararlı bir etkiye sahip olmasının muhtemel olduğunu belirtiyor.

Ayrıca, FakeTagger'ın yerleştirdiği etiketlerin hayatta kalmasını sağlamak için görüntülere fazladan veriler eklemesi gerektiğini ve bunun ölçekte kayda değer bir hesaplama maliyeti olabileceğini belirtiyorlar.

Yazarlar, FakeTagger'ın aşağıdakiler gibi diğer alanlarda kaynak izleme potansiyeline sahip olabileceğini belirterek sonuca varıyor: düşmanca yağmur saldırıları ve diğer görüntü tabanlı saldırı türleri, örneğin düşmanca maruz kalma, pus, bulanıklık, vinyet ve renk titremesi.