Yapay Zekâ

Derin Sahte Veri Kaynaklarını AI Tabanlı Etiketleme ile Tanımlama

Published July 30, 2021

Updated April 5, 2026

Martin Anderson

Çin, Singapur ve ABD’deki araştırmacılar arasında bir işbirliği, yüz fotoğraflarını öyle güçlü bir şekilde “etiketleme” için dayanıklı bir sistem üretti ki, tanımlayıcı işaretler derin sahte eğitim sürecinde yok edilmez, böylece IP iddiaları sentetik görüntü oluşturma sistemlerinin yasadışı bir şekilde kazındırılmış kaynak verilerini “anonimleştirmesi” yeteneğinde bir gedik açabilir.

Sistem, FakeTagger olarak adlandırıldı, görsel olarak ayırt edilemeyen ID bilgilerini görüntülere düşük bir seviyede gömerek, enkoder/dekoder işlemi kullanır, böylece enjekte edilen bilgi temel yüz özelliği verileri olarak yorumlanacak ve bu nedenle, örneğin göz veya ağız verileri gibi, soyutlama işlemlerinden intact olarak geçirilecektir.

FakeTagger mimarisinin bir özeti. Kaynak verileri, bir ‘aşırı’ yüz özelliğini oluşturmak için kullanılır, arka plan öğelerini görmezden gelir, bunlar tipik bir derin sahte iş akışında maskeleme yoluyla çıkarılır. Mesaj, işlemin diğer ucunda geri kazanılabilir ve uygun bir tanıma algoritması ile tanımlanabilir. Kaynak: http://xujuefei.com/felix_acmmm21_faketagger.pdf

Araştırma, Wuhan’daki Siber Bilim ve Mühendislik Okulu, Çin Eğitim Bakanlığı’nın Aerospace Bilgi Güvenliği ve Güvenilir Bilişim Anahtar Laboratuvarı, ABD’deki Alibaba Grubu, Boston’daki Northeastern Üniversitesi ve Singapur’daki Nanyang Teknoloji Üniversitesi’nden geliyor.

Deneysel sonuçlar, FakeTagger ile dört ortak derin sahte metodolojisi türü boyunca %95’e kadar yeniden tanımlama oranını gösterir: kimlik değişimi (yani DeepFaceLab, FaceSwap); yüz yeniden canlandırma; öznitelik düzenleme; ve toplam sentez.

Derin Sahte Tespitinin Eksiklikleri

Son üç yıl, derin sahte tanımlama metodolojilerine yönelik yeni bir dizi yaklaşım getirdi, ancak bu tüm yaklaşımlar, göz parıltısı gibi derin sahte iş akışlarının onarılabilir eksikliklerine dayanır ve göz kırpma eksikliği gibi daha önceki derin sahtelerde yetersiz yüz kümeleri.

Hayatta Kalan Etiketleme

Identifying source data from machine learning output is a relatively new and growing field, ve bir dizi alanda, Natural Language Generation (NLG) ve görüntü sentezi dahil, sentez sistemlerinin çıkışından kaynak verilerini haritalama ve tanımlama ile ilgilenen Model Inversion ile mümkün kılınan bir yeni IP tabanlı dava dönemi.

Sonraki Etiketleme

FakeTagger, bir post-işleme yaklaşımı olarak tasarlandı. Örneğin, bir kullanıcı bir fotoğrafı bir sosyal ağa yüklerse (bu genellikle bir optimize etme işlemi içerir ve nadiren orijinal görüntünün doğrudan ve değişmeden aktarılması), algoritma görüntüyü işlemek için yüzüne iddia edilen silinmez özellikler uygulayacaktır.

Geliştirme ve Test

Araştırmacılar, FakeTagger’ı, en yaygın kullanılan depo olan DeepFaceLab; Stanford’un Face2Face gibi dört yaklaşım türündeki bir dizi derin sahte yazılım uygulamasına karşı test etti; ve STGAN, yüz özniteliklerini düzenleyebilir.

Maliyeti Hesaplamak

Araştırmacılar, FakeTagger için en zorlu senaryonun, CLIP tabanlı soyut oluşturma gibi, hoàn bir görüntü sentezi olduğunu belirtiyorlar, çünkü bu durumda girdi eğitim verisi çok derin soyutlama düzeylerine tabidir.