Sudut Anderson

Alat AI Menghilangkan Rias Wajah untuk Menghentikan Bypass Periksa Usia pada Anak-Anak

Published July 18, 2025

Updated April 26, 2026

Martin Anderson

Flux, SDXL, Photoshop Neural filters, Firefly, Krita et al.

Penampilan kosmetik wajah memungkinkan pengguna di bawah umur, sebagian besar perempuan, untuk melewati periksa usia berbasis selfie pada platform seperti aplikasi kencan dan situs e-commerce. Alat AI baru ini menangani celah ini, menggunakan model diskriminatif yang dilatih untuk menghapus rias wajah sambil menjaga identitas, membuatnya lebih sulit bagi anak-anak untuk menipu sistem otomatis.

Penggunaan layanan verifikasi usia berbasis selfie pihak ketiga meningkat, tidak hanya karena dorongan global umum menuju verifikasi usia online.

Misalnya, dalam rezim penegakan baru yang sekarang diamandatkan oleh Undang-Undang Keamanan Online Inggris, verifikasi usia dapat dilakukan oleh berbagai layanan pihak ketiga layanan, menggunakan berbagai metode yang mungkin, termasuk verifikasi usia visual, di mana AI digunakan untuk memprediksi usia pengguna secara visual (biasanya dari footage kamera ponsel langsung). Layanan yang menggunakan pendekatan semacam ini termasuk Ondato, TrustStamp, dan Yoti.

Namun, estimasi usia tidaklah tak tercela, dan penentuan tradisional remaja untuk mengantisipasi hak-hak kedewasaan berarti bahwa anak-anak muda telah mengembangkan berbagai metode efektif untuk memasuki situs kencan, forum, dan lingkungan lain yang melarang kelompok usia mereka.

Salah satu metode ini, yang paling umum digunakan oleh perempuan*, adalah dengan mengenakan rias wajah – taktik diketahui menipu sistem estimasi usia otomatis, yang umumnya memperkirakan usia yang lebih tinggi untuk anak-anak muda dan memperkirakan usia yang lebih rendah untuk orang tua.

Tidak Hanya Perempuan

Sebelum protes muncul dengan mempertimbangkan rias wajah sebagai ‘fokus perempuan’, kita harus mencatat bahwa kehadiran kosmetik wajah pada siapa saja adalah indikator yang sangat tidak dapat diandalkan dari gender:

Dalam makalah ‘Dampak Kosmetik Wajah pada Algoritma Estimasi Usia dan Gender Otomatis’ peneliti AS menemukan bahwa sistem verifikasi gender terkecoh oleh rias wajah yang berpindah gender. Sumber: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf

Pada 2024, 72% dari konsumen pria AS berusia 18-24 tahun diperkirakan untuk memasukkan rias wajah ke dalam rutinitas perawatan mereka – meskipun sebagian besar menggunakan produk kosmetik untuk meningkatkan penampilan kulit sehat, bukan untuk menikmati kombinasi maskara/lipstik yang lebih terkait dengan estetika visual perempuan.

Jadi kita tidak bisa tidak memperlakukan materi yang dipelajari dalam artikel ini sepanjang garis skenario paling umum yang dijelajahi dalam penelitian baru – yaitu perempuan di bawah umur yang menggunakan rias wajah untuk mengalahkan sistem verifikasi usia visual otomatis.

Penghapusan Rias Wajah yang Efektif – Cara AI

Penelitian yang disebutkan di atas berasal dari tiga kontributor di Universitas New York, dalam bentuk makalah baru DiffClean: Penghapusan Rias Wajah Berbasis Difusi untuk Estimasi Usia Akurat.

Tujuan proyek ini adalah untuk mencapai metode yang didorong oleh AI untuk menghapus penampilan rias wajah dari gambar (potensial termasuk video), untuk mendapatkan gambaran yang lebih baik tentang usia sebenarnya dari orang di balik rias wajah.

Dari makalah baru, contoh penghapusan rias wajah. Sumber: https://arxiv.org/pdf/2507.13292

Dari makalah baru, contoh bagaimana penghapusan rias wajah dapat secara signifikan mengubah prediksi usia. Sumber: https://arxiv.org/pdf/2507.13292

Salah satu tantangan dalam mengembangkan sistem seperti ini adalah potensi sensitivitas seputar pengumpulan atau pengkurasi gambar anak-anak perempuan yang mengenakan rias wajah dewasa. Pada akhirnya, peneliti menggunakan sistem Jaringan Adversarial Generatif pihak ketiga yang disebut EleGANt untuk mengimpos rias wajah secara sintetis, teknik yang terbukti sangat efektif:

Sistem EleGANt Universitas Tsinghua 2022 menggunakan Jaringan Adversarial Generatif (GAN) untuk mengimpos kosmetik secara autentik pada foto sumber. Sumber: https://arxiv.org/pdf/2207.09840

Dengan bantuan data sintetis yang diperoleh dengan cara ini, dan dengan bantuan dari berbagai proyek dan dataset pendukung, penulis dapat melampaui metode state-of-the-art dalam estimasi usia ketika dihadapkan pada rias wajah yang jelas atau ‘terlihat’.

Makalah tersebut menyatakan:

‘DiffClean [menghapus] jejak rias wajah menggunakan model difusi yang dipandu teks untuk membela diri melawan serangan rias wajah. [Itu] meningkatkan estimasi usia (akurasi usia kecil vs dewasa sebesar 4,8%) dan verifikasi wajah (TMR sebesar 8,9% pada FMR=0,01%) atas baseline yang kompetitif pada gambar rias wajah sintetis dan nyata.’

Mari kita lihat bagaimana mereka melakukan tugas tersebut.

Metode

Untuk menghindari sumber gambar nyata dari anak-anak yang mengenakan rias wajah, penulis menggunakan EleGANt untuk mengaplikasikan kosmetik sintetis pada gambar yang diambil dari dataset UTKFace, menghasilkan pasangan sebelum dan sesudah untuk pelatihan.

Contoh dari dataset UTKFace. Sumber: https://susanqq.github.io/UTKFace/

DiffClean kemudian dilatih untuk membalikkan transformasi ini. Karena algoritma estimasi usia paling salah ketika menangani kelompok usia yang lebih muda, peneliti menemukan perlu untuk mengembangkan pengklasifikasi usia proksi fine-tuned pada usia target (10-19 tahun). Untuk ini mereka menggunakan arsitektur SSRNet yang dilatih pada UTKFace, dengan kerugian L1 yang diimbang.

Versi yang disederhanakan dari model difusi OpenAI 2021 difusi menyediakan tulang punggung untuk transformasi, dengan penulis mempertahankan arsitektur inti, tetapi memodifikasinya dengan tambahan kepala perhatian pada resolusi yang beragam, lapisan yang lebih dalam, dan blok BigGAN untuk meningkatkan tahap upsampling dan downsampling.

Kontrol arah diperkenalkan menggunakan CLIP prompt: khususnya, wajah dengan rias wajah dan wajah tanpa rias wajah, sehingga model belajar untuk bergerak dalam arah semantik yang diinginkan, memungkinkan rias wajah dihapus tanpa mengompromikan detail wajah, petunjuk usia, atau identitas.

Rias wajah sintetis diterapkan menggunakan EleGANt. Setiap triplet menampilkan gambar asli UTKFace (kiri), gaya rias wajah referensi (tengah), dan hasil setelah transfer gaya (kanan). Transfer rias wajah seperti ini umum di literatur penglihatan komputer, dan fasilitas ini juga tersedia dalam filter neural Adobe Photoshop, yang dapat mengimpos rias wajah dari gambar referensi ke gambar target.

Empat fungsi kerugian kunci fungsi kerugian memandu penghapusan rias wajah tanpa mempengaruhi identitas wajah atau petunjuk usia. Selain kerugian CLIP yang disebutkan di atas, identitas dipertahankan menggunakan pasangan berat ArcFace yang diambil dari perpustakaan InsightFace – kerugian yang mengukur kesamaan antara wajah yang dihasilkan dan gambar asli yang bersih dan ‘rias wajah’, memastikan bahwa subjek tetap konsisten secara visual sebelum dan sesudah penghapusan rias wajah.

Ketiga, kerugian perseptual Learned Perceptual Similarity Metrics (LPIPS) menggunakan jarak L1 untuk memaksakan realisme tingkat piksel, dan mempertahankan tampilan keseluruhan gambar asli setelah rias wajah dihilangkan.

Terakhir, usia diawasi menggunakan SSRNet yang diperhalus yang dilatih pada dataset UTKFace, dengan model menggunakan kerugian L1 yang dihaluskan (dengan hukuman yang lebih berat untuk kesalahan pada rentang usia 10–29 tahun, di mana kesalahan paling umum). Varian dari model ini menggantikan ini dengan prompt usia CLIP, meminta model untuk mencocokkan penampilan usia tertentu.

Untuk estimasi usia pada waktu inferensi (sebagai lawan dari penggunaan SSRNet pada waktu pelatihan), kerangka MiVOLO 2023 digunakan.

Data dan Tes

Penyetelan fine-tune SSRNet dari UTKFace menggunakan set pelatihan 15.364 gambar, melawan set tes 6.701 gambar. 20.000 gambar asli difilter untuk menghapus siapa saja yang berusia di atas 70 tahun, dan kemudian dibagi 70:30.

Sesuai dengan metode sebelumnya yang ditetapkan oleh proyek DiffAM 2023, pelatihan kemudian dilanjutkan dalam dua tahap, dengan sesi awal menggunakan 300 gambar rias wajah nyata (kali ini 200/100 split antara pelatihan dan validasi) dari dataset MT BeautyGAN.

Model kemudian diperhalus lebih lanjut menggunakan 300 gambar UTKFace tambahan, yang diperkaya dengan rias wajah sintetis melalui EleGANt. Ini menciptakan set pelatihan akhir 600 contoh, yang dipasangkan melintasi lima gaya referensi dari BeautyGAN. Karena penghapusan rias wajah melibatkan pemetaan banyak gaya rias wajah ke wajah yang bersih, pelatihan fokus pada generalisasi yang luas daripada mencakup setiap variasi kosmetik yang mungkin.

Kinerja dievaluasi pada gambar sintetis dan nyata. Pengujian sintetis menggunakan 2.556 gambar Flickr-Faces-HQ Dataset (FFHQ), yang diambil secara merata dari sembilan kelompok usia di bawah 70 tahun, dan dimodifikasi dengan EleGANt.

Generalisasi dievaluasi menggunakan 3.000 gambar dari BeautyFace dan 355 dari LADN, yang berisi rias wajah asli.

Contoh dari dataset BeautyFace, yang menggambarkan segmentasi semantik yang mendefinisikan berbagai area permukaan wajah yang terkena. Sumber: https://li-chongyi.github.io/BeautyREC_files/

Metrik dan Implementasi

Untuk metrik, penulis menggunakan Mean Absolute Error (MAE) antara kebenaran (gambar nyata dengan usia yang telah ditetapkan) dan nilai usia yang diprediksi, di mana hasil yang lebih rendah lebih baik; akurasi kelompok usia digunakan untuk menilai apakah usia yang diprediksi berakhir di kelompok yang benar (dalam hal ini, hasil yang lebih rendah lebih baik); akurasi dewasa/anak digunakan untuk mengevaluasi identifikasi yang benar dari orang dewasa (di mana hasil yang lebih tinggi lebih baik).

Selain itu, meskipun tidak terkait dengan topik khusus ini, penulis juga melaporkan metrik verifikasi identitas dalam bentuk True Match Rate (TMR) dan False Match Rate (FMR), dengan pelaporan lebih lanjut dari nilai Receiver Operating Characteristic (ROC).

SSRNet diperhalus pada gambar 64×64px menggunakan ukuran batch 50 di bawah Adam optimizer dengan kerugian pengurangan berat 1e−4, serta jadwal pengurangan cosine, dan tingkat pembelajaran 1e−3 selama 200 epoch, dengan penghentian awal.

Sebaliknya, modul DiffClean menerima gambar input 256×256px, dan diperhalus selama lima epoch menggunakan Adam, pada tingkat pembelajaran yang lebih kasar 4e−3. Pengambilan sampel menggunakan 40 langkah inversi DDIM, dan 6 langkah DDIM maju. Semua pelatihan dilakukan pada satu GPU NVIDIA A100 (apakah dengan 40GB atau 80GB VRAM tidak disebutkan).

Sistem saingan yang diuji adalah CLIP2Protect dan DiffAM yang disebutkan sebelumnya. Penulis menggunakan gaya rias wajah ‘matte’ dalam alur kerja, karena telah dicatat dalam CLIP2Protect bahwa mencapai tingkat keberhasilan yang lebih tinggi (meskipun memungkinkan jalan untuk mengalahkan pendekatan ini – tetapi itu adalah masalah untuk lain waktu).

Untuk mereplikasi DiffAM sebagai baseline, model pra-dilatih dari BeautyGAN diperhalus pada dataset MT. Untuk transfer rias wajah adversarial, checkpoint dari DiffAM digunakan dengan parameter default untuk model target, gambar referensi, dan identitas.

Kinerja DiffClean dibandingkan dengan baseline pada tugas estimasi usia, menggunakan MiVOLO. Metrik yang dilaporkan adalah akurasi klasifikasi dewasa/anak, akurasi kelompok usia, dan mean absolute error (MAE). DiffClean dengan kerugian usia CLIP mencapai hasil terbaik di semua metrik.

Dari hasil ini, penulis menyatakan:

‘Metode kami DIFFCLEAN outperforms kedua baseline, CLIP2Protect dan DiffAM, dan dapat berhasil memulihkan petunjuk usia yang terganggu karena rias wajah dengan menurunkan MAE (ke 5,71) dan meningkatkan akurasi prediksi kelompok usia secara keseluruhan (ke 37%).

‘Tujuan kami fokus pada kelompok usia kecil, dan hasil menunjukkan bahwa kami mencapai klasifikasi usia kecil vs dewasa yang unggul sebesar 88,6%.’

Hasil penghapusan rias wajah dari metode baseline dan yang diusulkan. Kolom kiri menampilkan gambar sumber, kolom berikutnya menampilkan output dari CLIP2Protect dan DiffAM. Kolom ketiga menampilkan hasil dari DiffClean melalui SSRNet dan kerugian usia CLIP. Penulis berpendapat bahwa DiffClean menghapus rias wajah lebih efektif, menghindari distorsi fitur yang terlihat pada CLIP2Protect, dan rias wajah residu yang diabaikan oleh DiffAM.

Penulis lebih lanjut menyatakan bahwa rias wajah tidak memiliki efek seragam pada usia yang terlihat, tetapi dapat meningkatkan, menurunkan, atau tidak mengubah usia yang terlihat dari wajah. Oleh karena itu DiffClean tidak menerapkan ‘pengurangan bantal’ pada usia yang diprediksi, tetapi sebaliknya berusaha untuk memulihkan petunjuk usia asli dengan menghapus jejak rias wajah:

Contoh penghapusan rias wajah dari dataset CelebA-HQ dan CACD. Setiap kolom menampilkan pasangan gambar sebelum (kiri) dan sesudah (kanan) penghapusan rias wajah. Pada kolom pertama, usia yang diprediksi menurun setelah rias wajah dihapus; pada kolom kedua, usia yang diprediksi tidak berubah; dan pada kolom ketiga, usia yang diprediksi meningkat.

Untuk menguji seberapa baik DiffClean berkinerja pada data baru, dijalankan pada dataset BeautyFace dan LADN, yang berisi rias wajah asli, tetapi tidak ada gambar pasangan dari subjek yang sama tanpa kosmetik. Prediksi usia yang dibuat sebelum dan sesudah penghapusan rias wajah dibandingkan, untuk menilai seberapa efektif DiffClean mengurangi distorsi yang diperkenalkan oleh rias wajah:

Hasil penghapusan rias wajah pada gambar nyata dari dataset LADN (kiri) dan BeautyFace (kanan). DiffClean mengurangi usia yang diprediksi dengan menghapus rias wajah, menyempitkan kesenjangan antara usia yang terlihat dan usia sebenarnya. Angka putih menampilkan usia yang diprediksi sebelum dan sesudah pemrosesan.

Hasil menunjukkan bahwa DiffClean secara konsisten menyempitkan kesenjangan antara usia yang terlihat dan usia sebenarnya. Di seluruh dataset, DiffClean menurunkan kesalahan overestimasi dan underestimasi sekitar tiga tahun rata-rata, menunjukkan bahwa sistem ini umumnya berlaku untuk gaya kosmetik nyata.

Kesimpulan

Menarik, dan mungkin tak terhindarkan, bahwa rias wajah yang tampil akan digunakan dengan cara yang adversarial. Mengingat bahwa perempuan matang pada tingkat yang berbeda, tetapi konsisten matang lebih cepat sebagai kelompok, tugas mengidentifikasi titik balik antara status kecil dan dewasa perempuan mungkin salah satu yang paling ambisius yang telah ditetapkan oleh adegan penelitian.

Namun, waktu dan data mungkin pada akhirnya menentukan tanda-tanda usia yang konsisten yang dapat digunakan untuk mengaitkan sistem verifikasi usia visual.

* Karena subjek ini mengundang bahasa yang bermuatan, dan karena ‘perempuan’ adalah istilah yang eksklusif (sedangkan ‘perempuan dan anak perempuan’, istilah yang saat ini diterima untuk orang-orang berjenis kelamin perempuan, tidak merupakan deskripsi yang akurat dalam kasus ini), saya telah menggunakan ‘perempuan’ sebagai kompromi terbaik yang bisa saya buat – meskipun tidak menangkap semua nuansa demografi, untuk itu saya meminta maaf.

^† Dalam artikel ini saya menggunakan ‘tampil’ untuk menunjukkan rias wajah yang dimaksudkan untuk dilihat dan diakui sebagai rias wajah, seperti maskara, eyeliner, blusher, dan fondasi, sebagai lawan dari krim penyamaran dan jenis aplikasi kosmetik ‘samar’ lainnya.

Dipublikasikan pertama kali pada hari Jumat, 18 Juli 2025