Unghiul lui Anderson

Uneltele AI Elimină Machiajul pentru a Preveni Minorele să Ocolească Verificările de Vârstă

Published July 18, 2025

Updated April 26, 2026

Martin Anderson

Flux, SDXL, Photoshop Neural filters, Firefly, Krita et al.

Apariția cosmeticelor faciale permite utilizatorilor minori, în majoritate fete, să treacă neobservați verificările de vârstă bazate pe selfie pe platforme precum aplicații de dating și site-uri de comerț electronic. Uneltele noi AI adresează această lacună, utilizând un model discriminativ instruit pentru a șterge machiajul, păstrând identitatea, făcând mai dificil pentru minori să păcălească sistemele automate.

Utilizarea serviciilor terțe de verificare a vârstei bazate pe selfie este în creștere, nu în ultimul rând din cauza unui impuls global general către verificarea online a vârstei.

De exemplu, în noul regim de aplicare pe care Actul Online Safety al Regatului Unit îl impune acum, verificarea vârstei poate fi efectuată de o varietate de servicii terțe, utilizând diverse metode posibile, inclusiv verificarea vizuală a vârstei, unde AI este utilizat pentru a prezice vizual vârsta utilizatorului (de obicei din imagini cu cameră mobilă live). Serviciile care utilizează abordări de acest fel includ Ondato, TrustStamp și Yoti.

Cu toate acestea, estimarea vârstei nu este infailibilă, iar determinarea tradițională a adolescenților de a anticipa drepturile adulților înseamnă că tinerii au dezvoltat o varietate de metode eficiente pentru a intra pe site-urile de dating, forumuri și alte medii care interzic grupa lor de vârstă.

Una dintre aceste metode, utilizate în mod obișnuit de femei*, este purtarea de machiaj facial – o tactică cunoscută pentru a păcăli sistemele automate de estimare a vârstei, care, în general, suprastimează vârsta tinerilor și subestimează vârsta persoanelor mai în vârstă.

Nu Doar Fetele

Înainte de a apărea proteste la considerarea machiajului ca “focalizat pe femei”, trebuie să notăm că prezența cosmeticelor faciale pe oricine este un indicator foarte nesigur al genului:

În lucrarea ‘Impactul Cosmeticelor Faciale asupra Algoritmilor de Estimare Automată a Genului și Vârstei’ cercetătorii americani au descoperit că sistemele de verificare a genului au fost păcălite de machiajul de schimbare a genului. Sursă: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf

În 2024, 72% dintre consumatorii americani de sex masculin cu vârsta cuprinsă între 18-24 de ani au fost estimați să incorporeze machiajul în rutina lor de îngrijire, deși majoritatea utilizează produse cosmetice pentru a îmbunătăți aspectul pielii sănătoase, mai degrabă decât a se angaja în combinații de mascara/lipstick mai asociate cu estetica vizuală a femeilor.

Prin urmare, nu putem decât să abordăm materialul studiat în acest articol de-a lungul liniilor celor mai comune scenarii explorate în cercetarea nouă – acela al minorilor feminini care utilizează machiajul pentru a subverti sistemele automate de verificare vizuală a vârstei.

Îndepărtarea Efectivă a Machiajului – Modul AI

Cercetarea menționată anterior provine de la trei contribuitori de la Universitatea din New York, sub forma noului articol DiffClean: Îndepărtarea Machiajului pe Baza Difuziei pentru Estimarea Precisă a Vârstei.

Obiectivul proiectului este de a atinge o metodă condusă de AI pentru îndepărtarea aparenței machiajului din imagini (posibil inclusiv imagini video), pentru a obține o idee mai bună despre vârsta reală a persoanei din spatele machiajului.

Din noul articol, un exemplu de îndepărtare a machiajului. Sursă: https://arxiv.org/pdf/2507.13292

Din noul articol, un exemplu de cum îndepărtarea machiajului poate altera semnificativ o predicție de vârstă. Sursă: https://arxiv.org/pdf/2507.13292

Una dintre provocările dezvoltării unui astfel de sistem este sensibilitatea potențială în jurul colectării sau curățării de imagini cu minori de sex feminin purtând machiaj de adult. În cele din urmă, cercetătorii au utilizat un sistem terț bazat pe o rețea adversarială generativă numit EleGANt pentru a impune artificial stiluri de machiaj, o tehnică care s-a dovedit foarte eficientă:

Sistemul EleGANt al Universității Tsinghua din 2022 utilizează rețele generative adverse (GAN) pentru a suprapune cosmeticele în mod autentic peste fotografii sursă. Sursă: https://arxiv.org/pdf/2207.09840

Sistemul EleGANt al Universității Tsinghua din 2022 utilizează o rețea generativă adversă (GAN) pentru a suprapune cosmeticele în mod autentic peste fotografii sursă. Sursă: https://arxiv.org/pdf/2207.09840

Cu ajutorul datelor sintetice obținute în acest fel și cu ajutorul unor proiecte și seturi de date diverse, autorii au reușit să depășească metodele actuale de estimare a vârstei atunci când se confruntă cu machiajul “performant” sau “evident”.

Articolul afirmă:

‘DiffClean [șterge] urmele de machiaj utilizând un model de difuzie ghidat de text pentru a se apăra împotriva atacurilor de machiaj. [El] îmbunătățește estimarea vârstei (precizia minor/adult cu 4,8%) și verificarea feței (TMR cu 8,9% la FMR=0,01%) față de metodele concurente pe imagini simulate și reale cu machiaj.’

Să aruncăm o privire la modul în care au abordat această sarcină.

Metodă

Pentru a evita sursa de imagini reale cu minori în machiaj, autorii au utilizat EleGANt pentru a aplica machiaj sintetic pe imagini sursă din setul de date UTKFace, producând perechi înainte și după pentru antrenare.

Exemple din setul de date UTKFace. Sursă: https://susanqq.github.io/UTKFace/

DiffClean a fost apoi antrenat pentru a inversa această transformare. Deoarece algoritmii de estimare a vârstei greșesc cel mai mult atunci când se ocupă de grupuri de vârstă mai tinere, cercetătorii au găsit necesar să dezvolte un clasificator proxy de vârstă reglat pe vârstele țintă (10-19 ani). În acest scop, au utilizat arhitectura SSRNet antrenată pe UTKFace, cu o pierdere L1 ponderată.

O versiune simplificată a modelului de difuzie OpenAI din 2021 a furnizat structura de bază pentru transformare, cu autorii păstrând arhitectura de bază, dar modificând-o cu capete de atenție suplimentare la diverse rezoluții, straturi mai profunde și blocuri BigGAN pentru a îmbunătăți etapele de upsampling și downsampling.

Controlul direcțional a fost introdus utilizând CLIP prompts: în mod specific, față cu machiaj și față fără machiaj, astfel încât modelul să învețe să se deplaseze în direcția semantică dorită, permițând îndepărtarea machiajului fără a compromite detaliile faciale, indicii de vârstă sau identitatea.

Machiaj sintetic aplicat utilizând EleGANt. Fiecare triplet arată imaginea originală UTKFace (stânga), stilul de referință de machiaj (centru) și rezultatul după transferul de stil (dreapta). Transferul de machiaj de acest fel este comun în literatura de recunoaștere a imaginilor, iar această facilitate este disponibilă și în filtrele neuronale ale Adobe Photoshop, care pot impune machiaj de la o imagine de referință pe o imagine țintă.

Patru funcții de pierdere cheie au ghidat îndepărtarea machiajului fără a afecta identitatea facială sau indicii de vârstă. Pe lângă pierderea bazată pe CLIP menționată anterior, identitatea a fost păstrată utilizând o pereche ponderată de pierderi ArcFace extrase din biblioteca InsightFace – pierderi care au măsurat similaritatea dintre fața generată și atât imaginea curată originală, cât și versiunea “machiată”, asigurând că subiectul a rămas vizual consistent înainte și după îndepărtarea machiajului.

În al treilea rând, pierderea perceptuală Metrici de Similaritate Perceptuală Învățate (LPIPS) a utilizat distanța L1 pentru a impune realismul la nivel de pixel și a păstra aspectul general al imaginii originale după îndepărtarea machiajului.

În cele din urmă, vârsta a fost supravegheată utilizând un clasificator de vârstă SSRNet reglat pe setul de date UTKFace, cu modelul utilizând o pierdere L1 netedă (cu penalități mai grele pentru erorile din intervalul de vârstă 10–29 de ani, unde clasificarea greșită este cea mai frecventă). O variantă a modelului a înlocuit acest lucru cu o prompt de vârstă bazat pe CLIP, solicitând modelului să se potrivească cu aspectul unei vârste specifice.

Pentru estimarea vârstei la momentul inferenței (în contrast cu utilizarea SSRNet la momentul antrenării), a fost utilizat cadru MiVOLO din 2023.

Date și Teste

Setul de date UTKFace a fost utilizat pentru antrenarea SSRNet, cu un set de antrenare de 15.364 de imagini, împotriva unui set de test de 6.701 de imagini. Cele 20.000 de imagini originale au fost filtrate pentru a elimina orice persoană cu vârsta peste 70 de ani, și apoi împărțite în mod similar 70:30.

Conform metodei anterioare stabilite de proiectul DiffAM din 2023, antrenarea a continuat în două etape, cu prima sesiune utilizând 300 de imagini reale cu machiaj (acest lucru a fost împărțit în 200/100 pentru antrenare și validare) din setul de date MT al BeautyGAN.

Modelul a fost apoi rafinat ulterior utilizând 300 de imagini suplimentare UTKFace, augmentate cu machiaj sintetic prin intermediul EleGANt. Acest lucru a creat un set final de antrenare de 600 de exemple, împerecheate pe cinci stiluri de referință de la BeautyGAN. Deoarece îndepărtarea machiajului implică maparea multor stiluri de machiaj către o singură față curată, antrenarea s-a concentrat pe o generalizare largă, mai degrabă decât acoperirea fiecărei variații cosmetice posibile.

Performanța a fost evaluată atât pe imagini sintetice, cât și pe imagini din lumea reală. Testarea sintetică a utilizat 2.556 de imagini din setul de date Flickr-Faces-HQ (FFHQ), eșantionate uniform pe nouă grupuri de vârstă sub 70 de ani, și modificate cu EleGANt.

Generalizarea a fost evaluată utilizând 3.000 de imagini din BeautyFace și 355 din LADN, ambele conținând machiaj autentic.

Exemple din setul de date BeautyFace, exemplificând segmentarea semantică care definește diverse zone ale suprafeței feței afectate. Sursă: https://li-chongyi.github.io/BeautyREC_files/

Metrici și Implementare

Pentru metrici, autorii au utilizat Eroarea Medie Absolută (MAE) între valorile reale (imagini reale cu vârste stabilite) și valorile de vârstă estimate, unde rezultatele mai mici sunt mai bune; precizia grupului de vârstă a fost utilizată pentru a evalua dacă vârstele estimate au ajuns în grupările corecte (în acest caz, rezultatele mai mici sunt mai bune); precizia minor/adult a fost utilizată pentru a evalua identificarea corectă a persoanelor cu vârsta de peste 18 ani (în acest caz, un rezultat mai mare este mai bun).

În plus, deși nu se axează pe subiectul particular în discuție, autorii raportează și metrici de verificare a identității sub formă de Rata de Potrivire Adevărată (TMR) și Rata de Potrivire Falsă (FMR), cu raportarea suplimentară a valorilor Caracteristicii de Operare a Receptorului (ROC) asociate.

SSRNet a fost reglat pe imagini de 64x64px utilizând o dimensiune de lot de 50 sub optimizerul Adam cu o decădere a ponderii de 1e−4, precum și un programator de cosinus și o rată de învățare de 1e−3 pe parcursul a 200 de epoci, cu oprirea timpurie.

În schimb, modulul DiffClean a primit imagini de intrare de 256x256px și a fost reglat pentru cinci epoci utilizând Adam, la o rată de învățare mai puțin fină de 4e−3. Eșantionarea a utilizat 40 de pași de inversare DDIM și 6 pași DDIM înainte. Toate antrenamentele au fost efectuate pe un singur GPU NVIDIA A100 (fie cu 40GB, fie cu 80GB de VRAM, ceea ce nu a fost specificat).

Sistemele rivale testate au fost CLIP2Protect și DiffAM menționat anterior. Autorii au utilizat “stiluri de machiaj mate” în fluxul de lucru, deoarece acestea au fost notate în CLIP2Protect ca realizând o rată de succes mai mare (presupunând o cale de oportunitate pentru cei care doresc să învingă această abordare – dar acesta este un subiect pentru o altă ocazie).

Pentru a replica DiffAM ca bază de comparație, modelul preantrenat de la BeautyGAN a fost reglat pe setul de date MT. Pentru transferul de machiaj adversarial, punctul de control de la DiffAM a fost utilizat cu parametrii implicit pentru modelul țintă, imaginea de referință și identitate.

Performanța DiffClean în comparație cu metodele de bază la sarcinile de estimare a vârstei, utilizând MiVOLO. Metricile raportate sunt clasificarea minor/adult, precizia grupului de vârstă și eroarea medie absolută (MAE). DiffClean cu pierderea de vârstă CLIP obține cele mai bune rezultate în toate metricile.

Dintre aceste rezultate, autorii afirmă:

‘Metoda noastră DiffClean depășește ambele metode de bază, CLIP2Protect și DiffAM, și poate restabili cu succes indicii de vârstă perturbate din cauza machiajului, reducând MAE (la 5,71) și îmbunătățind precizia generală a grupului de vârstă (la 37%).

‘Obiectivul nostru s-a concentrat pe grupurile de vârstă minore, iar rezultatele indică faptul că atingem o clasificare superioară a vârstei minor/adult de 88,6%.’

Rezultate de îndepărtare a machiajului de la metodele de bază și propuse. Coloana din stânga arată imagini sursă, următoarea arată ieșiri de la CLIP2Protect și DiffAM. A treia coloană arată rezultate de la DiffClean prin SSRNet și pierderea de vârstă CLIP. Autorii susțin că DiffClean elimină machiajul mai eficient, evitând distorsionarea caracteristicilor observată la CLIP2Protect și cosmeticele reziduale ratate de DiffAM.

Autorii mai notează că machiajul nu are un efect uniform asupra vârstei aparente, ci poate crește, reduce sau lăsa neschimbată vârsta aparentă a unei fețe. Prin urmare, DiffClean nu aplică o “reducere în masă” a vârstei estimate, ci încearcă să recupereze indicii de vârstă originale prin îndepărtarea urmelor de machiaj:

Exemple de îndepărtare a machiajului din seturile de date CelebA-HQ și CACD. Fiecare coloană arată o pereche de imagini înainte (stânga) și după (dreapta) îndepărtarea machiajului. În prima coloană, vârsta estimată scade după îndepărtarea machiajului; în a doua, rămâne neschimbată; și în a treia, crește.

Pentru a testa cât de bine DiffClean a funcționat pe date noi, a fost rulat pe seturile de date BeautyFace și LADN, care conțin machiaj autentic, dar nu au imagini pereche cu aceleași subiecți fără cosmetice. Estimările de vârstă efectuate înainte și după îndepărtarea machiajului au fost comparate pentru a evalua cât de eficient DiffClean a redus distorsionarea introdusă de machiaj:

Rezultate de îndepărtare a machiajului pe imagini reale din seturile de date LADN (stânga) și BeautyFace (dreapta). DiffClean reduce vârstele estimate prin îndepărtarea cosmetice, reducând decalajul dintre vârsta aparentă și vârsta reală. Numerele albe arată vârstele estimate înainte și după procesare.

Rezultatele au arătat că DiffClean reduce constant decalajul dintre vârsta aparentă și vârsta reală. Pe ambele seturi de date, a redus erorile de suprastimare și subestimare cu aproximativ trei ani în medie, sugerând că sistemul se generalizează bine la stiluri cosmetice din lumea reală.

Concluzie

Este interesant și, probabil, inevitabil că machiajul cosmetic “performant” va fi utilizat într-un mod adversarial. Având în vedere că fetele se maturizează la ritmuri diferite, dar se maturizează în mod constant mai repede ca grup, sarcina de a identifica pragul dintre statutul de minor și cel de adult feminin poate fi una dintre cele mai ambițioase pe care scena de cercetare a stabilit-o vreodată.

Cu toate acestea, timpul și datele pot determina în cele din urmă semne de vârstă consistente care pot fi utilizate pentru a ancora sistemele de verificare vizuală a vârstei.

* Deoarece acest subiect invită la un limbaj încărcat, și deoarece ‘fete’ este exclusiv (iar ‘femei și fete’, termenul acceptat în prezent pentru persoane de sex feminin, nu este o descriere precisă în acest caz), am recurs la ‘feminin’ ca cea mai bună compromis pe care l-am putut concepe – deși nu cuprinde toate subtilitățile demografice, pentru care îmi cer scuze.

^† În acest articol, utilizez ‘performant’ pentru a indica machiaj care este destinat să fie văzut și recunoscut ca machiaj, cum ar fi mascara, eyeliner, blush și fond de ten, în contrast cu cremele de acoperire și alte tipuri de aplicații cosmetice ‘furișate’.

Publicat pentru prima dată vineri, 18 iulie 2025