Conectează-te cu noi

Instrumentul de inteligență artificială îndepărtează machiajul pentru a împiedica minorii să ocolească verificările de vârstă

Unghiul lui Anderson

Instrumentul de inteligență artificială îndepărtează machiajul pentru a împiedica minorii să ocolească verificările de vârstă

mm
Flux, SDXL, filtre neuronale Photoshop, Firefly, Krita și colab.

Apariția cosmeticelor faciale permite utilizatorilor minori, în mare parte fetelor, să treacă de verificările de vârstă bazate pe selfie-uri pe platforme precum aplicațiile de dating și site-urile de comerț electronic. Un nou instrument de inteligență artificială abordează această lacună, folosind un model discriminatoriu antrenat să șteargă machiajul, păstrând în același timp identitatea, ceea ce face mai dificilă păcălirea sistemelor automate de către minori.

 

Utilizarea serviciilor terțe de verificare a vârstei bazate pe selfie-uri este în creștere, nu în ultimul rând din cauza unui... impuls global general către verificarea online pe bază de vârstă.

De exemplu, în noul regim de aplicare a Legii privind siguranța online din Regatul Unit, care este acum mandate, verificarea vârstei poate fi efectuată de o varietate de terțe părți Servicii, folosind diverse metode posibile, inclusiv verificarea vizuală a vârstei, unde inteligența artificială este utilizată pentru a prezice vizual vârsta utilizatorului (de obicei, din imagini live de pe camerele mobile). Serviciile care utilizează abordări de acest tip includ Ondato, TrustStamp și yoti.

Totuși, estimarea vârstei nu este infailibilă, iar determinarea tradițională a adolescenților de a anticipa drepturile maturității înseamnă că tinerii au dezvoltat o varietate de metode eficiente să acceseze site-uri de dating, forumuri și alte medii care le interzic grupa de vârstă.

Una dintre aceste metode, cea mai frecvent utilizată de femei*, este machiajul facial – o tactică cunoscut pentru păcălirea sisteme automate de estimare a vârstei, care, în general, supraestimează vârsta tinerilor și subestimează vârsta a persoanelor în vârstă.

Nu doar fetele

Înainte de a apărea proteste față de considerarea machiajului ca fiind „orientat spre femei”, trebuie să observăm că prezența cosmeticelor faciale pe oricine este indicator foarte nesigur de gen:

În lucrarea „Impactul cosmeticelor faciale asupra algoritmilor de estimare automată a sexului și vârstei”, cercetătorii americani au descoperit că sistemele de verificare a sexului au fost compromise de machiajul care folosește metoda schimbării de sex. Sursa: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf

În lucrarea „Impactul cosmeticelor faciale asupra algoritmilor automați de estimare a sexului și vârstei”, cercetătorii americani au descoperit că sistemele de verificare a sexului au fost compromise de machiajul care utilizează schimb de sex. Sursă: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf

În 2024, 72% dintre consumatorii de sex masculin din SUA cu vârsta cuprinsă între 18 și 24 de ani erau estimativ să includă machiajul în rutina lor de îngrijire – deși majoritatea folosesc produse cosmetice pentru a îmbunătăți aspectul pielii sănătoase, în loc să se delecteze cu genul de machiaj performativ combinații de rimel/ruj mai asociate cu estetica vizuală a femeilor.

Așadar, nu putem să nu tratăm materialul studiat în acest articol în conformitate cu cel mai comun scenariu explorat în noile cercetări – acela al minorelor care folosesc machiaj pentru a submina sistemele automate de verificare vizuală a vârstei.

Demachiere eficientă – Metoda inteligenței artificiale

Cercetarea menționată mai sus provine de la trei colaboratori de la Universitatea din New York, sub forma hârtie nouă DiffClean: Îndepărtare a machiajului prin difuzie pentru o estimare precisă a vârstei.

Obiectivul proiectului este de a realiza o metodă bazată pe inteligență artificială pentru eliminarea aspectului de machiaj din imagini (inclusiv, eventual, imagini video), pentru a obține o idee mai bună despre vârsta reală a persoanei din spatele machiajului.

Din noua lucrare, un exemplu de îndepărtare a machiajului. Sursa: https://arxiv.org/pdf/2507.13292

Din noua lucrare, un exemplu despre cum îndepărtarea machiajului poate modifica semnificativ o predicție de vârstă. Sursa: https://arxiv.org/pdf/2507.13292

Una dintre provocările dezvoltării unui astfel de sistem este potențiala sensibilitate legată de colectarea sau selecționarea imaginilor cu fete minore care poartă machiaj pentru adulți. În cele din urmă, cercetătorii au folosit un sistem terț bazat pe o rețea generativă adversă, numit Elegant să impună artificial stiluri de machiaj, o tehnică care s-a dovedit foarte eficientă:

Sistemul EleGANt din 2022 al Universității Tsinghua folosește rețele generative adverse (GAN) pentru a suprapune în mod autentic elemente cosmetice peste fotografiile sursă. Sursa: https://arxiv.org/pdf/2207.09840

Sistemul EleGANt din 2022 al Universității Tsinghua folosește o rețea generativă adversă (GAN) pentru a suprapune în mod autentic elemente cosmetice peste fotografiile sursă. Sursa: https://arxiv.org/pdf/2207.09840

Cu ajutorul datelor sintetice obținute în acest mod și cu ajutorul unei game diverse de proiecte și seturi de date auxiliare, autorii au reușit să depășească metodele de ultimă generație în estimarea vârstei atunci când s-au confruntat cu machiaj performativ sau „evident”.

Lucrarea afirmă:

„DiffClean [șterge] urmele de machiaj folosind un model de difuzie ghidată prin text pentru a se apăra împotriva atacurilor legate de machiaj. [Acesta] îmbunătățește estimarea vârstei (precizie pentru minori vs. adulți cu 4.8%) și verificarea feței (TMR cu 8.9% la FMR = 0.01%) față de valorile de referință concurente pe imagini de machiaj simulate digital și reale.”

Să aruncăm o privire la cum au procedat cu sarcina.

Metodă

Pentru a evita obținerea de imagini reale cu minore machiate, autorii au folosit EleGANt pentru a aplica produse cosmetice sintetice pe imagini provenite de la UTKFace set de date, producând perechi înainte-și-după pentru antrenament.

Exemple din setul de date UTKFace. Sursa: https://susanqq.github.io/UTKFace/

Exemple din setul de date UTKFace. Sursă: https://susanqq.github.io/UTKFace/

DiffClean a fost apoi antrenat să inverseze această transformare. Întrucât algoritmii de estimare a vârstei greșesc cel mai mult atunci când se ocupă de grupe de vârstă mai tinere, cercetătorii au considerat necesar să dezvolte un clasificator de vârstă proxy. fin reglate pe vârstele țintă (10-19 ani). În acest scop, au folosit SSRNet arhitectură antrenată pe UTKFace, cu o ponderare Pierderea L1.

O versiune simplificată a OpenAI din 2021 model de difuzie a oferit coloana vertebrală a transformării, autorii păstrând arhitectura de bază, dar modificând-o cu elemente suplimentare capetele de atenție la rezoluții diverse, straturi mai profunde și BigGANblocuri de stil - pentru a îmbunătăți etapele de upsampling și downsampling.

Controlul direcțional a fost introdus folosind CLIP solicitări: în mod specific, față cu machiaj și față fără machiaj, astfel încât modelul a învățat să se miște în direcția semantică dorită, permițând îndepărtarea machiajului fără a compromite detaliile faciale, indiciile de vârstă sau identitatea.

Machiaj sintetic aplicat folosind EleGANt. Fiecare triplet prezintă imaginea originală UTKFace (stânga), stilul de machiaj de referință (centru) și rezultatul după transferul stilului (dreapta).

Machiaj sintetic aplicat folosind EleGANt. Fiecare triplet prezintă imaginea UTKFace originală (stânga), stilul de machiaj de referință (centru) și rezultatul după transferul stilului (dreapta). Transferul de machiaj de acest tip este răspândit în literatura de specialitate privind viziunea computerizată, iar această facilitate este disponibilă și în filtrele neuronale ale Adobe Photoshop, care pot impune în mod similar machiajul dintr-o imagine de referință pe o imagine țintă.

Patru chei funcții de pierdere îndepărtarea machiajului ghidată fără a afecta identitatea facială sau indiciile de vârstă. Pe lângă pierderea bazată pe CLIP menționată mai sus, identitatea a fost păstrată folosind o pereche ponderată de ArcFace pierderi obținute din InsightFace bibliotecă – pierderi care măsurau similaritatea dintre fața generată și atât imaginea originală curată, cât și versiunea „machiată”, asigurându-se că subiectul a rămas consistent vizual înainte și după îndepărtarea machiajului.

În al treilea rând, pierderea percepției Metricurile de similitudine perceptivă învățate (LPIPS) a folosit distanța L1 pentru a impune realismul la nivel de pixel și a păstra aspectul general al imaginii originale după îndepărtarea machiajului.

În cele din urmă, vârsta a fost supravegheată folosind un SSRNet reglat fin, antrenat pe setul de date UTKFace, modelul utilizând o pierdere L1 netezită (cu penalități mai mari pentru erorile din intervalul de vârstă 10-29 de ani, unde clasificarea greșită este cea mai frecventă). O variantă a modelului a înlocuit aceasta cu un prompt de vârstă bazat pe CLIP, determinând modelul să se potrivească cu aspectul unei anumite vârste.

Pentru estimarea vârstei la momentul inferenței (spre deosebire de utilizarea SSRNet la momentul antrenamentului), modelul din 2023 MiVOLO a fost utilizat cadru.

Date și teste

Ajustarea fină a UTKFace de către SSRNet a folosit un set de antrenament de 15,364 de imagini, față de un set de testare din 6,701 de imagini. Cele 20,000 de imagini originale au fost filtrate pentru a elimina pe oricine avea vârsta peste 70 de ani și apoi, de asemenea, împărțite 70:30.

În conformitate cu metoda anterioară stabilită de Regulamentul din 2023 DiffAM proiect, instruirea a continuat apoi în două etape, sesiunea inițială utilizând 300 de imagini de machiaj din lumea reală (de data aceasta o împărțire 200/100 între instruire și validare) de la BeautyGAN Set de date MT.

Modelul a fost apoi rafinat folosind 300 de imagini UTKFace suplimentare, completate cu machiaj sintetic prin intermediul EleGANt. Aceasta a creat un set final de antrenament de 600 de exemple, asociate cu cinci stiluri de referință de la BeautyGAN. Deoarece îndepărtarea machiajului implică maparea mai multor stiluri de machiaj pe o singură față curată, antrenamentul s-a concentrat pe aspecte generale. generalizare în loc să acopere fiecare variație cosmetică posibilă.

Performanța a fost evaluată atât pe imagini sintetice, cât și pe imagini din lumea reală. Testarea sintetică a folosit 2,556 Flickr-Faces-HQ Imagini din setul de date (FFHQ), eșantionate uniform pe nouă grupe de vârstă sub 70 de ani și modificate cu EleGANt.

Generalizarea a fost evaluată folosind 3,000 de imagini din FrumusețeFață și 355 din LADN, ambele conținând machiaj autentic.

Exemple din setul de date BeautyFace, care exemplifică segmentarea semantică ce definește diverse zone ale suprafeței faciale afectate. Sursa: https://li-chongyi.github.io/BeautyREC_files/

Exemple din setul de date BeautyFace, care exemplifică segmentarea semantică ce definește diverse zone ale suprafeței faciale afectate. Sursă: https://li-chongyi.github.io/BeautyREC_files/

Metrici și implementare

Pentru metrici, autorii au folosit Eroare absolută medie (MAE) între datele reale (imagini reale cu vârste factuale stabilite) și valorile vârstei prezise, unde rezultatele mai mici sunt mai bune; precizia grupelor de vârstă a fost utilizată pentru a evalua dacă vârstele prezise s-au încadrat în grupările corecte (caz în care rezultatele mai mici sunt mai bune); acuratețea minorilor/adulților a fost utilizată pentru a evalua identificarea corectă a persoanelor de peste 18 ani (un rezultat mai mare este mai bun).

În plus, deși nu se concentrează pe subiectul specific în cauză, autorii raportează și indicatori de verificare a identității sub forma ratei de potrivire reală (TMR) și a ratei de potrivire falsă (FMR), cu raportarea suplimentară a unor aspecte conexe. Caracteristică de funcționare a receptorului valorile (ROC).

SSRNet a fost ajustat fin pe imagini de 64×64px folosind un dimensiunea lotului din 50 sub Adam optimizator cu un scădere în greutate de 1e−4, precum și o planificator de recoacere cosinusalăși o rată de învățare de 1e−3 peste 200 epoci, Cu oprire devreme.

Prin contrast, modulul DiffClean a primit imagini de intrare de 256×256px și a fost ajustat fin pentru cinci epoci folosind Adam, la o rată de învățare mai grosieră de 4e−3. Eșantionarea a folosit 40 inversare DDIM pași și 6 pași DDIM înainte. Toată antrenamentul a fost efectuat pe o singură placă grafică NVIDIA A100 (nu a fost specificat dacă are 40 GB sau 80 GB de VRAM).

Sistemele rivale testate au fost CLIP2Protect și DiffAM menționat anterior. Autorii au folosit stiluri de machiaj „mat” în fluxul de lucru, deoarece acest lucru a fost observat în CLIP2Protect ca atingând o rată de succes mai mare (probabil permițând o cale de oportunitate pentru cei care doresc să învingă această abordare - dar aceasta este o chestiune pentru altă dată).

Pentru a replica DiffAM ca bază, modelul pre-antrenat din BeautyGAN a fost ajustat fin pe setul de date MT. Pentru transferul de machiaj advers, punctul de control din DiffAM a fost utilizat cu parametrii impliciți pentru modelul țintă, imaginea de referință și identitate.

Performanța DiffClean în comparație cu valorile de referință în sarcinile de estimare a vârstei, utilizând MiVOLO. Metricile raportate sunt precizia clasificării minorilor/adulților, precizia grupei de vârstă și eroarea absolută medie (MAE). DiffClean cu CLIP pentru pierderea de vârstă obține cele mai bune rezultate pentru toți parametrii.

Performanța DiffClean în comparație cu valorile de referință în sarcinile de estimare a vârstei, utilizând MiVOLO. Metricile raportate sunt precizia clasificării minorilor/adulților, precizia grupei de vârstă și eroarea absolută medie (MAE). DiffClean cu CLIP pentru pierderea de vârstă obține cele mai bune rezultate pentru toți parametrii.

Dintre aceste rezultate, autorii afirmă:

„Metoda [noastră] DIFFCLEAN depășește ambele valori de referință, CLIP2Protect și DiffAM, și poate restabili cu succes indiciile de vârstă perturbate din cauza machiajului prin scăderea MAE (la 5.71) și îmbunătățirea preciziei generale a predicției pe grupe de vârstă (la 37%).”

„Obiectivul nostru s-a concentrat pe grupele de vârstă minore, iar rezultatele indică faptul că am obținut o clasificare superioară a minorilor față de adulți, de 88.6%.”

Rezultate privind îndepărtarea machiajului din metoda inițială și metodele propuse. Coloana din stânga prezintă imaginile sursă, următoarele rezultate de la CLIP2Protect și DiffAM. A treia coloană prezintă rezultatele obținute prin DiffClean prin SSRNet și pierderea de vârstă bazată pe CLIP. Autorii susțin că DiffClean îndepărtează machiajul mai eficient, evitând distorsiunea caracteristicilor observată în CLIP2Protect și cosmeticele reziduale omise de DiffAM.

Rezultate privind îndepărtarea machiajului din metoda inițială și metodele propuse. Coloana din stânga prezintă imaginile sursă, următoarele rezultate de la CLIP2Protect și DiffAM. A treia coloană prezintă rezultatele obținute prin DiffClean prin SSRNet și pierderea de vârstă bazată pe CLIP. Autorii susțin că DiffClean îndepărtează machiajul mai eficient, evitând distorsiunea caracteristicilor observată în CLIP2Protect și cosmeticele reziduale omise de DiffAM.

Autorii notează în plus că machiajul nu are un efect uniform asupra vârstei percepute, ci mai degrabă poate crește, reduce sau lăsa neschimbată vârsta aparentă a unei fețe. Prin urmare, DiffClean nu aplică o „reducere generală” a vârstei prezise, ​​ci încearcă să recupereze indicatorii de vârstă originali prin eliminarea urmelor cosmetice:

Exemple de îndepărtare a machiajului din seturile de date CelebA-HQ și CACD. Fiecare coloană prezintă o pereche de imagini înainte (stânga) și după (dreapta) îndepărtarea machiajului. În prima coloană, vârsta prezisă scade după îndepărtarea machiajului; în a doua, rămâne neschimbată; iar în a treia, crește.

Exemple de îndepărtare a machiajului din seturile de date CelebA-HQ și CACD. Fiecare coloană prezintă o pereche de imagini înainte (stânga) și după (dreapta) îndepărtarea machiajului. În prima coloană, vârsta prezisă scade după îndepărtarea machiajului; în a doua, rămâne neschimbată; iar în a treia, crește.

Pentru a testa performanța DiffClean pe date noi, acesta a fost rulat pe seturile de date BeautyFace și LADN, care conțin machiaj autentic, dar nu și imagini pereche ale acelorași subiecți fără cosmetice. Predicțiile de vârstă făcute înainte și după îndepărtarea machiajului au fost comparate, pentru a evalua cât de eficient a redus DiffClean distorsiunea introdusă de machiaj:

Rezultatele îndepărtării machiajului pe imagini din lumea reală din seturile de date LADN (perechea din stânga) și BeautyFace (perechea din dreapta). DiffClean reduce vârstele prezise prin eliminarea cosmeticelor, reducând decalajul dintre vârsta aparentă și cea reală. Numerele albe arată vârstele estimate înainte și după procesare.

Rezultatele îndepărtării machiajului pe imagini din lumea reală din seturile de date LADN (perechea din stânga) și BeautyFace (perechea din dreapta). DiffClean reduce vârstele prezise prin eliminarea cosmeticelor, reducând decalajul dintre vârsta aparentă și cea reală. Numerele albe arată vârstele estimate înainte și după procesare.

Rezultatele au arătat că DiffClean a redus constant decalajul dintre vârsta aparentă și cea reală. În ambele seturi de date, a redus erorile de supraestimare și subestimare cu aproximativ trei ani în medie, ceea ce sugerează că sistemul se generalizează bine la stilurile cosmetice din lumea reală.

Concluzie

Este interesant și poate inevitabil ca machiajul cosmetic performativ să fie folosit într-un mod contradictoriu. Având în vedere că fetele se maturizează în ritmuri diferite, dar se maturizează constant mai repede Ca grup, sarcina de a identifica cuantul dintre statutul de femeie minoră și cel de femeie adultă ar putea fi una dintre cele mai ambițioase pe care și-a propus-o până acum scena cercetării.

Cu toate acestea, timpul și datele pot determina în cele din urmă semne consecvente legate de vârstă, care pot fi utilizate pentru a ancora sistemele vizuale de verificare a vârstei.

 

* Întrucât acest subiect invită la un limbaj încărcat și întrucât „fete” este exclusivist (în timp ce „femei și fete”, termenul acceptat în prezent pentru persoanele de sex feminin, nu este o descriere corectă în acest caz), am ales implicit „femei” ca fiind cel mai bun compromis pe care l-am putut concepe – deși nu surprinde toate subtilitățile demografice, pentru care îmi cer scuze.

În acest articol, folosesc termenul „performativ” pentru a indica machiajul destinat a fi văzut și recunoscut ca machiaj, cum ar fi rimelul, tușul de ochi, blush-ul și fondul de ten, spre deosebire de cremele ascunse și alte tipuri de aplicații cosmetice „surreptice”.

Publicat pentru prima dată vineri, 18 iulie 2025