Andersonův úhel
Nástroj AI odstraňuje make-up, aby zastavil nezletilé osoby při obcházení kontrol věku

Vzhled kosmetiky na obličeji umožňuje nezletilým uživatelům, většinou dívkám, obejít selfie-založené kontroly věku na platformách, jako jsou datovací aplikace a e-commerce weby. Nový nástroj AI řeší tuto mezery, pomocí diskriminativního modelu, který byl vyškoleno na odstranění make-upu, zatímco zachovává identitu, což činí obtížnější pro nezletilé osoby oklamat automatizované systémy.
Používání třetích stran, selfie-založených služeb ověření věku je na vzestupu, nejméně kvůli obecnému globálnímu impulsu směrem k online ověření věku.
Například v novém režimu vynucování, který nyní nařizuje Online Safety Act ve Spojeném království, ověření věku může být provedeno různými třetími stranami službami, které používají různé možné metody, včetně vizuálního ověření věku, kde se používá AI k vizuálnímu předpovídání věku uživatele (obvykle z živého mobilního kamerového záznamu). Služby, které používají přístupy tohoto typu, zahrnují Ondato, TrustStamp a Yoti.
Nicméně, odhad věku není neomylný, a tradiční určení teenagerů, aby předjímali práva dospělosti, znamená, že mladí lidé vyvinuli různé efektivní metody k vstupu na datovací stránky, fóra a další prostředí, která zakazují jejich věkovou skupinu.
Jedna z těchto metod, nejčastěji používaná ženami*, je nošení kosmetiky na obličeji – taktika známá jako oklamání automatizovaných systémů odhadu věku, které obecně přepínají věk mladých lidí a podceňují věk starších lidí.
Nejen dívky
Předtím, než vznikne protest proti považování make-upu za “žensky zaměřený”, musíme poznamenat, že přítomnost kosmetiky na komukoli je velmi nespolehlivým ukazatelem pohlaví:

V článku ‘Impact of Facial Cosmetics on Automatic Gender and Age Estimation Algorithms’ zjistili výzkumníci z USA, že systémy ověření pohlaví byly oklamané make-upem, který mění pohlaví. Zdroj: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf
V roce 2024 bylo odhadnuto, že 72 % mužských spotřebitelů ve Spojených státech ve věku 18-24 let začlenilo make-up do své každodenní péče o pleť – ačkoli většina z nich používá kosmetické produkty k vylepšení vzhledu zdravé pleti, spíše než k užívání make-upu jako součásti jejich vizuální estetiky.
Takže nemůžeme než zacházet s materiálem studovaným v tomto článku podle nejčastějšího scénáře prozkoumaného v novém výzkumu – scénáře, ve kterém mladiství ženy používají make-up k obcházení automatizovaných vizuálních systémů ověření věku.
Účinné odstranění make-upu – Cesta AI
Výzkum zmíněný výše pochází od tří přispěvatelů z New York University, ve formě nové práce DiffClean: Diffusion-based Makeup Removal for Accurate Age Estimation.
Cílem projektu je dosáhnout AI poháněné metody odstranění vzhledu make-upu z obrazů (potenciálně včetně video obrazů), aby se získal lepší přehled o skutečném věku osoby za make-upem.

Z nové práce, příklad toho, jak odstranění make-upu může výrazně změnit předpověď věku. Zdroj: https://arxiv.org/pdf/2507.13292
Jednou z výzev při vývoji takového systému je potenciální citlivost kolem shromažďování nebo kurátorské činnosti obrazů nezletilých dívek s make-upem. Nakonec výzkumníci použili třetí stranu Generative Adversarial Network-based systém nazvaný EleGANt k umělému nasazení stylů make-upu, což se ukázalo jako velmi efektivní:

Systém EleGANt z Tsinghua University z roku 2022 používá Generative Adversarial Network (GAN) k superimpozici kosmetiky autenticky na zdroj fotografií. Zdroj: https://arxiv.org/pdf/2207.09840
S pomocí syntetických dat získaných tímto způsobem a s pomocí různých pomocných projektů a dat, autoři byli schopni překonat stávající metody v odhadu věku, když se setkali s make-upem.
Práce uvádí:
‘DiffClean [odstraňuje] stopy make-upu pomocí textem řízeného difuzního modelu, aby se bránilo proti útokům make-upu. [To] zlepšuje odhad věku (přesnost minor vs. dospělý o 4,8 %) a ověření obličeje (TMR o 8,9 % při FMR=0,01%) oproti srovnávacím metodám na digitálně simulovaných a skutečných obrazech make-upu.’
Podívejme se, jak se o to pokusili.
Metoda
Abyste se vyhnuli získávání skutečných obrazů nezletilých s make-upem, autoři použili EleGANt k aplikaci syntetické kosmetiky na obrázky ze UTKFace dat, což vytvořilo před a po párech pro školení.

Příklady z UTKFace dat. Zdroj: https://susanqq.github.io/UTKFace/
DiffClean byl poté vyškoleno, aby tuto transformaci zrušil. Protože algoritmy odhadu věku nejvíce selhávají při zpracování mladších věkových skupin, výzkumníci zjistili, že je nutné vyvinout proxy třídu věku jemně naladěnou na cílové věkové skupiny (10-19 let). K tomuto účelu použili architekturu SSRNet vyškoleno na UTKFace, s váženou L1 ztrátou.
Zjednodušená verze modelu z roku 2021 difuzního modelu poskytl základ pro transformaci, s autory, kteří zachovali základní architekturu, ale modifikovali ji s dalšími hlavičkami pozornosti na různých rozlišeních, hlubšími vrstvami a BigGAN-style bloky ke zlepšení fází upsamplingu a downsamplingu.
Směrová kontrola byla zavedena pomocí CLIP promptů: konkrétně, obličej s make-upem a obličej bez make-upu, aby se model naučil pohybovat se ve směru požadované sémantiky, což umožnilo odstranit make-up bez ohrožení detailů obličeje, věkových znaků nebo identity.

Syntetický make-up aplikovaný pomocí EleGANt. Každá trojice ukazuje původní UTKFace obraz (vlevo), referenční styl make-upu (uprostřed) a výsledek po přenosu stylu (vpravo). Přenos make-upu tohoto typu je častý v počítačovém vidění literatuře, a tato možnost je také k dispozici v neuronálních filtrech Adobe Photoshop, které mohou podobně aplikovat make-up z referenčního obrazu na cílový obraz.
Čtyři klíčové funkce ztrát řídily odstranění make-upu bez ovlivnění identity obličeje nebo věkových znaků. Kromě výše uvedené CLIP-založené ztráty byla identita zachována pomocí vážené dvojice ArcFace ztrát z InsightFace knihovny – ztrát, které měřily podobnost mezi generovaným obličejem a původním čistým obrazem a “make-up” verzí, což zajistilo, že předmět zůstal vizuálně konzistentní před a po odstranění make-upu.
Třetí, percepční ztráta Naučené percepční podobnostní metriky (LPIPS) používala L1 vzdálenost k vynucení pixelové reality a zachování celkového vzhledu původního obrazu po odstranění make-upu.
Nakonec, věk byl sledován pomocí jemně naladěného SSRNet vyškoleno na UTKFace dat, s modelem, který používal vyhlazenou L1 ztrátu (s těžšími tresty za chyby ve věku 10–29 let, kde je nejčastější chyba).
Pro odhad věku v době inference (na rozdíl od použití SSRNet během školení) se použila MiVOLO framework.
Data a testy
Školení SSRNet na UTKFace dat použilo trénovací sadu 15 364 obrazů, proti testovací sadě 6 701 obrazů. Původních 20 000 obrazů bylo filtrováno, aby se odstranily osoby starší 70 let, a poté stejně rozděleno 70:30.
V souladu s předchozí metodou stanovenou projektem DiffAM z roku 2023, školení poté probíhalo ve dvou fázích, s počáteční relací, která používala 300 skutečných obrazů make-upu (tentokrát 200/100 rozdělení mezi školení a validaci) z BeautyGAN MT dat.
Model byl poté upraven pomocí 300 dalších UTKFace obrazů, rozšířených o syntetický make-up pomocí EleGANt. Tímto se vytvořila konečná trénovací sada 600 příkladů, párových přes pět referenčních stylů z BeautyGAN. Protože odstranění make-upu zahrnuje mapování mnoha stylů make-upu na jeden čistý obličej, školení se zaměřilo na širokou generalizaci spíše než na pokrytí každé možné kosmetické variace.
Výkon byl hodnocen na syntetických a skutečných obrazech. Syntetické testování používalo 2 556 Flickr-Faces-HQ Dataset (FFHQ) obrazů, rovnoměrně vzorkovaných napříč devíti věkovými skupinami pod 70, a upravených pomocí EleGANt.
Generalizace byla hodnocena pomocí 3 000 obrazů z BeautyFace a 355 z LADN, které obsahují autentický make-up.

Příklady z BeautyFace dat, ukazující semantickou segmentaci, která definuje různé oblasti ovlivněné plochy obličeje. Zdroj: https://li-chongyi.github.io/BeautyREC_files/
Metriky a implementace
Pro metriky autoři použili Průměrnou absolutní chybu (MAE) mezi skutečnými hodnotami (skutečné obrazy s faktickými věky) a předpovězenými věkovými hodnotami, kde nižší výsledky jsou lepší; přesnost věkové skupiny se používala k hodnocení, zda předpovězené věky skončily ve správných skupinách (v tomto případě jsou nižší výsledky lepší); přesnost minor/dospělých se používala k hodnocení správné identifikace osob starších 18 let (v tomto případě je vyšší výsledek lepší).
Kromě toho, i když se nezaměřuje na konkrétní téma, autoři také uvádějí metriky ověření identity ve formě True Match Rate (TMR) a False Match Rate (FMR), s dalšími zprávami o souvisejících Receiver Operating Characteristic (ROC) hodnot.
SSRNet byl jemně nalazen na 64×64px obrazech pomocí velikosti dávky 50 pod Adam optimalizátor s váhovým útlumem 1e−4, stejně jako cosine annealing scheduler, a learning rate 1e−3 po dobu 200 epoch, s časným zastavením.
Na rozdíl od toho, modul DiffClean obdržel 256×256px vstupní obrazy a byl jemně nalazen po dobu pěti epoch pomocí Adam, při hrubším learning rate 4e−3. Vzorkování používalo 40 DDIM inversion kroků a 6 DDIM forward kroků. Všechna školení se prováděla na jediném NVIDIA A100 GPU (zda s 40GB nebo 80GB VRAM nebylo specifikováno).
Srovnávací systémy testované byly CLIP2Protect a dříve zmíněný DiffAM. Autoři použili ‘matte’ styly make-upu v pracovním postupu, protože CLIP2Protect poznamenala, že tento styl dosahuje vyšší úspěšnost (přestože to může poskytnout příležitost pro ty, kteří se snaží tuto metodu obejít – ale to je téma pro jiný čas).
Abyste replikovali DiffAM jako srovnávací metodu, použili se předškoleno model z BeautyGAN a jemně naladil na MT dat. Pro adversativní přenos make-upu se použil checkpoint z DiffAM s výchozími parametry pro cílový model, referenční obraz a identitu.

Výkon DiffClean ve srovnání se srovnávacími metodami na úkolech odhadu věku, pomocí MiVOLO. Metriky uváděné jsou Minor/Dospělý klasifikace přesnost, přesnost věkové skupiny a průměrná absolutní chyba (MAE). DiffClean s CLIP věkovou ztrátou dosahuje nejlepších výsledků napříč všemi metrikami.
Z těchto výsledků autoři uvádějí:
‘[Naše] metoda DIFFCLEAN překonává obě srovnávací metody, CLIP2Protect a DiffAM, a může úspěšně obnovit věkové znaky narušené make-upem, snižuje MAE (na 5,71) a zlepšuje celkovou přesnost věkové skupiny (na 37%).
‘Naše cílem se zaměřilo na věkové skupiny nezletilých, a výsledky ukazují, že dosahujeme lepší minor vs dospělý věkový odhad o 88,6%.’

Výsledky odstranění make-upu ze srovnávacích metod. Levý sloupec ukazuje zdroj obrázků, další výstupy z CLIP2Protect a DiffAM. Třetí sloupec ukazuje výsledky z DiffClean přes SSRNet a CLIP-založenou věkovou ztrátu. Autoři tvrdí, že DiffClean odstraňuje make-up účinněji, vyhýbaje se zkreslení funkcí viditelných u CLIP2Protect a reziduální kosmetice, které DiffAM přehlíží.
Autoři dále poznamenávají, že make-up nemá uniformní účinek na vnímaný věk, ale spíše může zvýšit, snížit nebo nezměnit zdánlivý věk obličeje. Proto DiffClean neaplikuje “blanket redukci” předpovězeného věku, ale místo toho se snaží obnovit původní věkové znaky odstraněním stop make-upu:

Příklady odstranění make-upu z CelebA-HQ a CACD dat. Každý sloupec ukazuje pár obrázků před (vlevo) a po (vpravo) odstranění make-upu. V prvním sloupci se předpovězený věk snižuje po odstranění make-upu; ve druhém zůstává stejný; a ve třetím se zvyšuje.
Abyste otestovali, jak dobře DiffClean funguje na nových datech, byl spuštěn na BeautyFace a LADN datech, které obsahují autentický make-up, ale žádné párové obrazy stejné osoby bez kosmetiky. Předpovědi věku provedené před a po odstranění make-upu byly porovnány, aby se vyhodnotilo, jak účinně DiffClean snížil zkreslení způsobené make-upem:

Výsledky odstranění make-upu na skutečných obrazech z LADN (levý pár) a BeautyFace (pravý pár) dat. DiffClean snižuje předpovězený věk odstraněním kosmetiky, snižuje mezéru mezi zdánlivým a skutečným věkem. Bílé čísla ukazují odhadované věky před a po zpracování.
Výsledky ukázaly, že DiffClean konzistentně snižuje mezéru mezi zdánlivým a skutečným věkem. Napříč oběma datovými sadami snížil nadhodnocení a podhodnocení chyb o přibližně tři roky v průměru, což naznačuje, že systém se dobře generalizuje na skutečné kosmetické styly.
Závěr
Je zajímavé, a možná nevyhnutelné, že performační kosmetický make-up bude použit v adversativní podobě. Vzhledem k tomu, že dívky dospívají v různých rychlostech, ale pravidelně dospívají rychleji jako skupina, úkolem identifikace rozhraní mezi nezletilou a dospělou ženskou osobou může být jedním z nejambicióznějších, které výzkumná scéna dosud stanovila.
Nicméně, čas a data mohou nakonec určit konzistentní věkově související znaky, které lze použít k ukotvení vizuálních systémů ověření věku.
* Pokudže toto téma vyzývá k nabitému jazyku, a protože ‘dívky’ je vylučující (zatímco ‘ženy a dívky’, současně přijímaný termín pro žensky orientované osoby, není přesným popisem v tomto případě), jsem se uchýlil k ‘ženským’ jako nejlepšímu kompromisu, který jsem mohl vymyslet – ačkoli to nezachycuje všechny demografické jemnosti, za které se omlouvám.
† V tomto článku používám ‘performační’ k označení make-upu, který je určen k vidění a rozpoznání jako make-up, jako je mascara, eyeliner, blush a foundation, na rozdíl od skrytých krémů a jiných ‘skrytých’ typů kosmetických aplikací.
Poprvé publikováno v pátek, 18. července 2025












