Погляд Anderson
Інструмент AI видаляє макіяж, щоб запобігти обходу перевірки віку неповнолітніми

Зовнішній вигляд косметики дозволяє неповнолітнім користувачам, переважно дівчатам, обходити перевірку віку на основі селфі на платформах, таких як додатки для знайомств і сайти електронної комерції. Новий інструмент AI усуває цю лазу, використовуючи дискримінативну модель, навчену видаляти макіяж, зберігаючи при цьому ідентичність, що робить його складніше для неповнолітніх обманути автоматизовані системи.
Використання сервісів третіх сторін, що здійснюють перевірку віку на основі селфі, зростає, не в останню чергу через загальний глобальний імпульс до онлайн-верифікації віку.
Наприклад, у новому режимі виконання, який тепер обов’язує Закон про онлайн-безпеку Великої Британії, перевірку віку можна проводити різними сервісами третіх сторін, що використовують різні можливі методи, включно з візуальною перевіркою віку, де AI використовується для візуального передбачення віку користувача (зазвичай з живих кадрів мобільної камери). Сервісами, що використовують підходи цього типу, є Ondato, TrustStamp і Yoti.
Однак, оцінка віку не є непогрішимою, а традиційна визначеність підлітків передбачити права дорослого віку означає, що молоді люди розробили різноманітні ефективні методи для входу на сайти знайомств, форуми та інші середовища, що забороняють їхню вікову групу.
Одним із цих методів, найбільш поширеним серед дівчат*, є носіння макіяжу – тактика, відомо, що обманює автоматизовані системи оцінки віку, які зазвичай завищують вік молодих людей і занижують вік старших людей.
Не тільки дівчата
Перед тим, як виникнуть протести проти розгляду макіяжу як “орієнтованого на жінок”, ми повинні звернути увагу на те, що присутність косметики на хтось є дуже ненадійним показником статі:

У статті ‘Вплив косметики на автоматичні алгоритми визначення статі та віку’ дослідники США виявили, що системи верифікації статі були обмануті макіяжем, що міняє стать. Джерело: https://cse.msu.edu/~rossarun/pubs/ChenCosmeticsGenderAge_VISAPP2014.pdf
У 2024 році 72% чоловіків-споживачів у віці 18-24 років були оцінені як ті, хто включає макіяж у свій догляд за шкірою, хоча більшість використовують косметичні продукти для покращення вигляду здорової шкіри, а не займаються макіяжем у стилі † маскари/помади, більш характерним для візуальної естетики жінок.
Отже, ми не можемо не розглядати матеріал, вивчений у цій статті, уздовж лінії найбільш поширеної ситуації, дослідженої у нових дослідженнях – ситуації, коли неповнолітні дівчата використовують макіяж, щоб обманути автоматизовані візуальні системи верифікації віку.
Ефективне видалення макіяжу – шлях AI
Дослідження, згадане вище, походять від трьох учасників Нью-Йоркського університету, у вигляді нової статті DiffClean: Дифузійне видалення макіяжу для точної оцінки віку.
Мета проекту полягає у досягненні методу, керованого AI, для видалення вигляду макіяжу з зображень (потенційно включаючи відеозображення), щоб отримати краще уявлення про справжній вік людини за макіяжем.

З нової статті, приклад того, як видалення макіяжу може суттєво змінити передбачення віку. Джерело: https://arxiv.org/pdf/2507.13292
Одним із викликів розробки такої системи є потенційна чутливість навколо збору або кураторства зображень неповнолітніх дівчат у макіяжі. У підсумку дослідники використали систему третіх сторін, засновану на Генеративних Адверсарних ネтворках під назвою EleGANt, щоб штучно накладати стилі макіяжу, що виявилося дуже ефективним:

Система EleGANt Університету Цінхуа 2022 року використовує Генеративну Адверсарну ネтворк (GAN) для накладення косметики автентично на вихідні фотографії. Джерело: https://arxiv.org/pdf/2207.09840
За допомогою синтетичних даних, отриманих таким чином, та з допомогою різноманітних допоміжних проектів і наборів даних, автори змогли перевершити методи державної науки у оцінці віку при зіткненні з макіяжем або “видимим” макіяжем.
У статті зазначено:
‘DiffClean [видаляє] сліди макіяжу, використовуючи текстово-керовану дифузійну модель для захисту від атак макіяжу. [Він] покращує оцінку віку (точність віку неповнолітніх та дорослих на 4,8%) і верифікацію особи (TMR на 8,9% при FMR=0,01%) над конкуруючими базовими моделями на цифрових симульованих і реальних зображеннях з макіяжем.’
Давайте розглянемо, як вони підходили до цього завдання.
Метод
Щоб уникнути джерел реальних зображень неповнолітніх у макіяжі, автори використали EleGANt для накладення синтетичних косметичних засобів на зображення з набору даних UTKFace, створюючи пари “до” і “після” для навчання.

Приклади з набору даних UTKFace. Джерело: https://susanqq.github.io/UTKFace/
DiffClean потім був навчений для зворотного перетворення. Оскільки алгоритми оцінки віку найбільш помиляються при роботі з молодшими віковими групами, дослідники виявили необхідність розробити проксі-класифікатор віку файн-тюнінг на цільових віках (10-19 років). Для цього вони використали SSRNet архітектуру, навчену на UTKFace, з ваговим L1 втратою.
Упрощена версія моделі 2021 року дифузійної моделі OpenAI забезпечила основу для перетворення, з авторами, які зберегли основну архітектуру, але змінили її додатковими головками уваги на різних резолюціях, глибших шарах і блоками BigGAN для покращення стадій апсемплінгу і даунсемплінгу.
Керування напрямком було введено за допомогою CLIP промптів: конкретно, обличчя з макіяжем і обличчя без макіяжу, так що модель навчилася рухатися у бажаному семантичному напрямку, дозволяючи видаляти макіяж без порушення деталей обличчя, вікових ознак або ідентичності.

Синтетичний макіяж, накладений за допомогою EleGANt. Кожна трійка показує вихідне зображення UTKFace (ліворуч), стилі макіяжу (в центрі) і результат після переносу стилю (праворуч). Перенос макіяжу такого типу поширений у літературі комп’ютерного зору, і така можливість також доступна у нейронних фільтрах Adobe Photoshop, які можуть подібним чином накладати макіяж з посилального зображення на цільове зображення.
Чотири ключові функції втрат керували видаленням макіяжу без впливу на ідентичність обличчя або вікових ознак. Окрім вищезазначеної CLIP-основаної втрати, ідентичність зберігалася за допомогою вагового пару ArcFace втрат, взятих з бібліотеки InsightFace – втрат, які міряли схожість між згенерованим обличчям і як оригінальним чистим зображенням, так і “зробленим” версією, забезпечуючи візуальну консистентність суб’єкта до і після видалення макіяжу.
Третій, перцептивна втрата Навчені перцептивні метрики подібності (LPIPS) використовувала відстань L1 для забезпечення реалізму на рівні пікселів і збереження загального вигляду оригінального зображення після видалення макіяжу.
Нарешті, вік супроводжувався за допомогою файн-тюнінгованої SSRNet, навченої на наборі даних UTKFace, з моделлю, яка використовувала гладку втрату L1 (з більшими штрафами за помилки у віковому діапазоні 10–29 років, де неправильна класифікація найпоширеніша). Варіант моделі замінив це на CLIP-оснований вік-промпт, який примушував модель відповідати вигляду конкретного віку.
Для оцінки віку під час інференції (на відміну від використання SSRNet під час навчання) був використаний MiVOLO фреймворк.
Дані та тести
Файн-тюнінг SSRNet на UTKFace використовував набір даних для навчання з 15 364 зображеннями, проти тестового набору з 6 701 зображеннями. Оригінальні 20 000 зображень були фільтровані для видалення осіб старших 70 років, а потім розділені у співвідношенні 70:30.
У відповідності з попереднім методом, встановленим проєктом DiffAM 2023 року, навчання проводилось у два етапи, з початковою сесією, яка використовувала 300 реальних зображень з макіяжем (цей раз 200/100 розділ між навчанням і валідациєю) з набору даних MT BeautyGAN.
Модель потім була дофільтрована далі за допомогою 300 додаткових зображень UTKFace, доповнених синтетичним макіяжем за допомогою EleGANt. Це створило остаточний набір даних для навчання з 600 прикладами, спарених по п’ятьох посилальних стилів з BeautyGAN. Оскільки видалення макіяжу включає в себе відображення багатьох стилів макіяжу на одне чисте обличчя, навчання було зосереджено на широкому загальному узагальненні, а не на покритті кожного можливого варіанту косметики.
Виконання було оцінено як на синтетичних, так і на реальних зображеннях. Синтетичне тестування використовувало 2 556 зображень з набору даних Flickr-Faces-HQ (FFHQ), рівномірно вибраних по дев’яти віковим групам нижче 70 років, і змінених за допомогою EleGANt.
Загальне узагальнення оцінювалося за допомогою 3 000 зображень з набору даних BeautyFace і 355 з набору даних LADN, які містять справжній макіяж.

Приклади з набору даних BeautyFace, що демонструють семантичну сегментацію, яка визначає різні області обличчя. Джерело: https://li-chongyi.github.io/BeautyREC_files/
Метрики та впровадження
Для метрик автори використовували середню абсолютну похибку (MAE) між фактичним віком (реальними зображеннями з встановленим віком) і передбачуваними віковими значеннями, де нижчі результати кращі; точність вікової групи використовувалася для оцінки того, чи передбачені віки потрапляють у правильні вікові групи (у цьому випадку нижчі результати кращі); точність визначення неповнолітніх/дорослих використовувалася для оцінки правильної ідентифікації осіб старших 18 років (де вищий результат кращий).
Крім того, хоча це не є центральним для конкретної теми, розглянутої тут, автори також повідомляють про метрики верифікації особи у вигляді True Match Rate (TMR) і False Match Rate (FMR), а також додаткову звітність пов’язаних значень ROC.
SSRNet був файн-тюнований на зображеннях розміром 64×64 пікселів за допомогою батч-сайзу 50 під оптимізатором Adam з ваговим衰減ом 1e−4, а також графіком косинусної анімації і швидкістю навчання 1e−3 за 200 епох, з ранньою зупинкою.
Натомість, модуль DiffClean отримував вхідні зображення розміром 256×256 пікселів і файн-тюнувався за п’ять епох за допомогою Adam, при грубішій швидкості навчання 4e−3. Зразкування використовувало 40 DDIM-інверсійні кроки і 6 DDIM-передових кроків. Усі навчання проводились на одному GPU NVIDIA A100 (чи з 40 ГБ, чи з 80 ГБ оперативної пам’яті не вказано).
Суперницькі системи, що тестувалися, були CLIP2Protect і вищезгаданий DiffAM. Автори використовували “матовий” макіяж у робочому процесі, оскільки це було відзначено у CLIP2Protect як досягнення вищого успіху (хоча це, можливо, надає можливість тим, хто намагається обманути цей підхід – але це питання для іншого часу).
Щоб повторити DiffAM як базову лінію, файн-тюнінг попередньо навченої моделі з BeautyGAN проводився на наборі даних MT. Для адверсарного переносу макіяжу використовувався чекпойнт з DiffAM з параметрами за замовчуванням для цільової моделі, посилального зображення та ідентичності.

Виконання DiffClean у порівнянні з базовими моделями на завданнях оцінки віку, що використовують MiVOLO. Метрики, що повідомляються, включають точність класифікації неповнолітніх/дорослих, точність вікової групи та середню абсолютну похибку (MAE). DiffClean з CLIP-віковою втратаю досягає найкращих результатів у всіх метриках.
З цих результатів автори заявляють:
‘Наш метод DIFFCLEAN перевершує обидві базові моделі, CLIP2Protect і DiffAM, і може успішно відновити вікові ознаки, порушені через макіяж, знижуючи MAE (до 5,71) і покращуючи загальну точність вікової групи (до 37%). ‘
‘Наша мета була зосереджена на вікових групах неповнолітніх, і результати показують, що ми досягаємо вищої точності визначення віку неповнолітніх/дорослих у 88,6%.’

Результати видалення макіяжу з базових і запропонованих методів. Ліва колонка показує вихідні зображення, наступна – результати з CLIP2Protect і DiffAM. Третя колонка показує результати з DiffClean через SSRNet і CLIP-вікову втрату. Автори стверджують, що DiffClean видаляє макіяж більш ефективно, уникając спотворення ознак, спостережуваного у CLIP2Protect, і залишків косметики, пропущених DiffAM.
Автори далі зазначають, що макіяж не має однорідного впливу на сприйняття віку, а радше може збільшувати, зменшувати або залишати незмінним сприйняття віку обличчя. Тому DiffClean не застосовує “універсальне зниження” передбачуваного віку, а радше намагається відновити оригінальні вікові ознаки, видаливши сліди макіяжу:

Приклади видалення макіяжу з наборів даних CelebA-HQ і CACD. Кожна колонка показує пару зображень до (ліворуч) і після (праворуч) видалення макіяжу. У першій колонці передбачуваний вік знижується після видалення макіяжу; у другій – залишається незмінним; а в третій – збільшується.
Щоб протестувати, як добре DiffClean працює на нових даних, його було запущено на наборах даних BeautyFace і LADN, які містять справжній макіяж, але не парні зображення одних і тих же осіб без косметики. Оцінки віку, зроблені до і після видалення макіяжу, були порівняні, щоб оцінити, наскільки ефективно DiffClean знижує спотворення, введене макіяжем:

Результати видалення макіяжу на реальних зображеннях з наборів даних LADN (ліворуч) і BeautyFace (праворуч). DiffClean знижує передбачуваний вік, видаливши косметику, звужуючи розрив між очевидним і фактичним віком. Білі цифри показують оцінки віку до і після обробки.
Результати показали, що DiffClean послідовно звужує розрив між очевидним і фактичним віком. На обидвох наборах даних він знижував надоцінювання і недооцінювання похибок приблизно на три роки в середньому, що свідчить про те, що система загалом узагальнюється до реальних стилів макіяжу.
Висновок
Цікаво, і, можливо, неминуче, що перформативний макіяж буде використовуватися у вороговому стилі. Враховуючи, що дівчата дозрівають з різною швидкістю, але послідовно дозрівають швидше як група, завдання визначення межі між неповнолітнім і дорослим статусом жінок може бути одним із найамбітніших, які дослідницька сфера ще поставила перед собою.
Тим не менш, час і дані можуть врешті-решт визначити постійні вікові ознаки, які можна використовувати для закріплення візуальних систем верифікації віку.
* Оскільки ця тема запрошує заряджену мову, і оскільки ‘дівчата’ є обмежувальним терміном (хоча ‘жінки та дівчата’, зараз прийнятний термін для людей жіночої статі, не є точним описом у цьому випадку), я звернувся до ‘жінок’ як найкращого компромісу, який я міг придумати – хоча це не охоплює всі демографічні нюанси, за що я вибачаюся.
† У цій статті я використовую ‘перформативний’, щоб позначити макіяж, призначений для того, щоб бути поміченим і визнаним як макіяж, такий як маскара, підводка для очей, рум’яна і фонд де тен, на відміну від приховувальних кремів і інших ‘таємних’ видів косметичних застосувань.
Перша публікація – п’ятниця, 18 липня 2025 року












