Штучний інтелект

Виклик ‘Расової Категоризації’ для Систем Синтезу Зображень на основі CLIP

Published May 24, 2022

Updated April 5, 2026

Martin Anderson

Нові дослідження в США виявили, що одна з популярних моделей комп’ютерного зору, яка лежить в основі серії DALL-E, а також багатьох інших моделей генерації та класифікації зображень, демонструє доведену тенденцію до гіподесценції – правила расової категоризації (також відомого як правило “одної краплі”), яке категоризує людину з навіть незначною мірою “змішаної” (тобто не-євроцентристської) генетичної спорідненості повністю в категорію “меншинства”.

Оскільки гіподесценція характеризувала деякі з найгірших розділів людської історії, автори нової статті пропонують, що такі тенденції в дослідженнях комп’ютерного зору та реалізації повинні отримати більшу увагу, не в останню чергу через те, що підтримуюча структура, яку розглядають, завантажується майже мільйон разів на місяць, могла б подальше поширювати та підтримувати расові упередження в hạших рамках.

Архітектуру, яку вивчають у новій роботі, називається Contrastive Language Image Pretraining (CLIP), багатозадачна модель машинного навчання, яка вчиться семантичних асоціацій шляхом навчання на парах зображень/підписів, взятих з інтернету – напівнагляді метод, який зменшує значні витрати на маркування, але який, ймовірно, віддзеркалює упередження людей, які створили підписи.

З паперу:

‘Наші результати надають докази гіподесценції в просторі вкладення CLIP, упередження, яке застосовується сильніше до зображень жінок. Результати далі вказують на те, що CLIP асоціює зображення з расовими або етнічними мітками на основі відхилення від Білої, з Білою як замовчуванням.

Стаття також знаходить, що асоціація валентності зображення (його тенденція бути асоційованим з “добрими” або “поганими” речами) є помітно вищою для “меншинських” расових міток, ніж для каукасійських міток, і пропонує, що упередження CLIP віддзеркалюють американо-центристський корпус літератури (англійську Вікіпедію), на якому була навчена структура.

Коментуючи наслідки очевидної підтримки гіподесценції CLIP, автори заявляють*:

‘Одним з перших застосувань CLIP було навчання моделі генерації зображень з нуля DALL-E. Більша, не публічна версія архітектури CLIP була використана під час навчання DALL-E 2. У відповідності з результатами цієї роботи, опис ризиків та обмежень у моделі DALL-E 2 відзначає, що вона “генерує зображення, які схильні надставляти людей, які білізуються”.

‘Такі застосування демонструють потенціал для упереджень, вивчених CLIP, поширення за межі простору вкладення моделі, оскільки її особливості використовуються для формування семантики в інших моделях штучного інтелекту рівня стану мистецтва.

‘Крім того, завдяки частково досягнутим вдосконаленням CLIP та подібних моделей для асоціації зображень та тексту в нульовому режимі, багатомодальні архітектури були описані як основа для майбутніх широко використовуваних інтернет-застосунків, включаючи пошукові системи.

‘Наші результати вказують на те, що додаткова увага до того, що такі моделі вивчають з природної мовної нагляду, є виправданою.’

Стаття називається Докази гіподесценції у візуальній семантичній штучній інтелект, і походить від трьох дослідників Університету Вашингтона та Гарвардського університету.

CLIP і погані впливи

Хоча дослідники підтверджують, що їхня робота є першою аналізом гіподесценції в CLIP, попередні роботи продемонстрували, що робочий процес CLIP, залежний від великою мірою від ненаглядованого навчання з під-курованих веб-даних, недооцінює жінок, може генерувати образливі контенти, і може демонструвати семантичну упередженість (таку як анти-мусульманська упередженість) у своєму зображенні кодувальника.

Оригінальна стаття, яка представила CLIP, визнала, що в нульовому режимі CLIP асоціює лише 58,3% людей з білою расовою міткою в наборі даних FairFace. Зауважуючи, що FairFace була мітована з можливим упередженням працівниками Amazon Mechanical Turk, автори нової статті заявляють, що “істотна меншість людей, яких інші люди сприймають як білих, асоціюються з іншою расовою міткою, ніж білою, CLIP”.

Вони продовжують:

‘Обернена ситуація, здається, не є правдою, оскільки особи, які сприймаються як належні до інших расових або етнічних міток у наборі даних FairFace, асоціюються з цими мітками CLIP. Це результат пропонує можливість того, що CLIP вивчив правило “гіподесценції”, описане соціальними вченими: особи з багаторасовою спадщиною більш схильні бути сприйнятими та категоризованими як належні до меншинової або менш avantajованої батьківської групи, ніж до рівноправної більшості або avantajованої батьківської групи.

‘Іншими словами, дитина чорного та білого батьків сприймається як більш чорна, ніж біла; і дитина азіатського та білого батьків сприймається як більш азіатська, ніж біла.’

Стаття має три центральні результати: що CLIP демонструє гіподесценцію, “згону” людей з багаторасовими ідентичностями в меншинову категорію, яка застосовується до них; що “Біла є замовчуванням у CLIP”, і що конкуруючі раси визначаються їхнім “відхиленням” від білої категорії; і що валентна упередженість (асоціація з “поганими” концепціями) корелює з мірою, в якій особа категоризується в расову меншину.

Метод і дані

Для визначення того, як CLIP поводиться з багаторасовими суб’єктами, дослідники використали раніше прийнятий метод морфування для зміни раси зображень окремих осіб. Фотографії були взяті з Чиказької бази даних облич, набору, розробленого для психологічних досліджень, пов’язаних з расою.

Приклади з расово-морфованих зображень CFD, представлених у додатковому матеріалі нової статті. Джерело: https://arxiv.org/pdf/2205.10764.pdf

Дослідники обрали лише зображення з “нейтральним виразом” з набору даних, щоб залишатися послідовними з попередньою роботою. Вони використали Генеративну Адверсативну Мережу StyleGAN2-ADA (навчена на FFHQ) для зміни раси обличчя, і створили проміжні зображення, які демонструють прогрес від однієї раси до іншої (див. приклади вище).

Послідовно з попередньою роботою, дослідники морфували обличчя людей, які ідентифікували себе як чорних, азіатів та латиноамериканців у наборі даних, у обличчя тих, хто ідентифікував себе як білих. У процесі були створені 19 проміжних стадій. Всього було створено 21 000 зображень розміром 1024×1024 пікселів для проекту цим методом.

Дослідники потім отримали проєктоване зображення вкладення для CLIP для кожного з 21 зображення в кожному расовому морфі. Після цього вони запитали мітку для кожного зображення з CLIP: “багаторасовий”, “бірасовий”, “змішана раса” та “особа” (остання мітка, яка опускає расу).

Версія CLIP, яку використовували, була реалізацією CLIP-ViT-Base-Patch32. Автори відзначають, що ця модель була завантажена понад мільйон разів у місяць, що передував написанню їхньої роботи, і становить 98% завантажень будь-якої моделі CLIP з бібліотеки Transformers.

Тести

Для перевірки потенційної схильності CLIP до гіподесценції дослідники відзначили расову мітку, призначену CLIP для кожного зображення у градієнті морфованих зображень для кожного окремого індивіда.

Згідно з результатами, CLIP схильний групувати людей у “меншинові” категорії приблизно на 50% переході.

При 50% змішаному співвідношенні, де суб’єкт є рівноправним походження/цільової раси, CLIP асоціює більшу кількість з 1000 морфованих жіночих зображень з азіатськими (89,1%), латиноамериканськими (75,8%) та чорними (69,7%) мітками, ніж з еквівалентною білою міткою.

Результати показують, що жіночі суб’єкти більш схильні до гіподесценції під CLIP, ніж чоловіки, хоча автори гіпотезують, що це може бути через те, що веб-дані та ненаглядовані мітки, які характеризують жіночі зображення, підкреслюють зовнішність суб’єкта більше, ніж у випадку з чоловіками, і що це може мати викривлюючий ефект.

Гіподесценція на 50% расового переходу не спостерігалася для азіатсько-білого чоловічого або латиноамерикансько-білого чоловічого морф-серіалу, тоді як CLIP призначав вищу косинусну схожість чорній мітці у 67,5% випадків при 55% змішаному співвідношенні.

Середня косинусна схожість міток Багаторасовий, Бірасовий і Змішана раса. Результати вказують на те, що CLIP оперує певним видом “вододільної” категоризації при різних відсотках расової суміші, рідше призначає таку расову суміш білої (‘особа’, у раціоналі експериментів) ніж етнічності, яку сприймають у зображенні.

Ідеальний об’єкт, згідно з папером, полягає в тому, що CLIP мав би категоризувати проміжні расові суміші точно як “змішану расу”, а не визначення “точки перелому”, на якій суб’єкт так часто відносять повністю до не-білій мітці.

До певної міри CLIP призначає проміжні морфологічні кроки з міткою Змішана раса (див. графік вище), але врешті-решт демонструє середній偏іння до категоризації суб’єктів за їхньої меншинової внеску раси.

У термінах валентності автори відзначають викривлене судження CLIP:

‘[Середня] валентна асоціація (асоціація з поганим або неприємним проти хорошим або приємним) змінюється з змішаним співвідношенням над чорно-білим чоловічим морф-серіалом, так що CLIP кодує асоціації з неприємністю для облич, найбільш схожих на добровольців CFD, які ідентифікують себе як чорних.’

Результати валентності – тести показують, що меншинові групи більш асоційовані з негативними концепціями в архітектурі зображення/пари ніж для білих міток. Автори стверджують, що асоціація неприємності зображення збільшується з імовірністю того, що модель асоціює зображення з чорною міткою.

Папер стверджує:

‘Докази вказують на те, що валентність зображення корелює з расовою [асоціацією]. Конкретніше, наші результати вказують на те, що чим більш впевнена модель у тому, що зображення відображає чорного індивіда, тим більш асоційоване з неприємним вкладенням простору зображення.’

Однак результати також вказують на негативну кореляцію у випадку азіатських облич. Автори пропонують, що це може бути через пас-трought (через веб-дані) позитивних американських культурних сприймань про азіатських людей та спільноти. Автори заявляють*:

‘Спостереження кореляції між приємністю та імовірністю азіатської текстової мітки може відповідати стереотипу “модельної меншини”, згідно з яким люди азіатського походження хваляться за свою мобільність та асиміляцію в американську культуру, і навіть асоціюються з “добрим поведінкою”.’

Відносно кінцевої мети, щоб перевірити, чи є Білий “замовчуванням ідентичності” з точки зору CLIP, результати вказують на вбудовану полярність, пропонуючи, що під цією архітектурою досить складно бути “трохи білим”.

Косинусна схожість по 21 000 зображень, створених для тестів.

Автори коментують:

‘Докази вказують на те, що CLIP кодує Білий як замовчування раси. Це підтверджується сильнішими кореляціями між білими косинусними схожостями та особовими косинусними схожостями, ніж для будь-якої іншої расової чи етнічної групи.’

*Моє перетворення авторських внутрішніх цитат у гіперпосилання.

Перша публікація 24 травня 2022 року.

Related Topics:AI bias Bias image synthesis research

Martin Anderson

Писатель про машинне навчання, домен-спеціаліст у сфері синтезу зображень людини. Колишній керівник дослідницького контенту в Metaphysic.ai.
Особистий сайт: martinanderson.ai
Контакт: [email protected]

Unite.AI

Виклик ‘Расової Категоризації’ для Систем Синтезу Зображень на основі CLIP

CLIP і погані впливи

Метод і дані

Тести

You may like