Лидеры мысли

Забытые слои: как скрытые предубеждения ИИ таятся в практиках аннотирования наборов данных

опубликованный 6 декабря 2024

Гари Эспиноса

Системы ИИ зависят от обширных, тщательно отобранных наборов данных для обучения и оптимизации. Эффективность модели ИИ тесно связана с качеством, репрезентативностью и целостностью данных, на которых она обучается. Однако существует часто недооцениваемый фактор, который глубоко влияет на результаты ИИ: аннотация набора данных.

Практики аннотирования, если они непоследовательны или предвзяты, могут привнести всеобъемлющие и часто скрытые предубеждения в модели ИИ, что приведет к искаженным и иногда пагубным процессам принятия решений, которые распространяются на различные демографические группы пользователей. Упускаемые из виду слои предвзятости ИИ, вызванной человеком, которые присущи методологиям аннотирования, часто имеют невидимые, но глубокие последствия.

Аннотация набора данных: основа и недостатки

Аннотирование наборов данных — это критически важный процесс систематической маркировки наборов данных, позволяющий моделям машинного обучения точно интерпретировать и извлекать закономерности из различных источников данных. Это охватывает такие задачи, как обнаружение объектов на изображениях, классификация настроений в текстовом контентеи распознавание именованных сущностей в различных доменах.

Аннотация служит базовым слоем, который преобразует необработанные, неструктурированные данные в структурированную форму, которую модели могут использовать для распознавания сложных закономерностей и взаимосвязей, будь то между входными и выходными данными или новыми наборами данных и их существующими обучающими данными.

Однако, несмотря на свою ключевую роль, аннотация наборов данных по своей природе подвержен человеческим ошибкам и предубеждениям. Основная проблема заключается в том, что сознательные и бессознательные человеческие предубеждения часто проникают в процесс аннотирования, внедряя предубеждения непосредственно на уровне данных ещё до начала обучения моделей. Такие предубеждения возникают из-за отсутствия разнообразия среди аннотаторов, плохо проработанных правил аннотирования или глубоко укоренившихся социокультурных предубеждений, — всё это может существенно исказить данные и тем самым поставить под угрозу объективность и точность модели.

В частности, выявление и изоляция культурно-специфического поведения являются критически важными подготовительными шагами, которые гарантируют, что нюансы культурных контекстов будут полностью поняты и учтены до того, как люди-аннотаторы начнут свою работу. Это включает в себя выявление культурно обусловленных выражений, жестов или социальных условностей, которые в противном случае могут быть неверно истолкованы или маркированы непоследовательно. Такой культурный анализ до аннотации служит для установления базовой линии, которая может смягчить ошибки и предубеждения интерпретации, тем самым повышая точность и репрезентативность аннотированных данных. Структурированный подход к изоляции этих поведений помогает гарантировать, что культурные тонкости непреднамеренно не приведут к несоответствиям данных, которые могут поставить под угрозу производительность моделей ИИ на последующих этапах.

Скрытые предубеждения ИИ в практиках аннотирования

Аннотирование наборов данных, будучи делом, которым руководит человек, по сути, подвержено влиянию индивидуального опыта, культурного контекста и личного опыта аннотаторов. все это определяет, как данные интерпретируются и маркируются. Этот субъективный слой вносит несоответствия, которые модели машинного обучения впоследствии усваивают как наземные истины. Проблема становится еще более выраженной, когда предубеждения, общие для аннотаторов, внедряются равномерно по всему набору данных, создание скрытых, системных предубеждений в поведении модели ИИ. Например, культурные стереотипы могут оказывать глубокое влияние на маркировку настроений в текстовых данных или на приписывание характеристик в визуальных наборах данных, что приводит к искаженному и несбалансированному представлению данных.

Ярким примером этого является расовая предвзятость в наборах данных распознавания лиц. в основном это вызвано однородным составом группы. Хорошо документированные случаи показали, что предубеждения введено из-за отсутствия разнообразия аннотаторов приводят к моделям ИИ, которые систематически не в состоянии точно обрабатывать лица небелых людей. Фактически, одно исследование NIST определило, что определенные группы иногда вероятность неправильной идентификации алгоритмами достигает 100. Это не только снижает эффективность модели, но и порождает серьезные этические проблемы, поскольку эти неточности часто приводят к дискриминационным результатам при развертывании приложений ИИ в таких чувствительных областях, как правоохранительные органы и социальные службы.

Не говоря уже о том, что рекомендации по аннотациям, предоставляемые аннотаторам, оказывают значительное влияние на то, как маркируются данные. Если эти рекомендации неоднозначны или изначально способствуют стереотипам, то полученные маркированные наборы данных неизбежно будут нести эти предубеждения. Этот тип «предвзятости рекомендаций» возникает, когда аннотаторы вынуждены делать субъективные выводы о релевантности данных, которые могут кодифицировать преобладающие культурные или общественные предубеждения в данных. Такие предубеждения часто усиливаются в процессе обучения ИИ, создавая модели, которые воспроизводят предубеждения, скрытые в исходных метках данных.

Рассмотрим, например, рекомендации по аннотированию, которые предписывают аннотаторам классифицировать должности или пол с неявными предубеждениями, отдающими приоритет ролям, связанным с мужчинами, для таких профессий, как «инженер» или «ученый». эти данные аннотированы и использовать в качестве обучающего набора данных, уже слишком поздно. Устаревшие и культурно предвзятые рекомендации приводят к несбалансированному представлению данных, эффективное кодирование гендерных предубеждений в системах искусственного интеллекта которые впоследствии развертываются в реальных условиях, воспроизводя и масштабируя эти дискриминационные модели.

Реальные последствия предвзятости аннотаций

Модели анализа настроений часто выделялись для предвзятых результатов, где настроения, выраженные маргинализированными группами, маркируются более негативно. Это связано с данными обучения, где комментаторы, часто из доминирующих культурных групп, неправильно интерпретируют или неправильно маркируют утверждения из-за незнания культурного контекста или сленга. Например, выражения афроамериканского разговорного английского (AAVE) часто неверно интерпретируются как негативные или агрессивные, что приводит к моделям, которые постоянно неверно классифицируют настроения этой группы.

Это не только приводит к низкой эффективности модели, но и отражает более широкую системную проблему: модели становятся плохо подходящими для обслуживания различных групп населения, что усиливает дискриминацию на платформах, использующих такие модели для автоматизированного принятия решений.

Распознавание лиц — еще одна область, где предвзятость аннотаций имела серьезные последствия. Аннотаторы, участвующие в маркировке наборов данных, могут вносить непреднамеренные предвзятости относительно этнической принадлежности, что приводит к непропорциональным показателям точности в разных демографических группах. Например, многие наборы данных распознавания лиц имеют подавляющее количество лиц европеоидной расы, что приводит к значительно более низким показателям для цветных людей. Последствия могут быть ужасными: от неправомерных арестов до отказа в доступе к основным услугам.

В 2020 году широко разрекламированный инцидент произошел с необоснованным арестом чернокожего мужчины в Детройте. из-за программного обеспечения для распознавания лиц, которое неправильно сопоставило его лицоЭта ошибка возникла из-за предубеждений в аннотированных данных, на которых обучалось программное обеспечение, — пример того, как предубеждения на этапе аннотирования могут перерасти в существенные последствия в реальной жизни.

В то же время попытка чрезмерно исправить проблему может иметь обратный эффект, как показал инцидент с Google Gemini в феврале этого года. когда LLM не мог генерировать изображения лиц кавказской национальности. Слишком сосредоточившись на устранении исторических дисбалансов, модели могут слишком сильно уклониться в противоположном направлении, что приведет к исключению других демографических групп и разжиганию новых противоречий.

Борьба со скрытыми предубеждениями в аннотациях наборов данных

Основополагающая стратегия для смягчения предвзятости аннотирования должна начинаться с диверсификации пула аннотаторов. Включение людей из самых разных слоев общества — охватывающих этническую принадлежность, пол, образовательный уровень, языковые возможности и возраст — гарантирует, что процесс аннотирования данных интегрирует несколько точек зрения, тем самым снижение риска непропорционального влияния предвзятости какой-либо одной группы на набор данныхРазнообразие в пуле аннотаторов напрямую способствует созданию более детализированных, сбалансированных и репрезентативных наборов данных.

Аналогично, должно быть достаточное количество отказоустойчивых средств, чтобы обеспечить откат, если аннотаторы не смогут контролировать свои предубеждения. Это означает достаточный надзор, внешнее резервное копирование данных и использование дополнительных команд для анализа. Тем не менее, эта цель все еще должна быть достигнута в контексте разнообразия.

Руководство по аннотациям должны пройти тщательную проверку и итеративную доработку минимизировать субъективность. Разработка объективных, стандартизированных критериев для маркировки данных помогает гарантировать, что личные предубеждения будут иметь минимальное влияние на результаты аннотации. Руководства должны быть составлены с использованием точных, эмпирически подтвержденных определений и должны включать примеры, которые отражают широкий спектр контекстов и культурных различий.

Включение циклов обратной связи в рабочий процесс аннотирования, где аннотаторы могут высказывать опасения или неясности относительно руководств, имеет решающее значение. Такая итеративная обратная связь помогает непрерывно совершенствовать инструкции и устраняет любые скрытые предубеждения, которые могут возникнуть в процессе аннотирования. Более того, использование анализа ошибок из выходных данных модели может выявить слабые стороны руководств, предоставляя основу для улучшения руководств на основе данных.

Активное обучение — где модель ИИ помогает аннотаторам, предоставляя высоконадежные предложения по меткам— может быть ценным инструментом для повышения эффективности и согласованности аннотаций. Однако крайне важно, чтобы активное обучение осуществлялось под надежным контролем человека, чтобы предотвратить распространение уже существующих предубеждений модели. Аннотаторы должны критически оценивать предложения, сгенерированные ИИ, особенно те, которые расходятся с человеческой интуицией, используя эти случаи как возможности для перекалибровки как человеческого, так и модельного понимания.

Выводы и что дальше

Предубеждения, встроенные в аннотацию набора данных, являются основополагающими и часто влияют на каждый последующий уровень разработки модели ИИ. Если предубеждения не выявлены и не смягчены на этапе маркировки данных, полученная модель ИИ будет продолжать отражать эти предубеждения, что в конечном итоге приведет к некорректным, а иногда и вредным реальным приложениям.

Чтобы минимизировать эти риски, специалисты по ИИ должны тщательно изучать практики аннотирования с той же степенью строгости, что и другие аспекты разработки ИИ. Внедрение разнообразия, уточнение руководств и обеспечение лучших условий работы для аннотаторов являются ключевыми шагами на пути к смягчению этих скрытых предубеждений.

Путь к действительно беспристрастным моделям ИИ требует признания и рассмотрения этих «забытых слоев» с полным пониманием того, что даже небольшие предубеждения на фундаментальном уровне могут привести к непропорционально большим последствиям.

Аннотирование может показаться технической задачей, но это глубоко человеческая задача, и, таким образом, изначально несовершенная. Признавая и устраняя человеческие предубеждения, которые неизбежно просачиваются в наши наборы данных, мы можем проложить путь к более справедливым и эффективным системам ИИ.