Искусственный интеллект

Петля обратной связи ИИ: поддержание качества модели производства в эпоху контента, сгенерированного ИИ

Published July 25, 2023

Updated April 28, 2026

Haziqa Sajid

The AI Feedback Loop: Maintaining Model Production Quality In The Age Of AI-Generated Content

Модели ИИ, развернутые в производстве, нуждаются в надежном и непрерывном механизме оценки производительности. Именно здесь может быть применена петля обратной связи ИИ, чтобы обеспечить последовательную производительность модели.

Возьмите это от Илона Маска:

“Я думаю, что очень важно иметь петлю обратной связи, где вы постоянно думаете о том, что вы сделали и как вы можете делать это лучше.”

Для всех моделей ИИ стандартной процедурой является развертывание модели, а затем периодическое повторное обучение на последних реальных данных, чтобы обеспечить, что ее производительность не ухудшается. Но с метеоритным ростом Генеративного ИИ, обучение моделей ИИ стало аномальным и подверженным ошибкам. Это потому, что онлайн-источники данных (интернет) постепенно становятся смесью данных, сгенерированных человеком и ИИ.

Например, многие блоги сегодня содержат текст, сгенерированный ИИ, работающий на Больших языковых модулях (LLM), таких как ChatGPT или GPT-4. Многие источники данных содержат изображения, сгенерированные ИИ, созданные с помощью DALL-E2 или Midjourney. Кроме того, исследователи ИИ используют синтетические данные, сгенерированные с помощью Генеративного ИИ, в своих конвейерах обучения моделей.

Следовательно, нам нужен надежный механизм, чтобы обеспечить качество моделей ИИ. Именно здесь необходимость петель обратной связи ИИ стала более выраженной.

Что такое петля обратной связи ИИ?

Петля обратной связи ИИ – это итеративный процесс, где решения и выходы модели ИИ непрерывно собираются и используются для улучшения или повторного обучения той же модели, в результате чего происходит непрерывное обучение, развитие и улучшение модели. В этом процессе обучающие данные модели ИИ, параметры модели и алгоритмы обновляются и улучшаются на основе входных данных, сгенерированных внутри системы.

В основном существуют два вида петель обратной связи ИИ:

Положительная петля обратной связи ИИ: Когда модели ИИ генерируют точные результаты, соответствующие ожиданиям и предпочтениям пользователей, пользователи дают положительную обратную связь через петлю обратной связи, которая, в свою очередь, укрепляет точность будущих результатов. Такая петля обратной связи называется положительной.
Отрицательная петля обратной связи ИИ: Когда модели ИИ генерируют неточные результаты, пользователи сообщают о недостатках через петлю обратной связи, которая, в свою очередь, пытается улучшить стабильность системы, исправляя недостатки. Такая петля обратной связи называется отрицательной.

Оба типа петель обратной связи ИИ позволяют обеспечить непрерывное развитие и улучшение модели с течением времени. И они не используются или применяются в изоляции. Вместе они помогают моделям ИИ, развернутым в производстве, понимать, что правильно или неправильно.

Этапы петель обратной связи ИИ

Иллюстрация данных, сгенерированных ИИ, в петле обратной связи ИИ

Высокоуровневая иллюстрация механизма обратной связи в моделях ИИ. Источник

Понимание того, как работают петли обратной связи ИИ, имеет решающее значение для раскрытия всего потенциала разработки ИИ. Давайте рассмотрим различные этапы петель обратной связи ИИ ниже.

Сбор обратной связи: Сбор соответствующих результатов модели для оценки. Обычно пользователи дают обратную связь о результате модели, которая затем используется для повторного обучения. Или это может быть внешние данные из сети, отобранные для тонкой настройки производительности системы.
Повторное обучение модели: Используя собранную информацию, система ИИ повторно обучается для того, чтобы делать более точные прогнозы, предоставлять ответы или выполнять определенные действия, совершенствуя параметры модели или веса.
Интеграция обратной связи и тестирование: После повторного обучения модель тестируется и оценивается снова. На этом этапе обратная связь от экспертов в соответствующей области (SME) также включается для выделения проблем, выходящих за рамки данных.
Развертывание: Модель развертывается после проверки изменений. На этом этапе модель должна показывать лучшую производительность на новых реальных данных, в результате чего улучшается опыт пользователя.
Мониторинг: Модель непрерывно мониторится с помощью метрик для выявления потенциального ухудшения, такого как дрейф. И цикл обратной связи продолжается.

Проблемы в производственных данных и выходных данных модели ИИ

Создание надежных систем ИИ требует глубокого понимания потенциальных проблем в производственных данных (реальных данных) и выходных данных модели. Давайте рассмотрим несколько проблем, которые становятся препятствием для обеспечения точности и надежности систем ИИ:

Дрейф данных: Происходит, когда модель начинает получать реальные данные из другого распределения по сравнению с распределением обучающих данных модели.
Дрейф модели: Способность модели делать прогнозы и эффективность уменьшаются с течением времени из-за изменения реальных условий. Это известно как дрейф модели.
Выходные данные модели ИИ и реальные решения: Модели ИИ производят неточные выходные данные, которые не соответствуют реальным решениям заинтересованных сторон.
Смещение и справедливость: Модели ИИ могут развивать смещение и проблемы справедливости. Например, в докладе TED Джанель Шейн она описывает решение Amazon остановить работу над алгоритмом сортировки резюме из-за дискриминации по гендеру.

Как только модели ИИ начинают обучаться на контенте, сгенерированном ИИ, эти проблемы могут увеличиться. Как? Давайте обсудим это более подробно.

Петли обратной связи ИИ в эпоху контента, сгенерированного ИИ

В связи с быстрым внедрением Генеративного ИИ исследователи изучили явление, известное как Коллапс модели. Они определяют коллапс модели как:

“Дегенеративный процесс, влияющий на поколения обученных генеративных моделей, где сгенерированные данные в конечном итоге загрязняют обучающий набор следующего поколения моделей; обучаясь на загрязненных данных, они затем неправильно воспринимают реальность.”

Коллапс модели состоит из двух особых случаев,

Ранний коллапс модели происходит, когда “модель начинает терять информацию о хвостах распределения,”, т.е. крайних концах распределения обучающих данных.
Поздний коллапс модели происходит, когда “модель переплетает разные режимы исходных распределений и сходится к распределению, которое имеет мало сходства с исходным, часто с очень маленькой дисперсией.”

Причины коллапса модели

Для того, чтобы практики ИИ решали эту проблему, важно понять причины коллапса модели, сгруппированные в две основные категории:

Статистическая аппроксимационная ошибка: Это основная ошибка, вызванная конечным количеством образцов, и она исчезает, когда количество образцов приближается к бесконечности.
Функциональная аппроксимационная ошибка: Эта ошибка возникает, когда модели, такие как нейронные сети, не могут захватить истинную основную функцию, которую необходимо выучить из данных.

Пример результатов модели для нескольких поколений моделей, пострадавших от коллапса модели. Источник

Как петля обратной связи ИИ пострадала из-за контента, сгенерированного ИИ

Когда модели ИИ обучаются на контенте, сгенерированном ИИ, это имеет разрушительное влияние на петли обратной связи ИИ и может вызвать многие проблемы для повторно обученных моделей ИИ, такие как:

Коллапс модели: Как объяснялось выше, коллапс модели является вероятной возможностью, если петля обратной связи ИИ содержит контент, сгенерированный ИИ.
Катастрофическое забывание: Типичная проблема в непрерывном обучении заключается в том, что модель забывает предыдущие образцы при обучении новой информации. Это известно как катастрофическое забывание.
Загрязнение данных: Оно относится к подаче манипулятивных синтетических данных в модель ИИ для компрометации производительности, что заставляет ее производить неточные выходные данные.

Как бизнес может создать надежную петлю обратной связи для своих моделей ИИ?

Бизнес может получить пользу от использования петель обратной связи в своих конвейерах ИИ. Следуйте трем основным шагам ниже, чтобы улучшить производительность своих моделей ИИ.

Обратная связь от экспертов в соответствующей области: Эксперты в соответствующей области (SME) очень хорошо знают свою область и понимают использование моделей ИИ. Они могут предложить идеи для увеличения соответствия модели реальным условиям, давая более высокий шанс правильных результатов. Кроме того, они могут лучше управлять и контролировать данные, сгенерированные ИИ.
Выбор соответствующих метрик качества модели: Выбор правильной метрики оценки для правильной задачи и мониторинг модели в производстве на основе этих метрик может обеспечить качество модели. Практики ИИ также используют инструменты MLOps для автоматической оценки и мониторинга, чтобы предупредить всех заинтересованных сторон, если производительность модели начинает ухудшаться в производстве.
Строгое курирование данных: Поскольку модели производства повторно обучаются на новых данных, они могут забыть прошлую информацию, поэтому важно курировать высококачественные данные, которые хорошо соответствуют цели модели. Эти данные можно использовать для повторного обучения модели в последующих поколениях, вместе с обратной связью пользователей, чтобы обеспечить качество.

Чтобы узнать больше об достижениях ИИ, перейдите на Unite.ai.