Connect with us

Остановка ИИ от выдумывания историй: Руководство по предотвращению галлюцинаций

Лидеры мнений

Остановка ИИ от выдумывания историй: Руководство по предотвращению галлюцинаций

mm

ИИ революционизирует способ функционирования почти каждой отрасли. Он делает нас более эффективными, более продуктивными и – когда он реализован правильно – лучше выполняемыми в нашей работе в целом. Но по мере того, как наша зависимость от этой новой технологии увеличивается быстро, нам нужно напомнить себе об одном простом факте: ИИ не является непогрешимым. Его выходные данные не должны приниматься на веру, потому что, как и люди, ИИ может совершать ошибки.

Мы называем эти ошибки “галлюцинациями ИИ”. Такие промахи могут варьироваться от неправильного ответа на математическую задачу до предоставления неправильной информации о государственных политиках. В высокорегулируемых отраслях галлюцинации могут привести к дорогостоящим штрафам и юридическим проблемам, не говоря уже о недовольных клиентах.

Частота галлюцинаций ИИ должна поэтому быть причиной для беспокойства: оценивается, что современные большие языковые модели (БЯМ) галлюцинируют где-то от 1% до 30% времени. Это приводит к сотням ложных ответов, генерируемых ежедневно, что означает, что бизнес, стремящийся использовать эту технологию, должен быть очень избирательным при выборе инструментов для реализации.

Давайте исследуем, почему галлюцинации ИИ происходят, что на кону и как мы можем выявить и исправить их.

Мусор на входе, мусор на выходе

Вы помните игру “телефон” в детстве? Как начальная фраза искажалась, когда передавалась от игрока к игроку, в результате чего получалась совершенно другая фраза к тому времени, когда она обошла круг?

Способ, которым ИИ учится на своих входных данных, похож. Ответы, генерируемые БЯМ, столь же хороши, как и информация, которую они получают, что означает, что неправильный контекст может привести к генерации и распространению ложной информации. Если система ИИ построена на данных, которые являются неточными, устаревшими или предвзятыми, то ее выходные данные будут отражать это.

Таким образом, БЯМ столь же хорош, как и его входные данные, особенно когда нет человеческого вмешательства или надзора. По мере того, как более автономные решения ИИ распространяются, важно предоставить инструментам правильный контекст данных, чтобы избежать вызывания галлюцинаций. Нам нужно тщательное обучение этих данных и/или возможность направлять БЯМ таким образом, чтобы они реагировали только на контекст, который им предоставлен, а не на информацию с любого места в интернете.

Почему галлюцинации имеют значение?

Для бизнеса, ориентированного на клиентов, точность является всем. Если сотрудники полагаются на ИИ для задач, таких как синтезирование данных клиентов или ответы на запросы клиентов, они должны доверять тому, что ответы, генерируемые такими инструментами, точны.

В противном случае бизнес рискует повредить своей репутации и лояльности клиентов. Если клиентам предоставляются недостаточные или ложные ответы чат-ботом или если они вынуждены ждать, пока сотрудники проверят выходные данные чат-бота, они могут уйти в другое место. Люди не должны беспокоиться о том, предоставляют ли им бизнес, с которым они взаимодействуют, ложную информацию – они хотят быструю и надежную поддержку, что означает, что получение этих взаимодействий правильно является наиболее важным.

Бизнес-лидеры должны сделать свою работу, когда выбирают правильный инструмент ИИ для своих сотрудников. ИИ должен освободить время и энергию для сотрудников, чтобы сосредоточиться на более высоких задачах; инвестиции в чат-бот, который требует постоянного человеческого надзора, сводят на нет цель внедрения. Но действительно ли существование галлюцинаций так заметно или термин просто чрезмерно используется для идентификации с любым ответом, который мы предполагаем быть неправильным?

Борьба с галлюцинациями ИИ

Рассмотрите: Теорию динамического смысла (ТДС), концепцию, что понимание между двумя людьми – в данном случае пользователем и ИИ – обмениваются. Но ограничения языка и знания предмета вызывают несоответствие в интерпретации ответа.

В случае с ответами, сгенерированными ИИ, возможно, что лежащие в основе алгоритмы еще не полностью оснащены для точной интерпретации или генерации текста таким образом, чтобы соответствовать нашим ожиданиям как людей. Это несоответствие может привести к ответам, которые могут показаться точными на поверхности, но в конечном итоге не имеют глубины или нюансов, необходимых для истинного понимания.

Кроме того, большинство общих БЯМ извлекают информацию только из контента, который публично доступен в интернете. Приложения ИИ для предприятий работают лучше, когда они информируются данными и политиками, специфичными для отдельных отраслей и бизнеса. Модели также могут быть улучшены с помощью прямой человеческой обратной связи – особенно агентных решений, предназначенных для реагирования на тон и синтаксис.

Такие инструменты также должны быть строго протестированы, прежде чем они станут ориентированными на потребителя. Это является важной частью предотвращения галлюцинаций ИИ. Всего потока следует протестировать с помощью разговоров на основе очереди с БЯМ, играющим роль персонажа. Это позволяет бизнесу лучше предположить общий успех разговоров с моделью ИИ, прежде чем выпустить ее в мир.

Важно, чтобы как разработчики, так и пользователи технологии ИИ оставались осведомленными о теории динамического смысла в ответах, которые они получают, а также о динамике языка, используемого в входных данных. Помните, контекст является ключом. И как люди, большинство нашего контекста понимается через неявные средства, будь то через язык тела, социальные тенденции – даже наш тон. Как люди, у нас есть потенциал галлюцинировать в ответ на вопросы. Но в нашей текущей итерации ИИ наше человеческое понимание не так легко контекстуализировано, поэтому нам нужно быть более критичными к контексту, который мы предоставляем в письменной форме.

Довольно сказать – не все модели ИИ созданы равными. По мере того, как технология развивается для выполнения все более сложных задач, важно для бизнеса, ориентированного на реализацию, выявить инструменты, которые улучшат взаимодействие с клиентами и опыт, а не отвлекут от них.

Бремя не только на поставщиках решений, чтобы обеспечить, что они сделали все возможное, чтобы минимизировать шанс на галлюцинации. Потенциальные покупатели также играют свою роль. Приоритизируя решения, которые тщательно обучены и протестированы и могут учиться на проприетарных данных (а не на всем, что есть в интернете), бизнес может получить максимальную пользу от своих инвестиций в ИИ, чтобы подготовить сотрудников и клиентов к успеху.

Dan Balaceanu, Chief Product Officer at DRUID AI, имеет опыт управления отделами разработки и процессами внутри организаций-предприятий. Он является высококвалифицированным Solutions Architect и Technical Project Manager с более чем 15-летним опытом руководства проектами среднего масштаба по разработке и реализации, с сбором требований клиентов, анализом систем, разработкой и тестированием приложений в командах, ориентированных на клиентов.

Раскрытие информации о рекламе: Unite.AI придерживается строгих редакционных стандартов, чтобы предоставлять читателям точную информацию и новости. Мы можем получать вознаграждение, если вы переходите по ссылкам на продукты, которые мы рассмотрели.