Свяжитесь с нами:

Почему 95% инициатив в области ИИ не приносят никакой прибыли

Лидеры мысли

Почему 95% инициатив в области ИИ не приносят никакой прибыли

mm

Недавнее исследование Массачусетского технологического института Выяснилось, что 95% организаций не получают никакой отдачи от инициатив в области генеративного ИИ; нет измеримого влияния на прибыли и убытки, несмотря на значительные инвестиции. Заголовки были сосредоточены на частоте неудач, но реальный вопрос не в том, работает ли технология. Большие языковые модели — это мощные, доступные и быстро развивающиеся технологии. Проблема в том, как компании пытаются их использовать.

Большинство организаций подходят AI-агенты Точно так же они подходили к внедрению любых других технологий. Они берут существующие процессы, добавляют туда немного ИИ и ждут чуда. Когда это не работает, они винят модели. Но сбой происходит задолго до того, как вмешивается ИИ.

Я неоднократно наблюдал эту закономерность на предприятиях, строящих Рабочие процессы ИИ. Команды воодушевляются возможностями, спешат начать разработку, а затем сталкиваются с теми же предсказуемыми препятствиями. Разница между 5% успешных проектов и 95% с нулевой окупаемостью инвестиций заключается не в удаче или бюджете, а в избежании шести критических ошибок, которые уничтожают ценность ИИ-агента ещё до его запуска.

Ваши данные сложнее, чем вы думаете

Большинство команд считают, что наличие данных означает готовность к ИИ. Они ссылаются на своё озеро данных, CRM-систему, тщательно поддерживаемые базы данных и полагают, что успех гарантирован. Затем они сваливают всё на магистра права и удивляются, почему их агент выдаёт мусор или сжигает бюджет за считанные дни.

Беспорядочные данные порождают беспорядочных агентов. Отправляя необработанные дампы базы данных, экспортированные данные в формате HTML или неструктурированные текстовые блоки ИИ-агенту, вы обрекаете его на провал. Модели путаются из-за нерелевантных полей, отвлекаются на артефакты форматирования и перегружаются огромным объёмом данных.

Команды регулярно отправляют записи о клиентах с 47 полями, хотя только 3 из них имеют решающее значение для принятия решений. Они включают в себя UUID, которые не несут никакой семантической ценности, но потребляют драгоценные токены. Они скармливают агентам HTML-код, извлеченный из внутренних инструментов, вместо чистой, структурированной информации.

Вы достигнете лимитов быстрее, чем ожидалось

Каждая команда уверена, что никогда не упрётся в ограничения контекста. «Мы обрабатываем всего несколько клиентских записей», — говорят они. «Насколько это сложно?» Затем их агенту нужно проанализировать 500 заявок в службу поддержки, каждая с полной историей разговоров, и внезапно они упираются в лимит в миллион токенов.

Большие контексты накапливаются быстрее, чем кто-либо ожидает. Специалисту службы поддержки клиентов, обрабатывающему эскалации, может потребоваться доступ к истории тикетов, статьям базы знаний, предыдущим взаимодействиям и документации по продукту. Это легко сотни тысяч токенов на один запрос. Умножьте это на количество одновременных пользователей, и ваши расходы на инфраструктуру выйдут из-под контроля.

Наивный подход — просто отправлять всё модели и надеяться на лучшее. Умные команды разбивают запросы на части, суммируют каждую часть, а затем работают с итогом итогов. Такое иерархическое суммирование позволяет легко управлять запросами, сохраняя при этом критически важную информацию, необходимую агентам для принятия правильных решений.

Безопасность быстро становится сложной

Команды с энтузиазмом относятся к личности и возможностям своего ИИ-агента, пишут базовые инструкции и думают, что они защищены. На самом деле, ИИ-агенты требуют принципиально иного подхода к безопасности, чем традиционные приложения.

Агенты ИИ могут быть обмануты, Манипулирование и принуждение к действиям пользователей нарушают традиционные модели безопасности. Вводимые пользователем данные могут содержать скрытые инструкции, которые отменяют ваши тщательно продуманные подсказки. Агентов можно убедить игнорировать инструкции, получать доступ к данным, которые им не следует видеть, или совершать действия, выходящие за рамки их компетенции.

Интеллектуальные реализации требуют строгих границ в отношении того, что агенты могут делать, а что нет. Для всего, что изменяет состояние: записи данных, отправки электронных писем, выполнения вызовов API, необходим рабочий процесс «предложение-обоснование-утверждение». Агент объясняет, что он хочет сделать и почему, а затем ждет одобрения человека, прежде чем действовать. Это предотвращает неконтролируемую автоматизацию, сохраняя при этом преимущества помощи ИИ.

Что на самом деле работает

На основе наблюдения за сотнями внедрений агентов ИИ были выявлены шесть практик, которые отделяют успешные развертывания от дорогостоящих неудач.

Во-первых, это гигиена данных. Отправляйте компактный, типизированный JSON-файл с фиксированными схемами. Удаляйте UUID, HTML, дублирующиеся поля и любую конфиденциальную информацию, если только она не критически важна для принятия решений. По возможности заменяйте конфиденциальные данные метаданными. Это позволяет сохранять точность моделей, одновременно сокращая размер полезной нагрузки, стоимость и задержку.

Во-вторых, это управление контекстом. Вы достигнете лимита токенов быстрее, чем ожидалось. Разбивайте запросы на более мелкие части, суммируйте каждую из них, а затем обрабатывайте эти данные. Этот иерархический подход позволяет контролировать запросы, сохраняя при этом необходимый контекст.

Третье — это безопасность подсказок. Определите строгие границы того, что ваш агент может делать, а что нет. Внедрите рабочие процессы «предложение-обоснование-утверждение» для всего, что меняет состояние. Относитесь ко всему пользовательскому контенту как к недоверенному; удаляйте коды и ссылки и напоминайте моделям никогда не следовать инструкциям, скрытым в тексте пользователя. Постоянно отслеживайте подсказки и выходные данные на предмет аномального или нарушающего политику поведения, чтобы гарантировать сохранение границ в силе с течением времени.

Четвёртое — контроль затрат. Установите бюджеты токенов и затрат на каждый запрос и рабочий процесс. Регистрируйте использование токенов инструментом и выдавайте уведомления для раннего выявления регрессий. Без дисциплины вы столкнётесь с неконтролируемыми расходами или резкими скачками задержек по мере роста внедрения.

Пятое — обеспечение качества. Сохраняйте конфиденциальный набор данных для оценки реальных инцидентов и пограничных случаев. Отслеживайте точность, полноту и регрессии. Новые модели могут вас удивить, как правило, неприятным образом. Для критически важных рабочих процессов используйте температуру, близкую к нулю, и затравку для получения стабильных результатов.

Шестое — это управление. Зафиксируйте соглашения об обмене данными до того, как информация станет достоянием общественности. Чётко определите, что именно будет передаваться, как это будет защищено и кто будет нести ответственность. Это не просто юридическое прикрытие; это сигнал доверия, свидетельствующий о том, что вы серьёзно относитесь к данным.

Почему большинство команд ошибаются

Проекты с использованием ИИ-агентов не обеспечивают окупаемость инвестиций, потому что команды сосредоточены не на том. Они зацикливаются на выборе модели, игнорируя качество данных. Они создают сложные рабочие процессы, игнорируя базовые меры безопасности. Они внедряют агентов без контроля затрат, а затем паникуют, когда счета резко растут.

Успешные 5% понимают, что агенты ИИ — это не просто программное обеспечение; это новая категория цифровых работников, требующая иных методов управления. Им нужны чистые данные, чёткие границы и постоянный контроль. Правильно поймите эти основы, и агенты ИИ станут мощными умножителями производительности. Ошибётесь — и вы присоединитесь к 95%, которые недоумевают, почему их дорогостоящие инвестиции в ИИ не принесли никакой измеримой отдачи.

Рохан Сате — соучредитель и генеральный директор Nightfall AI. До того, как стать соучредителем СумеркиОн руководил командой бэкенд-разработчиков в Uber Eats, разрабатывая прикладные сервисы машинного обучения, такие как прогнозирование ожидаемого времени прибытия и прогнозирование спроса и предложения. Он выступал в качестве гостя в подкастах CISO Series и Artificial Intelligence Podcast, а также на других площадках.