Connect with us

Личность вашего ИИ имеет такое же значение, как и его IQ — и будет определять или разрушать корпоративное развертывание

Лидеры мнений

Личность вашего ИИ имеет такое же значение, как и его IQ — и будет определять или разрушать корпоративное развертывание

mm
A woman and a man standing on a high-rise balcony looking at a glowing data visualization that blends sharp blue geometric lines with soft amber waves, symbolizing the balance between AI benchmarks and personality.

Большинство компаний по-прежнему выбирают модели ИИ на основе бенчмарков. На практике это редко определяет, работают ли эти системы на самом деле.

До сих пор большинство разговоров о больших языковых моделях в корпоративных средах были доминирующими бенчмарками. Команды тяготеют к измеримым показателям производительности, таким как какая модель является наиболее интеллектуальной, самой сильной в кодировании, наиболее точной в суммировании или математическом рассуждении.

Но когда команды начинают выходить за рамки экспериментальной фазы и погружаться в фактическое развертывание в крупном масштабе, другие важные факторы, которые в настоящее время сильно упускаются из виду большинством генеральных директоров, быстро окажутся столь же важными для успеха бизнеса.

Наемность ИИ

Сырая интеллект и аналитическая способность, конечно, важны, но самая недооцененная переменная в корпоративном развертывании ИИ — это личность. Личность, в контексте больших языковых моделей, относится к последовательному голосу, тону и поведению, которое модель передает через взаимодействия. Это то, что делает ИИ чувствовать себя связным и надежным.

Когда вы реализуете ИИ, бизнесу необходимо подойти к этому так же, как и при приеме на работу человека: оценить не только то, насколько хорошо модель может выполнить задачу, но и ее отношение к работе, как она общается и как она вписывается в более крупный рабочий процесс.

Способность модели поддерживать последовательность, реагировать соответствующим образом и обрабатывать нюансы в разных контекстах может иметь значительное влияние на результаты бизнеса. Технически блестящий ИИ, который реагирует медленно, меняет тон или неправильно обрабатывает нюансовые взаимодействия, может быть неправильно применен бизнесом, раздражая пользователей, снижая вовлеченность и в конечном итоге снижая эффективность ИИ и успех бизнеса.

Это особенно важно в отраслях, таких как поддержка клиентов, политический охват или внутренние коммуникации, поскольку тонкие сдвиги в тоне или формулировке между ответами могут вызвать путаницу, подорвать доверие и снизить общую вовлеченность. Как и в случае с людьми, не существует единой идеальной модели, которая превосходит конкурентов в каждой категории. Некоторые модели лучше выполняют аналитические задачи, такие как кодирование или математика, в то время как другие выполняют задачи намного лучше, такие как разговорное письмо и суммирование встреч.

Но одной из проблем для команд, строящих на основе этих систем, является то, что эти характеристики не фиксированы.

Двигающаяся мишень

Ландшафт ИИ развивается быстрее, чем большинство организаций могут за ним поспевать. Новые версии выпускаются часто, и характеристики производительности могут измениться от одной обновления к другой. Серия моделей Gemini от Google является недавним примером.

Gemini 2.0 Pro был выпущен в феврале 2025 года и сразу же был объявлен флагманской моделью для разработчиков и предприятий, использующих его для кодирования и сложных запросов во всем мире.

Он был оснащен на тот момент самой большой контекстной окном, которую когда-либо предлагала Google, — два миллиона токенов, что давало ему возможность всесторонне анализировать и понимать огромные объемы информации одновременно, а также использовать инструменты, такие как Google Search, и даже писать код.

Для команд, строящих системы, которым необходимо быстро и точно обрабатывать большие объемы данных, он казался очевидным выбором. Но уже через несколько недель Google выпустил Gemini 2.5 Pro, который сразу же обогнал своего предшественника с улучшениями в кодировании, математике и науке.

За одну ночь модель, которая только что была лучшим вариантом на рынке, уже была заменена менее чем через два месяца после запуска. Но ранние采用ющие сразу же заметили, что изменения не были просто инкрементальными или аналитическими — личность Gemini полностью изменилась за одну ночь. Несколько разработчиков даже заявили, что ИИ вел себя так, как будто он был «лоботомирован» после обновления.

Они жаловались на то, что ИИ, казалось, «становился глупее» — последовательно производя более медленные ответы, менее связные выходные данные и демонстрируя несоответствия в обработке запросов, с которыми он ранее не имел проблем, и задач, которые когда-то казались плавными, внезапно стали жесткими.

И это то место, где стратегия компании вокруг развертывания ИИ начинает фундаментально меняться.

За пределами бенчмарков

На бумаге Gemini 2.5 Pro должен был быть явным победителем с его огромными улучшениями в возможностях и безопасности.

Но на практике эти изменения полностью изменили то, насколько надежной была модель, как она себя вела, реагировала на запросы и, в свою очередь, отправили команды, которые только что потратили целое состояние и провели бесчисленные часы, строя вокруг этих систем, обратно на старт, если новые возможности модели не соответствовали их существующему конвейеру.

Даже небольшие сдвиги в поведении могут нарушить системы, построенные на основе последовательности и предсказуемости. Это создает реальный операционный риск, если бизнес тесно связан с одной моделью, поскольку любое обновление может ввести немедленную нестабильность в команды, полагающиеся на эти системы.

Чтобы бороться с этим, многие прогрессивные компании начали реализовывать многомодельную стратегию, где они маршрутизируют разные задачи к моделям, наиболее подходящим для них, а не полагаются на одну модель для обработки всего.

Этот подход не только улучшает производительность, адаптированную к каждой задаче, но также снижает риск, связанный с реализацией ИИ, поскольку, если одна модель ухудшится после обновления, она не приведет к падению всей системы, полагающейся на нее, поскольку есть резервные варианты.

Просто говоря, личность ИИ и надежность столь же важны, как и его сырой интеллект, когда речь идет о применении модели в рабочей среде для выполнения различных задач. Этот сдвиг в мышлении представляет собой фундаментальное изменение в том, как бизнес больше не просто покупает «умный инструмент», а строит и управляет всей цифровой инфраструктурной системой.

Чтобы компании не только выжили, но и процветали в сегодняшнем бизнес-ландшафте, командам необходимо создать конвейеры, которые могут подключать и отключать разные модели в зависимости от задачи и постоянно отслеживать, как обновления влияют на производительность и качество взаимодействия.

В конечном итоге модели сами будут продолжать развиваться в темпе, который трудно поддерживать. Но бизнес, который планирует изменения, строит резервность и относиться к ИИ как к инструменту и члену команды, будет тем, кто превратит эти быстрые сдвиги в конкурентное преимущество.

Эндрю Мисси является сооснователем Convos, ранее PubSent, двухсторонней платформы обмена сообщениями на основе ИИ, которая помогает политическим стратегам, кампаниям, некоммерческим организациям и группам защиты интересов проводить персонализированные, основанные на фактах разговоры с избирателями в национальном масштабе, где он руководит продуктом и инженерией. До Convos Эндрю работал в качестве программного инженера в нескольких компаниях, включая стартап на основе ИИ в Сиэтле, обслуживающий национальные бренды пищевой промышленности и розничной торговли, такие как Starbucks, Crumbl и Mod Pizza. Кроме того, Эндрю свободно владеет Javascript, Python и Typescript.