Искусственный интеллект
OpenAI и Anthropic выпускают дуэльные модели, когда гонка вооружений в области ИИ усиливается

OpenAI и Anthropic выпустили новые флагманские модели в течение нескольких минут друг после друга сегодня, а OpenAI одновременно запустила платформу для корпоративных агентов и Perplexity представила функцию многомодельных исследований. Сегодня было больше значимых объявлений о продуктах ИИ за один послеобеденный период, чем большинство недель производят в общей сложности.
Вот что было выпущено и что это значит.
Anthropic’s Opus 4.6: Команды агентов и окно из одного миллиона токенов
Anthropic выпустила Claude Opus 4.6, свою наиболее способную модель, с двумя основными функциями: окном контекста из одного миллиона токенов и новой возможностью под названием Команды агентов.
Окно контекста является более значительным техническим достижением. При одном миллионе токенов Opus 4.6 может обработать примерно 3 000 страниц текста в одном запросе — в четыре раза больше, чем предел в 256 000 токенов ее предшественника. В сочетании с поддержкой вывода 128 000 токенов модель теперь может принимать и работать с целыми кодовыми базами, нормативными документами или исследовательскими корпусами без фрагментации или суммирования.
Команды агентов, доступные в Claude Code, позволяют нескольким экземплярам Claude работать параллельно над общей кодовой базой. Вместо того, чтобы один агент выполнял задачи последовательно, разработчики могут создавать команды, где один агент обрабатывает изменения в frontend, другой пишет тесты, а третий рефакторит логику backend — все координируя на одном проекте одновременно.
Opus 4.6 также вводит адаптивное мышление, которое позволяет модели калибровать, сколько усилий по рассуждению следует инвестировать в заданный запрос. Простые вопросы получают быстрые ответы; сложные проблемы запускают более глубокое расширенное мышление. Разработчики могут регулировать это через контролы усилий на четырех уровнях: низкий, средний, высокий и максимальный.
На эталонных тестах Opus 4.6 набирает наивысший балл на Terminal-Bench 2.0 для агентного кодирования и лидирует в Humanity’s Last Exam, комплексной оценке рассуждений. Anthropic утверждает, что имеет 144-балльное преимущество Elo над GPT-5.2 на оценке GDPval-AA и 190-балльное улучшение по сравнению с Opus 4.5.
Цены на API остаются неизменными — 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов, хотя запросы, превышающие 200 000 токенов, имеют премиальную ставку 10/37,50 долларов.
В заметном корпоративном шаге Anthropic объявила о исследовательском предпросмотре Claude в Microsoft PowerPoint, где модель может читать существующие макеты и шаблоны слайдов и генерировать или редактировать презентации, сохраняя форматирование бренда.
OpenAI’s GPT-5.3-Codex: Модель, которая помогла построить себя
Через несколько минут после объявления Anthropic OpenAI запустила GPT-5.3-Codex, свою наиболее способную модель кодирования. Выпуск объединяет передовую производительность кодирования GPT-5.2-Codex с возможностями рассуждений и профессиональных знаний GPT-5.2 в одну систему, которая также на 25 процентов быстрее.
Самое заметное утверждение: GPT-5.3-Codex помогла построить себя. Команда Codex OpenAI использовала ранние версии модели во время ее собственного процесса обучения — отладку запусков обучения, управление инфраструктурой развертывания и диагностику результатов оценки. Это первое публичное признание OpenAI того, что модель была инструментальной в своем собственном развитии, веха, которая вызывает вопросы как об эффективности, так и о безопасности.
GPT-5.3-Codex устанавливает новые отраслевые рекорды на SWE-Bench Pro и Terminal-Bench, эталонных тестах, которые оценивают реальные задачи программной инженерии. Модель может обрабатывать долгосрочные задачи, включающие исследования, использование инструментов и сложную обработку, и пользователи могут взаимодействовать с ней в середине задачи без потери контекста — более как сотрудничество с коллегой, чем выдача команд.
Модель доступна сейчас всем платным пользователям ChatGPT через приложение Codex, CLI, расширение IDE и веб-интерфейс. Доступ к API скоро будет доступен.
Для разработчиков, выбирающих генераторы кода ИИ, конкурентная картина теперь четко определена: Opus 4.6 лидирует в координации агентов и работе с длинным контекстом, а GPT-5.3-Codex подчеркивает скорость и интегрированное рассуждение. Обе модели утверждают, что занимают первые места на перекрывающихся эталонных тестах, и инструменты, такие как Cursor и Apple’s Xcode, поддерживают обе модели, поэтому разработчики могут переключаться свободно.
OpenAI Frontier: Корпоративные агенты получают свою собственную платформу
Вместе с запуском модели OpenAI представила Frontier, корпоративную платформу для построения, развертывания и управления агентами ИИ. Frontier подключается к базам данных, системам CRM, платформам HR, инструментам поддержки и другим бизнес-приложениям, а затем позволяет агентам ИИ выполнять процессы в них.
OpenAI описала Frontier как “семантический слой для корпорации”, где сотрудники-люди и агенты ИИ работают на одной платформе с общим доступом к данным и контролями безопасности. Агентам присваиваются идентификаторы, подобные идентификаторам сотрудников, общий контекст организации и разрешения корпоративного класса.
Платформа является модельно-агностической — компании могут управлять агентами, построенными на моделях OpenAI, вместе с моделями от Google, Microsoft и Anthropic. Первоначальными клиентами являются Intuit, State Farm, Thermo Fisher и Uber.
Frontier позиционирует OpenAI для прямой конкуренции с корпоративными платформами, такими как Agentforce от Salesforce и агенты ИИ от ServiceNow. Разница: OpenAI строит с уровня модели и выше, в то время как действующие компании добавляют ИИ к существующим инструментам рабочего процесса. Будут ли корпорации предпочитать свою инфраструктуру агентов от поставщика ИИ или от поставщика программного обеспечения, определит конкуренцию в области корпоративного ИИ в 2026 году.
Perplexity’s Model Council: Три модели, один ответ
Perplexity запустила Model Council, функцию, которая запускает один и тот же запрос на трех моделях одновременно — Claude Opus, GPT и Gemini — а затем использует модель-синтезатор для объединения их выводов в один ответ, который помечает области согласия и несогласия.

Изображение: Perplexity
Предпосылка заключается в том, что ни одна модель не является надежно лучшей во всех запросах. Когда три передовые модели сходятся на один и тот же ответ, уверенность высока. Когда они расходятся, пользователи знают, что следует провести дальнейшее расследование. Model Council доступна подписчикам Max и позиционируется для инвестиционных исследований, стратегического анализа и принятия сложных решений.
Функция отражает стратегию Perplexity по дифференцированию через многомодельную оркестрацию, а не построение фундаментальных моделей. Поскольку разрыв между передовыми чат-ботами ИИ сужается на отдельных эталонных тестах, агрегирование их выводов может оказаться более ценным, чем выбор одного поставщика.
Что все это значит
Эти выпуски подтверждают, что конкуренция в области ИИ сместилась от возможностей модели к инфраструктуре продукта. И OpenAI, и Anthropic имеют модели, которые занимают первые места на одних и тех же эталонных тестах; дифференциация теперь заключается в том, что можно построить на их основе.
Perplexity, тем временем, делает тихий аргумент, что войны моделей могут быть менее важными, чем то, как вы объединяете модели. Если Model Council окажется полезной, это предполагает, что будущее не в выборе между Claude и GPT — а в использовании обоих.
Для разработчиков и корпораций, оценивающих свою стек ИИ, это только что сделало решение более трудным.












