Штучний інтелект
OpenAI і Anthropic випустили дуельні моделі, оскільки гонка озброєнь у сфері штучного інтелекту посилюється

OpenAI і Anthropic випустили нові флагманські моделі за хвилини один від одного сьогодні, тоді як OpenAI одночасно запустила платформу для підприємств та Perplexity представила функцію багатомодельних досліджень. Сьогодні було оголошено більше значимих оголошень про продукти штучного інтелекту за один післяобідень, ніж за весь тиждень.
Ось, що було випущено та що це означає.
Anthropic’s Opus 4.6: Команди агентів та вікно з мільйоном токенів
Anthropic випустив Claude Opus 4.6, свою найбільш здатну модель, з двома основними функціями: вікном контексту з одним мільйоном токенів та новою можливістю під назвою Команди агентів.
Вікно контексту – це більше технічне досягнення. За один мільйон токенів Opus 4.6 може обробляти приблизно 3 000 сторінок тексту в одному запиту – у чотири рази більше, ніж 256 000-токенний ліміт її попередниці. У поєднанні з підтримкою виводу 128 000 токенів модель тепер може приймати та працювати з цілими кодовими базами, нормативними файлами або корпусами досліджень без фрагментації чи підсумовування.
Команди агентів, доступні в Claude Code, дозволяють декільком екземплярам Claude працювати паралельно над спільною кодовою базою. Замість того, щоб один агент виконував завдання послідовно, розробники можуть створити команди, де один агент обробляє зміни в інтерфейсі, інший пише тести, а третій рефакторить логіку бекенду – все це координується на одному проєкті одночасно.
Opus 4.6 також вводить адаптивне мислення, яке дозволяє моделі налаштовувати рівень зусиль, які вона вкладає у заданий запит. Прості питання отримують швидкі відповіді; складні проблеми спрацьовують глибоке розширення мислення. Розробники можуть налаштовувати це через контроли зусиль на чотирьох рівнях: низький, середній, високий та максимальний.
На бенчмарках Opus 4.6 займає перше місце на Terminal-Bench 2.0 за агентське кодування та лідирує в Humanity’s Last Exam, складному оцінюванні мислення. Anthropic заявляє про 144-бальну перевагу Elo над GPT-5.2 на оцінюванні GDPval-AA та про покращення на 190 пунктів порівняно з Opus 4.5.
Ціни на API залишаються незмінними – 5 доларів за мільйон вхідних токенів та 25 доларів за мільйон вихідних токенів, хоча запити, які перевищують 200 000 токенів, мають преміальну ставку 10/37,50 доларів.
У помітному підприємстві Anthropic оголосив про дослідницький попередній перегляд Claude в Microsoft PowerPoint, де модель може читати існуючі макети слайдів та шаблони та генерувати чи редагувати презентації, зберігаючи форматування бренду.
OpenAI’s GPT-5.3-Codex: Модель, яка допомогла побудувати себе
Хвилини після оголошення Anthropic, OpenAI випустив GPT-5.3-Codex, свою найбільш здатну модель кодування. Випуск об’єднує передові можливості кодування GPT-5.2-Codex з можливостями мислення та професійних знань GPT-5.2 в одну систему, яка також на 25% швидша.
Найбільш помітна заява: GPT-5.3-Codex допомогла побудувати себе. Команда Codex OpenAI використовувала ранні версії моделі під час її власного процесу навчання – налагодження навчальних запусків, управління інфраструктурою розгортання та діагностику результатів оцінювання. Це перше публічне визнання OpenAI того, що модель була інструментальною у своєму власному розвитку, що піднімає як питання ефективності, так і питання безпеки.
GPT-5.3-Codex встановлює нові промислові рекорди на SWE-Bench Pro та Terminal-Bench, бенчмарках, які оцінюють реальні завдання інженерії програмного забезпечення. Модель може обробляти довготривалі завдання, що включають дослідження, використання інструментів та складне виконання, а користувачі можуть взаємодіяти з нею в середині завдання без втрати контексту – більше, як співпраця з колегою, ніж видача команд.
Модель доступна зараз усім користувачам платних планів ChatGPT через додаток Codex, CLI, розширення IDE та веб-інтерфейс. Доступ до API скоро з’явиться.
Для розробників, які вибирають між генераторами коду штучного інтелекту, конкурентна картина тепер чітко визначена: Opus 4.6 лідирує за координацією агентів та довготривалим контекстом, тоді як GPT-5.3-Codex підкреслює швидкість та інтегроване мислення. Обидва претендують на найвищі оцінки на перекриваються бенчмарках, а інструменти, такі як Cursor та Apple’s Xcode, підтримують обидва, тому розробники можуть вільно перемикатися.
OpenAI Frontier: Підприємства отримують свою власну платформу
Разом із запуском моделі OpenAI представив Frontier, підприємницьку платформу для побудови, розгортання та управління агентами штучного інтелекту. Frontier підключається до баз даних, систем CRM, платформ HR, інструментів 티кетингу та інших бізнес-застосунків, а потім дозволяє агентам штучного інтелекту виконувати процеси по всім цим застосункам.
OpenAI описав Frontier як “семантичний шар для підприємства”, де люди та агенти штучного інтелекту працюють на одній платформі з спільним доступом до даних та контролями безпеки. Агенти отримують ідентифікатори, подібні до тих, що мають працівники, спільний організаційний контекст та підприємницькі дозволи.
Платформа є агностичною до моделі – компанії можуть керувати агентами, побудованими на моделях OpenAI, поряд з тими, які походять від Google, Microsoft та Anthropic. Першими клієнтами є Intuit, State Farm, Thermo Fisher та Uber.
Frontier позиціонує OpenAI для прямої конкуренції з підприємницькими платформами, такими як Salesforce’s Agentforce та ServiceNow’s AI агенти. Різниця: OpenAI будує з шару моделей, тоді як чинні компанії додають штучний інтелект до існуючих інструментів робочого процесу. Чи підприємства віддають перевагу інфраструктурі агентів від свого постачальника штучного інтелекту чи від свого постачальника програмного забезпечення, визначить конкуренцію у сфері підприємницького штучного інтелекту в 2026 році.
Perplexity’s Model Council: Три моделі, один відповідь
Perplexity випустив Model Council, функцію, яка запускає один і той же запит через три моделі одночасно – Claude Opus, GPT та Gemini – а потім використовує синтезаторну модель для об’єднання їх виводів у один відповідь, який позначає області згоди та розбіжності.

Image: Perplexity
Презумпція полягає в тому, що жодна окрема модель не є надійно найкращою для всіх запитів. Коли три передові моделі сходяться на одному й тому ж відповіді, довіра висока. Коли вони розходяться, користувачі знають, що слід进一步 дослідити. Model Council доступний усім підписникам Max та позиціонується для інвестиційного дослідження, стратегічного аналізу та складного прийняття рішень.
Функція відображає стратегію Perplexity щодо диференціації через багатомодельну оркестрацію, а не побудову фундаментальних моделей. Коли розрив між передовими чат-ботами штучного інтелекту звужується на окремих бенчмарках, агрегування їх виводів може виявитися більш цінним, ніж вибір одного постачальника.
Що все це означає
Ці випуски підтверджують, що конкуренція у сфері штучного інтелекту перейшла від можливостей моделей до інфраструктури продукту. Як OpenAI, так і Anthropic мають моделі, які займають перше місце на одних і тих же бенчмарках; диференціація тепер існує в тому, що можна побудувати на їх основі.
Perplexity, тим часом, робить тихе твердження, що війни моделей можуть бути менш важливими, ніж те, як їх об’єднувати. Якщо Model Council виявиться корисним, це свідчить про те, що майбутнє не полягає у виборі між Claude та GPT – а у використанні обидвох.
Для розробників та підприємств, які оцінюють свій стек штучного інтелекту, це тільки ускладнило рішення.












