Connect with us

OpenAI a Anthropic vydávají dueling modely, zatímco se intenzivně zvyšuje závod ve vývoji umělé inteligence

Umělá inteligence

OpenAI a Anthropic vydávají dueling modely, zatímco se intenzivně zvyšuje závod ve vývoji umělé inteligence

mm

OpenAI a Anthropic vydaly nové vlajkové modely ve stejnou chvíli, zatímco OpenAI současně spustila podnikový agentní platformu a Perplexity představila funkci multi-modelového výzkumu. Dnes bylo oznámeno více významných produktů umělé inteligence než obvykle za celý týden.

Tady je to, co bylo vydáno a co to znamená.

Anthropic’s Opus 4.6: Agent Teams a milion-tokenové okno

Anthropic vydala Claude Opus 4.6, svůj nejvýkonnější model, se dvěma hlavními funkcemi: milion-tokenovým kontextovým oknem a novou funkcí nazvanou Agent Teams.

Kontextové okno je větším technickým úspěchem. S milionem tokenů může Opus 4.6 zpracovat přibližně 3 000 stránek textu v jednom.promptu — čtyřnásobek 256 000 tokenů omezení jeho předchůdce. V kombinaci se 128 000 tokenů výstupní podporou může model nyní přijímat a pracovat s celými kódy, regulatorními podáními nebo výzkumnými korpusy bez chunkingu nebo sumarizace.

Agent Teams, dostupné v Claude Code, umožňují několika instancím Claude pracovat paralelně na sdíleném kódu. Místo toho, aby jeden agent prováděl úkoly sekvenčně, mohou vývojáři spustit týmy, kde jeden agent provádí změny frontendu, druhý píše testy a třetí refaktoruje logiku backendu — všechny současně na stejném projektu.

Opus 4.6 také představuje adaptivní myšlení, které umožňuje modelu kalibrovat, kolik úsilí věnovat danému promptu. Jednoduché otázky dostanou rychlé odpovědi; složitým problémům je věnováno hlubší prodloužené myšlení. Vývojáři mohou tuto funkci upravit pomocí ovládacích prvků na čtyřech úrovních: nízká, střední, vysoká a maximální.

V benchmarkách Opus 4.6 dosahuje nejvyššího skóre v Terminal-Bench 2.0 pro agentic kódování a vede Humanity’s Last Exam, komplexní hodnocení rozumného myšlení. Anthropic prohlašuje 144 bodový Elo náskok nad GPT-5.2 na GDPval-AA hodnocení a 190 bodový zlepšení oproti Opus 4.5.

Ceny API zůstávají beze změny na 5 dolarů za milion vstupních tokenů a 25 dolarů za milion výstupních tokenů, i když prompty přesahující 200 000 tokenů jsou zpoplatněny sazbou 10/37,50 dolarů.

V významném podnikovém kroku Anthropic oznámila výzkumnou verzi Claude v Microsoft PowerPoint, kde může model číst existující rozložení a šablony prezentací a generovat nebo upravovat prezentace, přičemž zachovává formátování značky.

OpenAI’s GPT-5.3-Codex: Model, který si sám pomohl

Minuty po oznámení Anthropic OpenAI spustila GPT-5.3-Codex, svůj nejvýkonnější kódovací model. Tento release sjednocuje hranici kódování GPT-5.2-Codex s možnostmi rozumného myšlení a profesních znalostí GPT-5.2 do jednoho systému, který je také o 25 procent rychlejší.

Nejdůležitější tvrzení: GPT-5.3-Codex si sám pomohl. Tým OpenAI Codex použil rané verze modelu během jeho vlastního tréninkového procesu — ladění tréninkových běhů, správy nasazení infrastruktury a diagnostiky výsledků hodnocení. Je to první veřejné uznání OpenAI, že model sehrál významnou roli ve svém vlastním vývoji, což je milník, který vyvolává otázky o efektivitě a bezpečnosti.

GPT-5.3-Codex dosahuje nových průmyslových maxim na SWE-Bench Pro a Terminal-Bench, benchmarcích, které hodnotí reálné úkoly softwarového inženýrství. Model může zpracovat dlouhodobé úkoly zahrnující výzkum, použití nástrojů a komplexní provádění, a uživatelé mohou interagovat s ním uprostřed úkolu bez ztráty kontextu — více jako spolupráce s kolegou než vydávání příkazů.

Model je nyní k dispozici všem uživatelům placených plánů ChatGPT prostřednictvím aplikace Codex, CLI, IDE rozšíření a webového rozhraní. Přístup k API brzy bude k dispozici.

Pro vývojáře, kteří volí mezi generátory kódu AI, je nyní jasný konkurenční obraz: Opus 4.6 vede v koordinaci agentů a dlouhém kontextovém zpracování, zatímco GPT-5.3-Codex zdůrazňuje rychlost a integrované rozumné myšlení. Oba modely prohlašují nejvyšší hodnocení na překrývajících se benchmarcích, a nástroje jako Cursor a Apple’s Xcode podporují oba, takže vývojáři mohou mezi nimi volně přecházet.

OpenAI Frontier: Podnikoví agenti získávají svou vlastní platformu

Spolu s vydáním modelu OpenAI představila Frontier, podnikovou platformu pro vytváření, nasazování a správu agentů AI. Frontier se připojuje k databázím, systémům CRM, platformám HR, nástrojům pro ticketing a dalším podnikovým aplikacím, a poté umožňuje agentům AI provádět procesy napříč nimi.

OpenAI popsala Frontier jako “sémantickou vrstvu pro podnik” kde lidské zaměstnance a agenty AI pracují na stejné platformě se sdíleným přístupem k datům a bezpečnostními kontrolami. Agenti získávají identitu podobnou zaměstnancům, sdílený organizační kontext a podnikové oprávnění.

Platforma je modelově nezávislá — společnosti mohou spravovat agenty postavené na modelech OpenAI spolu s těmi od Google, Microsoftu a Anthropic. První zákazníci zahrnují Intuit, State Farm, Thermo Fisher a Uber.

Frontier позициuje OpenAI, aby přímo soutěžila s podnikovými platformami, jako je Salesforce’s Agentforce a ServiceNow’s AI agenty. Rozdíl spočívá v tom, že OpenAI buduje od vrstvy modelu nahoru, zatímco zavedené společnosti přidávají AI do stávajících nástrojů pro pracovní postupy. Zda podniky preferují svou agentní infrastrukturu od svého poskytovatele AI nebo softwarového dodavatele, bude definovat podnikovou soutěž v oblasti AI v roce 2026.

Perplexity’s Model Council: Tři modely, jedna odpověď

Perplexity představila Model Council, funkci, která spouští stejný dotaz napříč třemi modely současně — Claude Opus, GPT a Gemini — a poté používá syntetizátorový model pro sjednocení jejich výstupů do jediné odpovědi, která označuje oblasti souhlasu a nesouhlasu.

Image: Perplexity

Předpokladem je, že žádný jediný model není spolehlivě nejlepší napříč všemi dotazy. Když se tři modely shodnou na stejné odpovědi, je jistota vysoká. Když se liší, uživatelé vědí, že je třeba dále prošetřit. Model Council je k dispozici pro předplatitele Max a je zaměřen na investiční výzkum, strategickou analýzu a komplexní rozhodování.

Tato funkce odráží strategii Perplexity diferencovat se prostřednictvím multi-modelové orchestrace spíše než budování základních modelů. Jak se mezera mezi modely AI na jednotlivých benchmarcích zmenšuje, může být agregace jejich výstupů více cenná než výběr jediného poskytovatele.

Co to všechno znamená

Tyto vydání potvrzují, že soutěž v oblasti AI se přesunula z modelové schopnosti na produktovou infrastrukturu. Oba OpenAI a Anthropic mají modely, které vedou stejné benchmarky; diferenciace nyní spočívá v tom, co můžete postavit na nich.

Perplexity, mezitím, činí tichou argumentaci, že války modelů mohou být méně důležité než to, jak kombinujete modely. Pokud Model Council prokáže svou užitečnost, naznačuje to, že budoucnost není o výběru mezi Claude a GPT — ale o používání obou.

Pro vývojáře a podniky, které vyhodnocují svou AI sadu, to právě стало mnohem složitější.

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s mnoha AI startupy a publikacemi po celém světě.