Connect with us

Sztuczna inteligencja

OpenAI i Anthropic przedstawiają konkurencyjne modele w miarę zaostrzania się wyścigu zbrojeń w dziedzinie AI

mm

OpenAI i Anthropic opublikowały dziś nowe flagowe modele w odstępie kilku minut, podczas gdy OpenAI jednocześnie uruchomiło platformę agentów dla przedsiębiorstw, a Perplexity wprowadziło wielomodelową funkcję badawczą. Dzisiejsze popołudnie przyniosło więcej znaczących ogłoszeń produktów AI niż większość tygodni łącznie. Oto, co wydano i co to oznacza.

Opus 4.6 od Anthropic: Zespoły agentów i okno kontekstu na milion tokenów

Anthropic wydał Claude Opus 4.6, swój najbardziej zaawansowany model, z dwiema kluczowymi funkcjami: oknem kontekstu na milion tokenów oraz nową możliwością o nazwie Agent Teams. Okno kontekstu jest większym osiągnięciem technicznym. Przy jednym milionie tokenów Opus 4.6 może przetworzyć około 3000 stron tekstu w jednym zapytaniu — to cztery razy więcej niż limit 256 000 tokenów jego poprzednika. W połączeniu z obsługą wyjścia na 128 000 tokenów, model może teraz przyswajać i pracować na całych bazach kodu, dokumentach regulacyjnych lub zbiorach badawczych bez dzielenia na fragmenty lub podsumowywania. Agent Teams, dostępne w Claude Code, pozwala wielu instancjom Claude’a pracować równolegle na wspólnej bazie kodu. Zamiast pojedynczego agenta wykonującego zadania sekwencyjnie, programiści mogą uruchamiać zespoły, w których jeden agent zajmuje się zmianami w interfejsie użytkownika, inny pisze testy, a trzeci refaktoryzuje logikę backendu — wszyscy koordynując pracę nad tym samym projektem jednocześnie. Opus 4.6 wprowadza również adaptacyjne myślenie, które pozwala modelowi kalibrować, ile wysiłku wnioskowania zainwestować w dane zapytanie. Proste pytania otrzymują szybkie odpowiedzi; złożone problemy uruchamiają głębsze, rozszerzone myślenie. Programiści mogą to regulować za pomocą kontroli wysiłku na czterech poziomach: niski, średni, wysoki i maksymalny. W testach porównawczych Opus 4.6 osiąga najwyższe wyniki w Terminal-Bench 2.0 w zakresie agentowego kodowania i prowadzi w Humanity’s Last Exam, złożonej ewaluacji rozumowania. Anthropic twierdzi o 144-punktowej przewadze Elo nad GPT-5.2 w ocenie GDPval-AA i o 190-punktowej poprawie w stosunku do Opus 4.5. Ceny API pozostają niezmienione: 5 USD za milion tokenów wejściowych i 25 USD za milion tokenów wyjściowych, chociaż zapytania przekraczające 200 000 tokenów podlegają wyższej stawce 10/37,50 USD. W znaczącym ruchu skierowanym do przedsiębiorstw, Anthropic ogłosiło podgląd badawczy Claude’a w Microsoft PowerPoint, gdzie model może odczytywać istniejące układy slajdów i szablony oraz generować lub edytować prezentacje, zachowując formatowanie marki.

GPT-5.3-Codex od OpenAI: Model, który pomógł zbudować samego siebie

Kilka minut po ogłoszeniu Anthropic, OpenAI uruchomiło GPT-5.3-Codex, swój najbardziej zaawansowany model do kodowania. Wydanie łączy najwyższą wydajność kodowania GPT-5.2-Codex z możliwościami rozumowania i wiedzą zawodową GPT-5.2 w jeden system, który jest również o 25 procent szybszy.

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją, badającym najnowsze osiągnięcia w tej dziedzinie. Współpracował z licznymi startupami AI i publikacjami na całym świecie.