Inteligență artificială

OpenAI și Anthropic lansează modele duale, în timp ce războiul armelor IA se intensifică

mm

OpenAI și Anthropic au lansat noi modele de referință în aceeași zi, la câteva minute distanță, în timp ce OpenAI a lansat simultan o platformă de agenți pentru întreprinderi și Perplexity a introdus o funcție de cercetare multi-model. Astăzi au fost anunțate mai multe produse și servicii IA semnificative într-un singur după-amiază decât în majoritatea săptămânilor.

Iată ce s-a lansat și ce înseamnă.

Anthropic’s Opus 4.6: Echipe de agenți și o fereastră de un milion de tokeni

Anthropic a lansat Claude Opus 4.6, cel mai capabil model, cu două funcții principale: o fereastră de context de un milion de tokeni și o nouă capacitate numită Echipe de agenți.

Fereastra de context este realizarea tehnică mai importantă. La un milion de tokeni, Opus 4.6 poate procesa aproximativ 3.000 de pagini de text într-o singură promptă — de patru ori mai mult decât limita de 256.000 de tokeni a predecesorului său. În combinație cu suportul de ieșire de 128.000 de tokeni, modelul poate acum ingera și lucra cu întregi coduri sursă, depozite de reglementare sau corpuri de cercetare fără a fi nevoie de fragmentare sau rezumare.

Echipele de agenți, disponibile în Claude Code, permit mai multor instanțe Claude să lucreze în paralel pe o bază de cod comună. În loc de a avea un singur agent care execută sarcini secvențial, dezvoltatorii pot crea echipe în care un agent se ocupă de modificările frontend, altul scrie teste, iar al treilea reface logica backend — toate coordonându-se pe același proiect în același timp.

Opus 4.6 introduce, de asemenea, gândirea adaptivă, care permite modelului să ajusteze efortul de raționament pe care îl investește într-o anumită promptă. Întrebările simple primesc răspunsuri rapide; problemele complexe declanșează gândire extinsă. Dezvoltatorii pot ajusta acest parametru prin controale de efort pe patru niveluri: scăzut, mediu, ridicat și maxim.

La benchmark-uri, Opus 4.6 obține cel mai bun scor la Terminal-Bench 2.0 pentru codificarea agenților și conduce la examenul complex de raționament al omenirii. Anthropic afirmă o avantajoasă de 144 de puncte Elo față de GPT-5.2 la evaluarea GDPval-AA și o îmbunătățire de 190 de puncte față de Opus 4.5.

Prețurile API rămân neschimbate la 5 dolari pe milion de tokeni de intrare și 25 de dolari pe milion de tokeni de ieșire, deși promptele care depășesc 200.000 de tokeni sunt supuse unui tarif premium de 10/37,50 dolari.

Într-o mișcare notabilă la nivel de întreprindere, Anthropic a anunțat o previzualizare a cercetării Claude în Microsoft PowerPoint, unde modelul poate citi layout-urile și șablonurile de diapozitive existente și poate genera sau edita prezentări, păstrând formatarea mărcii.

OpenAI’s GPT-5.3-Codex: Modelul care și-a ajutat la construirea sa

La câteva minute după anunțul Anthropic, OpenAI a lansat GPT-5.3-Codex, cel mai capabil model de codificare. Lansarea unifică performanța de codificare de frontieră a GPT-5.2-Codex cu capacitățile de raționament și cunoștințe profesionale ale GPT-5.2 într-un singur sistem care este, de asemenea, cu 25% mai rapid.

Cea mai remarcabilă afirmație: GPT-5.3-Codex și-a ajutat la construirea sa. Echipa Codex de la OpenAI a folosit versiuni timpurii ale modelului în timpul procesului de antrenament — depanarea execuțiilor de antrenament, gestionarea infrastructurii de implementare și diagnosticarea rezultatelor evaluării. Acesta este primul anunț public al OpenAI că un model a fost instrumental în dezvoltarea sa, un moment important care ridică atât întrebări de eficiență, cât și de siguranță.

GPT-5.3-Codex stabilește noi recorduri ale industriei la SWE-Bench Pro și Terminal-Bench, benchmark-uri care evaluează sarcinile de inginerie software din lumea reală. Modelul poate gestiona sarcini cu rulare lungă care implică cercetare, utilizarea unor instrumente și execuții complexe, iar utilizatorii pot interacționa cu el în timpul sarcinii fără a pierde contextul — mai mult ca atunci când lucrează cu un coleg decât atunci când emit comenzi.

Modelul este disponibil acum pentru toți utilizatorii planurilor plătite ChatGPT prin aplicația Codex, CLI, extensia IDE și interfața web. Accesul API va fi disponibil în curând.

Pentru dezvoltatorii care aleg între generatoare de cod AI, imaginea competitivă este acum clar definită: Opus 4.6 conduce la coordonarea agenților și la lucrul cu contexte lungi, în timp ce GPT-5.3-Codex subliniază viteza și raționamentul integrat. Ambele revendică punctaje maxime la benchmark-uri suprapuse, iar unelte precum Cursor și Xcode-ul Apple suportă ambele, astfel încât dezvoltatorii pot comuta liber între ele.

OpenAI Frontier: Agenții pentru întreprinderi primesc propria platformă

Alături de lansarea modelului, OpenAI a introdus Frontier, o platformă de întreprindere pentru crearea, implementarea și gestionarea agenților IA. Frontier se conectează la baze de date, sisteme CRM, platforme HR, unelte de ticketing și alte aplicații de afaceri, apoi permite agenților IA să execute procese de-a lungul lor.

OpenAI a descris Frontier ca o “strat semantică pentru întreprindere” unde angajații umani și agenții IA operează pe aceeași platformă cu acces comun la date și controale de securitate. Agenții primesc identități similare cu cele ale angajaților, context organizațional comun și permisiuni de nivel întreprindere.

Platforma este agnostică față de model — companiile pot gestiona agenți construiți pe modelele OpenAI alături de cei de la Google, Microsoft și Anthropic. Clienții inițiali includ Intuit, State Farm, Thermo Fisher și Uber.

Frontier poziționează OpenAI pentru a concura direct cu platformele de întreprindere precum Agentforce de la Salesforce și agenții IA de la ServiceNow. Diferența: OpenAI construiește de la nivelul modelului, în timp ce competitorii adaugă IA unor unelte de flux de lucru existente. Întrebarea dacă întreprinderile preferă infrastructura de agenți de la furnizorul de IA sau de la vendorul de software va defini competiția IA de întreprindere în 2026.

Perplexity’s Model Council: Trei modele, un singur răspuns

Perplexity a lansat Model Council, o funcție care rulează aceeași interogare peste trei modele simultan — Claude Opus, GPT și Gemini — apoi folosește un model de sinteză pentru a reconcilia ieșirile lor într-un singur răspuns care marchează zonele de acord și dezacord.

Imagine: Perplexity

Premisa este că niciun singur model nu este în mod fiabil cel mai bun pentru toate interogările. Când trei modele de frontieră converg către același răspuns, încrederea este ridicată. Când diverg, utilizatorii știu că trebuie să investigheze mai departe. Model Council este disponibil pentru abonații Max și este poziționat pentru cercetarea de investiții, analiza strategică și luarea deciziilor complexe.

Funcția reflectă strategia Perplexity de a se diferenția prin orchestrarea multi-model, mai degrabă decât prin construirea de modele de bază. Pe măsură ce gap-ul dintre modelele de frontieră de chatbot IA se îngustează la benchmark-uri individuale, agregarea ieșirilor lor poate dovedi a fi mai valoroasă decât alegerea unui singur furnizor.

Ce înseamnă toate acestea

Aceste lansări confirmă faptul că competiția IA s-a mutat de la capacitatea modelului la infrastructura de produs. Atât OpenAI, cât și Anthropic au modele care se situează în fruntea acelorași benchmark-uri; diferențierea trăiește acum în ceea ce poți construi deasupra lor.

Perplexity, între timp, face o argumentație tăcută că războaiele modelului pot fi mai puțin importante decât modul în care combini modelele. Dacă Model Council se dovedește util, sugerează că viitorul nu constă în alegerea între Claude și GPT — ci în utilizarea ambelor.

Pentru dezvoltatori și întreprinderi care evaluează stiva lor de IA, aceasta a făcut decizia și mai dificilă.

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.