Connect with us

OpenAI și Anthropic Lansează Modele Duale în Contextul În care Cursele de Armament din Domeniul Inteligenței Artificiale Se Intensifică

Inteligență artificială

OpenAI și Anthropic Lansează Modele Duale în Contextul În care Cursele de Armament din Domeniul Inteligenței Artificiale Se Intensifică

mm

OpenAI și Anthropic au lansat noi modele steag în aceeași zi, la câteva minute distanță, în timp ce OpenAI a lansat simultan o platformă de agenți pentru întreprinderi, iar Perplexity a introdus o funcție de cercetare multi-model. Astăzi, s-au făcut mai multe anunțuri semnificative despre produsele de inteligență artificială într-un singur după-amiază decât în majoritatea săptămânilor.

Iată ce s-a lansat și ce înseamnă.

Opus 4.6 al Anthropic: Echipe de Agenți și o Fereastră de Un Million de Tokeni

Anthropic a lansat Claude Opus 4.6, cel mai capabil model, cu două funcții principale: o fereastră de context de un million de tokeni și o nouă capacitate numită Echipe de Agenți.

Fereastra de context este realizarea tehnică mai importantă. La un million de tokeni, Opus 4.6 poate procesa aproximativ 3.000 de pagini de text într-o singură solicitare — de patru ori mai mult decât limita de 256.000 de tokeni a predecesorului său. În combinație cu suportul de ieșire de 128.000 de tokeni, modelul poate acum ingera și lucra cu întregi coduri sursă, depuneri de reglementare sau corpuri de cercetare fără a fi nevoie de fragmentare sau rezumare.

Echipe de Agenți, disponibile în Claude Code, permit mai multor instanțe Claude să lucreze în paralel pe o bază de cod comună. În loc ca un singur agent să execute sarcini în mod secvențial, dezvoltatorii pot crea echipe în care un agent se ocupă de modificările frontend, altul scrie teste, iar al treilea reface logica backend — toate coordonându-se pe același proiect în același timp.

Opus 4.6 introduce, de asemenea, gândirea adaptivă, care permite modelului să calibreze cât efort de raționament să investească într-o anumită solicitare. Întrebările simple primesc răspunsuri rapide; problemele complexe declanșează gândire extinsă mai profundă. Dezvoltatorii pot ajusta acest lucru prin controale de efort pe patru niveluri: scăzut, mediu, ridicat și maxim.

La benchmark-uri, Opus 4.6 obține cel mai bun scor la Terminal-Bench 2.0 pentru codare agentică și conduce examenul complex de raționament al Umanității. Anthropic afirmă o avantajoasă de 144 de puncte Elo față de GPT-5.2 la evaluarea GDPval-AA și o îmbunătățire de 190 de puncte față de Opus 4.5.

Prețurile API rămân neschimbate la 5 dolari pe milion de tokeni de intrare și 25 de dolari pe milion de tokeni de ieșire, deși solicitările care depășesc 200.000 de tokeni sunt supuse unui tarif premium de 10/37,50 dolari.

Într-o mișcare notabilă la nivel de întreprindere, Anthropic a anunțat o previzualizare a cercetării pentru Claude în Microsoft PowerPoint, unde modelul poate citi layout-urile și șablonurile de slide existente și poate genera sau edita prezentări, păstrând formatul mărcii.

GPT-5.3-Codex al OpenAI: Modelul Care și-a Ajutat la Construirea sa Însuși

La câteva minute după anunțul Anthropic, OpenAI a lansat GPT-5.3-Codex, cel mai capabil model de codare. Lansarea unifică performanța de codare de ultimă generație a GPT-5.2-Codex cu capacitățile de raționament și cunoașterea profesională a GPT-5.2 într-un singur sistem care este, de asemenea, cu 25% mai rapid.

Cel mai remarcabil lucru: GPT-5.3-Codex și-a ajutat la construirea sa însuși. Echipa Codex a OpenAI a folosit versiuni timpurii ale modelului în timpul procesului de antrenament — depanarea rulărilor de antrenament, gestionarea infrastructurii de implementare și diagnosticarea rezultatelor evaluării. Acesta este primul anunț public al OpenAI că un model a fost instrumental în dezvoltarea sa, un moment important care ridică atât întrebări de eficiență, cât și de siguranță.

GPT-5.3-Codex stabilește noi recorduri ale industriei la SWE-Bench Pro și Terminal-Bench, benchmark-uri care evaluează sarcinile de inginerie software din lumea reală. Modelul poate gestiona sarcini cu rulare lungă care implică cercetare, utilizarea unor instrumente și execuție complexă, iar utilizatorii pot interacționa cu el în timpul sarcinii fără a pierde contextul — mai mult ca atunci când colaborezi cu un coleg decât când dai comenzi.

Modelul este disponibil acum pentru toți utilizatorii planului plătit ChatGPT prin aplicația Codex, CLI, extensia IDE și interfața web. Accesul API va urma curând.

Pentru dezvoltatorii care aleg între generatoare de cod AI, imaginea competitivă este acum definită clar: Opus 4.6 conduce la coordonarea agenților și la lucrul cu context lung, în timp ce GPT-5.3-Codex subliniază viteza și raționamentul integrat. Ambele revendică note maxime la benchmark-uri suprapuse, iar unelte precum Cursor și Xcode al Apple susțin ambele, astfel încât dezvoltatorii pot comuta liber.

OpenAI Frontier: Agenții pentru Întreprinderi Primește Propria Platformă

Alături de lansarea modelului, OpenAI a introdus Frontier, o platformă de întreprindere pentru crearea, implementarea și gestionarea agenților de inteligență artificială. Frontier se conectează la baze de date, sisteme CRM, platforme HR, unelte de ticketing și alte aplicații de afaceri, apoi permite agenților de inteligență artificială să execute procese de-a lungul acestora.

OpenAI a descris Frontier ca “un strat semantic pentru întreprindere” în care angajații umani și agenții de inteligență artificială operează pe aceeași platformă, cu acces comun la date și controale de securitate.

Platforma este agnostică la model — companiile pot gestiona agenți construiți pe modelele OpenAI alături de cei de la Google, Microsoft și Anthropic. Clienții inițiali includ Intuit, State Farm, Thermo Fisher și Uber.

Frontier poziționează OpenAI pentru a concura direct cu platforme de întreprindere precum Agentforce de la Salesforce și agenții de inteligență artificială de la ServiceNow. Diferența: OpenAI construiește de la stratul de model în sus, în timp ce companiile existente adaugă inteligență artificială la uneltele de flux de lucru existente. Întrebarea dacă întreprinderile preferă infrastructura de agenți de la furnizorul lor de inteligență artificială sau de la furnizorul lor de software va defini competiția de inteligență artificială la nivel de întreprindere în 2026.

Consiliul de Modele al Perplexity: Trei Modele, Un Răspuns

Perplexity a lansat Model Council, o funcție care rulează aceeași interogare pe trei modele simultan — Claude Opus, GPT și Gemini — apoi folosește un model de sinteză pentru a reconcilia ieșirile lor într-un singur răspuns care indică zonele de acord și dezacord.

Imagine: Perplexity

Premisa este că niciun model nu este în mod fiabil cel mai bun în toate interogările. Când trei modele de ultimă generație converg către același răspuns, încrederea este ridicată. Când ele diverg, utilizatorii știu că trebuie să investigheze mai departe. Model Council este disponibil pentru abonații Max și este poziționat pentru cercetarea de investiții, analiza strategică și luarea deciziilor complexe.

Funcția reflectă strategia Perplexity de a se diferenția prin orchestrarea multi-model, mai degrabă decât prin construirea de modele de bază. Pe măsură ce gap-ul dintre modelele de inteligență artificială de ultimă generație se îngustează la benchmark-uri individuale, agregarea ieșirilor lor poate dovedi a fi mai valoroasă decât alegerea unui singur furnizor.

Ce Înseamnă Totul

Aceste lansări confirmă faptul că competiția de inteligență artificială s-a mutat de la capacitatea modelului la infrastructura de produs. Atât OpenAI, cât și Anthropic au modele care se situează în fruntea acelorași benchmark-uri; diferențierea trăiește acum în ceea ce poți construi pe baza lor.

Perplexity, între timp, face un argument tăcut că războaiele modelelor pot fi mai puțin importante decât modul în care combini modelele. Dacă Model Council se dovedește util, sugerează că viitorul nu constă în alegerea între Claude și GPT — ci în utilizarea ambelor.

Pentru dezvoltatorii și întreprinderile care evaluează stiva lor de inteligență artificială, aceasta a făcut decizia și mai dificilă.

Alex McFarland este un jurnalist și scriitor de inteligență artificială, care explorează cele mai recente dezvoltări în domeniul inteligenței artificiale. El a colaborat cu numeroase startup-uri de inteligență artificială și publicații din întreaga lume.