Tekoäly
OpenAI ja Anthropic julkaisivat vastakkaiset mallit kun tekoälykilpailu kiihtyy

OpenAI ja Anthropic julkaisivat uudet lippulaivamallinsa muutamien minuuttien välein tänään, kun taas OpenAI samalla julkaisi yritysagenttialustan ja Perplexity esitteli monimallisen tutkimusominaisuuden. Tänään toteutettiin merkittäviä tekoälytuotteiden ilmoituksia yhdessä iltapäivässä kuin useimmat viikot tuottavat yhteensä.
Tässä on mitä toimitettiin ja mitä se merkitsee.
Anthropicsin Opus 4.6: Agenttitiimit ja miljoona-token-ikkuna
Anthropic julkaisi Claude Opus 4.6, sen kyvykkäimmän mallin, jossa on kaksi merkittävää ominaisuutta: miljoona-tokenin kontekstiuuni ja uusi ominaisuus nimeltä Agenttitiimit.
Kontekstiuuni on suurempi tekninen saavutus. Miljoonan tokenin kokoisella Opus 4.6:lla voidaan prosessoida noin 3 000 sivun tekstiä yhdessä kyselyssä – neljä kertaa edeltäjänsä 256 000 tokenin raja. Yhdistettynä 128 000 tokenin tuotantotukeen malli voi nyt syödä ja työskennellä koko koodipohjilla, sääntelytiedostilla tai tutkimuskorpuksilla ilman paloittelu- tai tiivistämistä.
Agenttitiimit, saatavilla Claude Code:ssa, sallivat useiden Claude-eksemplarien työskennellä rinnakkain jaettujen koodipohjien parissa. Sen sijaan, että yksittäinen agentti suorittaa tehtäviä peräkkäin, kehittäjät voivat luoda tiimejä, joissa yksi agentti käsittelee etuyläosan muutoksia, toinen kirjoittaa testejä ja kolmas uudelleenjärjestää taustalogiikkaa – kaikki koordinoivat samassa projektissa samanaikaisesti.
Opus 4.6 esittelee myös soveltuvan ajattelun, joka sallii mallin kalibroida, kuinka paljon ponnistelua sijoittaa tiettyyn kyselyyn. Yksinkertaisiin kysymyksiin vastataan nopeasti; monimutkaisiin ongelmiin laukaisee syvempiä ja laajempia ajatuksia. Kehittäjät voivat säätää tätä ponnistelun valvontaa neljällä tasolla: alhainen, keskitaso, korkea ja maksimi.
Benchmarkeissa Opus 4.6 saa korkeimman tuloksen Terminal-Bench 2.0:lla agenteille koodauksessa ja johtaa Humanity’s Last Examia, monimutkaisen päättelyn arviointia. Anthropic väittää 144 pisteen ELO-etua GPT-5.2:sta GDPval-AA-arvioinnissa ja 190 pisteen parannuksen Opus 4.5:een verrattuna.
API-hinnat säilyvät muuttumattomina 5 dollarissa miljoonaa syötettävää tokenia kohden ja 25 dollarissa miljoonaa tuotettavaa tokenia kohden, vaikka yli 200 000 tokenin kyselyt maksavat premium-hintaa 10/37,50 dollarissa.
Yritysliikkeessä Anthropic ilmoitti Claude-tutkimuksen esikatselun Microsoft PowerPointissa, jossa malli voi lukea olemassa olevia diaesitysasetteluja ja -malleja ja luoda tai muokata esityksiä säilyttäen brändin muotoilun.
OpenAI:n GPT-5.3-Codex: Malli, joka auttoi rakentamaan itsensä
Minuuttien kuluttua Anthropicsin ilmoituksesta OpenAI julkaisi GPT-5.3-Codexin, sen kyvykkäimmän koodausmallin. Julkaisu yhdistää GPT-5.2-Codexin koodausominaisuudet GPT-5.2:n päättely- ja ammattitietämysohjelmiin yhteen järjestelmään, joka on myös 25 prosenttia nopeampi.
Merkittävin väite: GPT-5.3-Codex auttoi rakentamaan itsensä. OpenAI:n Codex-tiimi käytti mallin varhaisia versioita omassa koulutusprosessissaan – virheiden korjaamiseen, käyttöönoton infrastruktuurin hallintaan ja arviointituloksien diagnosointiin. Tämä on OpenAI:n ensimmäinen julkisen tunnustus siitä, että malli oli olennainen osa oman kehittämistään, merkittävä välietappi, joka herättää sekä tehokkuuden että turvallisuuden kysymyksiä.
GPT-5.3-Codex asettaa uudet teollisuuden ennätykset SWE-Bench Pro:lla ja Terminal-Benchillä, joissa arvioidaan todellisen maailman ohjelmistokehitystehtäviä. Malli voi käsitellä pitkäaikaisia tehtäviä, jotka liittyvät tutkimukseen, työkalujen käyttöön ja monimutkaiseen suorittamiseen, ja käyttäjät voivat vuorovaikuttaa sen kanssa tehtävän aikana ilman kontekstin menettämistä – enemmän kuin yhteistyössä kollegan kanssa kuin komennoissa.
Malli on saatavilla kaikille ChatGPT:n maksullisten suunnitelmien käyttäjille Codex-sovelluksen, CLI:n, IDE-laajennuksen ja verkkorajapinnan kautta. API-käyttö on tulossa pian.
Kehittäjille, jotka valitsevat AI-koodigeneraattoreita, kilpailukuvan on nyt terävästi määritelty: Opus 4.6 johtaa agenttikoordinaatiossa ja pitkän kontekstin työssä, kun taas GPT-5.3-Codex korostaa nopeutta ja yhdistettyä päättelyä. Molemmat väittävät huipputuloksia samojen benchmarkien osalla, ja työkalut kuten Cursor ja Apple:n Xcode tukevat molempia, joten kehittäjät voivat vaihtaa vapaasti.
OpenAI Frontier: Yritysagentit saavat oman alustan
Mallin julkaisun rinnalla OpenAI esitteli Frontierin, yritysalustan tekoälyagenttien luomiseen, käyttöönottoon ja hallintaan. Frontier yhdistää tietokantoihin, CRM-järjestelmiin, HR-alustoihin, lippujärjestelmiin ja muihin liiketoimintasovelluksiin, sitten sallii tekoälyagenttien suorittaa prosesseja niiden yli.
OpenAI kuvasi Frontieria “semanttisena kerroksena yrityksille”, jossa ihmiset ja tekoälyagentit toimivat samalla alustalla jaettujen tietojen pääsyä ja turvallisuusohjauskeinoja. Agentit saavat työntekijämäiset identiteetit, jaetun organisaatiokontekstin ja yritysluokan käyttöoikeudet.
Alusta on malliriippumaton – yritykset voivat hallita agentteja, jotka on rakennettu OpenAI:n malleilla, yhdessä muiden yritysten, kuten Google, Microsoft ja Anthropic, mallien kanssa. Alkuvuoden asiakkaat ovat Intuit, State Farm, Thermo Fisher ja Uber.
Frontier asemoi OpenAI:n kilpailemaan suoraan yritysalustoja vastaan, kuten Salesforce:n Agentforce ja ServiceNow:n tekoälyagentit. Ero: OpenAI rakentaa mallitasolta ylöspäin, kun taas vanhat toimijat lisäävät tekoälyä olemassa oleviin työkaluihin. Onko yrityksille mieluummin agenttinfrastruktuuri tekoälytoimittajalta vai ohjelmistotoimittajalta, määrittelee tekoälykilpailun yrityksissä vuonna 2026.
Perplexityn Model Council: Kolme mallia, yksi vastaus
Perplexity julkaisi Model Councilin, ominaisuuden, joka suorittaa saman kyselyn kolmella mallilla samanaikaisesti – Claude Opus, GPT ja Gemini – sitten käyttää yhdistävää mallia yhdistämään niiden tulokset yhteen vastaukseen, joka osoittaa sopimisen ja erimielisyyden alueet.

Kuva: Perplexity
Premissi on, että yksikin malli ei ole luotettavasti paras kaikissa kyselyissä. Kun kolme eturintamalla olevaa mallia yhtyvät samaan vastaukseen, luottamus on korkea. Kun ne eroavat, käyttäjät tietävät, että heidän on tutkittava asiaa tarkemmin. Model Council on saatavilla Max-tilaajille ja on suunniteltu sijoitusanalyysiin, strategiseen analyysiin ja monimutkaiseen päätöksentekoon.
Ominaisuus heijastaa Perplexityn strategiaa, jossa erottautuminen tapahtuu monimallisen orkestroinnin kautta perusmallien sijaan. Kun eturintamalla olevien tekoälychatbottien välinen kuilu yksittäisillä benchmarkkeilla kapenee, niiden tulosten yhdistäminen voi osoittautua arvokkaammaksi kuin yksittäisen toimittajan valinta.
Mitä se kaikki merkitsee
Nämä julkaisut vahvistavat, että tekoälykilpailu on siirtynyt mallin kyvystä tuoteinfrastruktuuriin. Sekä OpenAI:lla että Anthropicilla on malleja, jotka johtavat samoja benchmarkkeja; erottautuminen on nyt siinä, mitä voidaan rakentaa niiden päälle.
Perplexity taas esittää hiljaisen väitteen, että mallisodat saattavat olla vähemmän tärkeitä kuin se, miten malleja yhdistetään. Jos Model Council osoittautuu hyödylliseksi, se viittaa siihen, että tulevaisuus ei ole valintaa Claude ja GPT:n välillä – se on käyttäminen molempia.
Kehittäjille ja yrityksille, jotka arvioivat tekoälyominaisuuksiaan, tämä tekee päätöksen vaikeammaksi.












