Tekoäly
Anthropicin Project Deal -sopimus sallii Claude -agenteille kaupata oikeita tuotteita

Anthropic julkaisi 24. huhtikuuta tulokset “Project Deal” -nimisestä internal experimentistä, jossa Claude -agentit ostivat ja myivät oikeita tuotteita 69 työntekijän puolesta yrityksen San Franciscon toimistossa.
Agentit tekivät 186 kauppoa, joiden arvo oli hieman yli 4 000 dollaria – ja tutkimus osoitti, että osallistujat, joita edustivät vahvemmat mallit, saivat mitattavasti parempia tuloksia kuin heidän ihmiskollegansa, jotka eivät huomanneet sitä.
Tulokset, jotka on kirjoittanut Anthropicin tutkijat Kevin K. Troy, Dylan Shields, Keir Bradwell ja Peter McCrory, antavat selkeimmän kuvan siitä, miten AI-välittäjämarkkinat voivat toimia, kun agentit neuvottelevat kummallakin puolella transaktiota.
Ne myös paljastavat “epämukavan seikan”, jonka yritys sanoo, että teollisuus, sääntelijät ja käyttäjät on vastattava ennen kuin agentic commerce tulee valtavirtaan.
Miten Project Deal toimi
Kokeilu kesti yhden viikon joulukuussa 2025.
Anthropic palkkasi 69 työntekijää, antoi heille kullekin 100 dollarin “budjetti” (joka maksettiin kokeen jälkeen lahjakortin muodossa, plussa tai miinus siitä, mitä he ostivat tai myivät), ja teki Claude -haastattelun kullekin vapaaehtoiselle, jotta selvitettiin, mitä he halusivat myydä, mihinnä, mitä he halusivat ostaa ja minkälaista neuvottelutyyliä heidän agenttinsa tulisi käyttää. Anthropic muunsi vastaukset mukautettuun järjestelmäkyselyyn kullekin agentille.
Anthropic ajoi neljää rinnakkaista markkinapaikkaa Slack-kanavissa.
“Suorituksissa A ja D jokaisen agentti perustui Claude Opus 4.5:een, meidän silloiseen eturintamaan”, tiimi sanoi. “Kahdessa muussa suorituksessa (Suoritukset B ja C) osallistujilla oli 50 prosentin mahdollisuus saada Claude Haiku 4.5, joka on vähemmän voimakas malli, sen sijaan.”
Vain Suoritus A oli “oikea” suoritus, jossa tavaroita vaihdettiin todella; muut kolme olivat tutkimusolosuhteita, ja osallistujat eivät tiennet olleessa suorituksessa, kunnes kokeen jälkeen tehtiin kysely.
Kun agentit oli käynnistetty, niiden toiminnassa ei ollut enää ihmisten osallistumista.
Projektin Slack-kanava toisti satunnaisesti agenteja, jolloin he voisivat julkaista myynti-ilmoituksen, tehdä tarjouksen jonkun toisen henkilön tavarasta tai solmia kaupan. Olennaisinta oli, ettei kokeen aikana ollut ihmisten väliintuloa.
Yli 500 ilmoitetun tuotteen osalla agentit tunnistivat sopimukset, ehdottivat hintoja ja solmivat kaupat autonomisesti. Ihmiset osallistuivat jälleen vasta lopussa, jotta he voisivat vaihtaa tavaroita, joista heidän agenttinsa olivat sopineet.
Vahvemmat mallit neuvottelevat hiljaisesti parempia kauppoja
Otsikko löydös on suora: agentin laatu on merkityksellistä, ja se on merkityksellistä dollareissa.
161 myydyn tuotteen osalta, jotka myytiin vähintään kahdessa neljästä suorituksesta, Opus-myyjä sai keskimäärin 2,68 dollaria enemmän, kun taas Opus-ostaja maksoi 2,45 dollaria vähemmän. Kun Opus-myyjä kohtasi Haiku-ostajan, keskihinta oli 24,18 dollaria, verrattuna 18,63 dollarin Opus-Opus-kauppoihin. Anthropic sanoo, että nämä aukot eivät ole merkityksettömiä, kun otetaan huomioon keskihinta 12 dollaria ja keskiarvo 20,05 dollaria kaikissa suorituksissa.
Yksittäiset tapaukset olivat terävämpiä.
Sama rikkinäinen taittuva pyörä, sama ostaja, sama myyjä: Opus-agentti sai 65 dollaria, Haiku-agentti vain 38 dollaria.
Lab-grown ruby Opus, joka myytiin 65 dollarilla, myytiin vain 35 dollarilla, kun Haiku käsiteli ilmoitusta.
Ongelma on, mitä osallistujat eivät havainneet.
Vaikka hintaeron oli selvä, osallistujat, joilla oli Haiku-agenteja, arvioivat kauppojensa reiluuden lähes samalla tavalla kuin Opus-käyttäjät: 4,06 verrattuna 4,05 oikeudenmukaisuusasteikolla.
“Kahdeksantoista osallistujalla oli Haiku toisessa Haiku- ja Opus-suorituksessa ja Opus toisessa, ja vaikka 17 heistä asetti Opus-suorituksensa Haiku-suorituksensa yläpuolelle, 11 teki päinvastaisen”, yhtiö kirjoitti.
Toinen, enemmän vastoin odotuksia oleva tulos: neuvottelutyyli, jonka osallistujat pyysivät haastatteluissa, vaikuttivat vain vähän tuloksiin.
Aggressiiviset myyjät saivat korkeamman hinnan, mutta ainoastaan, koska he asettivat korkeamman alkuhinnan alusta alkaen, Anthropic sanoo.
Aggressiiviset ohjeet eivät tuottaneet tilastollisesti merkittävää lisäystä myyntimahdollisuuteen, myyntihintaan tai ostohintaan, kun otetaan huomioon korkeammat pyyntihinnat, jotka nämä käyttäjät asettivat. Mallin valinta oli tärkeämpää kuin ohjeistus.
Mikä se merkitsee agentic commerceille
Project Deal on pilotti, ei tuote, ja Anthropic on varovainen korostamaan rajoituksia – itsevalittu työntekijäjoukko, matalat panokset ja ei-vastakkaisia toimijoita. Vaikka niin olisi, 46 prosenttia osallistujista sanoi, että he maksaisivat palvelusta, mitä Anthropic tulkitsi näyttöksi siitä, että agenttivälittäjäinen peer-to-peer-kauppa ei ole kaukana.
Ajoitus on merkittävää, koska Anthropic on näkyvästi ohjannut Clauden kuluttajakauppoja kohti. Yritys on julkaissut äskettäin blogikirjoituksen, jossa se sitoutuu pitämään Claude-keskustelut ilmainen mainoksista ja tukemaan avoimesti agentic commercea, ja se on rakentanut yritysinfrastruktuuria, kuten Managed Agents, jotta Claude voi toimia käyttäjien puolesta kolmannen osapuolen palveluissa. Project Deal on tutkimusartefakti, joka karttaa hiljaisesti epäonnistumismalleja tulevaisuudesta.
Anthropic korostaa kolmea huolenaihetta, jotka kasvavat kokeilusta. Ensinnäkin, maailmassa, jossa on yrityksiä vapaaehtoisten sijaan, kannustimet näyttävät erilaisilta. Optimointi AI-agenttien huomion kiinnittämiseksi voi muuttua voimakkaaksi työkaluksi, joka ei välttämättä toimi ihmisten eduksi.
Toiseksi, järjestelmien optimointi AI-agenttien huomion kiinnittämiseksi – ei ihmisten huomion – voi tuoda uusia manipulointipintoja, mukaan lukien vankilamurtaminen ja prompt injection.
Kolmanneksi, “AI-mallien käytännön ja oikeudelliset puitteet, jotka transaktioivat puolestamme, eivät ole vielä olemassa”, yhtiö kirjoitti.
Vastamaton kysymys on, voivatko ilmoitukset sulkea havaintoerän. Project Deal -osallistujat eivät tienneet, mikä malli edusti heitä, mikä on suunnilleen sama tilanne, jossa käyttäjät ovat kuluttajatuotteiden julkaisussa – ellei markkinapaikkoja vaadita ilmoittamaan, mikä agentti toimii kenen puolesta ja minkä tasoisella kyvyllä. Se on sellainen sääntelykysymys, johon Anthropic nyt julkisesti kutsuu, ja se on todennäköisesti se, joka tulee ensin, kun agenttivälittäjäinen kauppa siirtyy San Franciscon Slack-kanavasta eteenpäin.












