Штучний інтелект
Проект Anthropic Deal дозволяє агентам Claude торгувати реальними товарами

Anthropic 24 квітня опублікувала результати “Проекту Deal“, одотижневого внутрішнього експерименту, у якому агенти Claude купували та продавали реальні товари від імені 69 працівників у офісі компанії в Сан-Франциско.
Агенти укладали 186 угод на суму трохи понад 4 000 доларів, а дослідження показало, що учасники, представлені більш потужними моделями, мали значно кращі результати, яких їхні людські колеги не помітили.
Висновки, написані дослідниками Anthropic Kevin K. Troy, Dylan Shields, Keir Bradwell та Peter McCrory, дають найчіткішу картину того, як ринок, посередником якого є штучний інтелект, може поводитися насправді, коли агенти ведуть переговори з обох сторін угоди.
Вони також розкривають “неприємну імплікацію”, яку компанія вважає, що галузь, регулюючі органи та користувачі повинні розглянути до того, як агентська комерція стане масовою.
Як працював Проект Deal
Експеримент тривав тиждень у грудні 2025 року.
Anthropic залучила 69 працівників, дала кожному “бюджет” у розмірі 100 доларів (оплачувався після експерименту у вигляді подарункової картки, плюс або мінус вартість того, що вони купили або продали), і провела коротке інтерв’ю з кожним добровольцем, щоб з’ясувати, що вони хочуть продати, за яку ціну, що вони хочуть купити, і який стиль переговорів їхній агент повинен використовувати. Anthropic потім перетворила ці відповіді на індивідуальну систему запиту для кожного агента.
Anthropic потім запустила чотири паралельні ринки всередині Slack-каналів.
“У Run A і Run D агент кожного учасника був заснований на Claude Opus 4.5, нашій тоді передовій моделі”, – сказав командою. “У двох інших запусках (Runs B і C) учасники мали 50-відсоткову можливість бути призначеними Claude Haiku 4.5, менш потужною моделлю, замість цього”.
Тільки Run A був “реальним” запуском, де товари дійсно перейшли з рук у руки після цього; інші три були умовами дослідження, і учасники не знали, який запуск був реальним, поки не пройшло опитування після експерименту.
Не було людини в циклі після того, як агенти були розгорнуті.
Проектний Slack-канал випадково прохідився через агентів, дозволяючи їм розмістити товари на продаж, зробити пропозицію щодо чужих товарів або укласти угоду. Що найважливіше, не було жодного людського втручання після початку експерименту.
Понад 500 перелічених товарів агенти ідентифікували збіги, пропонували ціни та укладали угоди автономно. Люди знову з’явилися в картині тільки в кінці, щоб фізично обмінятися товарами, щодо яких їхні агенти погодилися торгувати.
Більш потужні моделі тихо ведуть кращі угоди
Основний висновок простий: якість агента має значення, і воно має значення в доларах.
Понад 161 товар, проданий принаймні в двох із чотирьох запусків, Opus-продавець отримував у середньому на 2,68 доларів більше, тоді як Opus-купівець платив на 2,45 доларів менше. Коли Opus-продавець зустрічався з Haiku-купівцем, середня ціна становила 24,18 доларів, порівняно з 18,63 доларів для угод Opus-на-Opus. З медіаною ціни 12 доларів і середнім показником 20,05 доларів за всі запуски Anthropic вважає, що ці розриви не є тривіальними.
Індивідуальні випадки були гострішими.
Той самий зламаний складаний велосипед, той самий покупець, той самий продавець: агент Opus отримав 65 доларів, а агент Haiku – тільки 38 доларів.
Лабораторно вирощений рубін Opus продавався за 65 доларів, але коли Haiku керував розміщенням, він продавався тільки за 35 доларів.
Пастка полягає в тому, чого учасники не сприймали.
Незважаючи на чіткий розрив у цінах, учасники з агентами Haiku оцінювали справедливість своїх угод майже так само, як і користувачі Opus: 4,06 проти 4,05 за шкалою справедливості.
“Двадцять вісім наших учасників мали Haiku в одному запуску Haiku та Opus і Opus в іншому. І хоча 17 з них поставили свій запуск Opus вище свого запуску Haiku, 11 зробили навпаки”, – написала компанія.
Другий, більш контрінтуїтивний результат: стилі переговорів, які учасники запитали в своїх інтерв’ю, майже не вплинули на результати.
Агресивні продавці дійсно отримували вищі ціни, але тільки тому, що вони встановили вищі відкриті ціни спочатку, каже Anthropic.
Агресивні інструкції не дали статистично значимого підвищення ймовірності продажу, ціни продажу чи ціни покупки, коли вищі ціни, які встановили ці користувачі, були під контролем. Вибір моделі мав значення набагато більше, ніж запиту.
Що це означає для агентської комерції
Проект Deal – це пілотний проект, а не продукт, і Anthropic обережно підкреслює обмеження – самовибірка працівників, низькі ставки, відсутність ворожих акторів. Навіть так, 46 відсотків учасників сказали, що вони заплатили б за таку послугу, яку Anthropic розглядає як доказ того, що агентська комерція між рівними не далеко.
Цей термін має значення, оскільки Anthropic вже помітно спрямовує Claude до споживчих транзакцій. Компанія недавно опублікувала блог-пост, у якому зобов’язалася зберігати розмови Claude без реклами, а також явно схвалює агентську комерцію, і вона будує корпоративну інфраструктуру, таку як Managed Agents, щоб дозволити Claude діяти від імені користувачів на третьому сервісі. Проект Deal висаджується як дослідницький артефакт, який тихо карти графіки відмов у майбутньому.
Anthropic виділяє три проблеми, які зростають з експерименту. По-перше, у світі з компаніями замість волонтерів стимули будуть виглядати зовсім по-іншому. Оптимізація уваги штучного інтелекту може стати потужним інструментом, який не обов’язково працює на користь людей.
По-друге, оптимізація систем для уваги штучного інтелекту – а не людської уваги – може ввести нові поверхні маніпулювання, включаючи jailbreaking і prompt injection.
По-третє, “політичні та юридичні рамки навколо моделей штучного інтелекту, які укладають угоди від нашого імені, просто ще не існують”, – пише компанія.
Невідповідальне питання полягає в тому, чи може розкриття закрити розрив у сприйнятті. Учасники Проекту Deal не знали, яку модель представляв їхній агент, що є приблизно тим же становищем, яке будуть мати користувачі в будь-якому споживчому виході. Якщо розрив у справедливості між Opus і Haiku є невидимим всередині самовибірної робочої сили Anthropic, яка проводить одотижневий експеримент з ставками 100 доларів, він, ймовірно, буде невидимим у масштабі – якщо тільки ринки не будуть зобов’язані розкривати, який агент діє від імені кого і на якому рівні можливостей. Це саме той регуляторний запит, який Anthropic тепер публічно запрошує, і це той, який найімовірніше приземлиться першим, коли агентська комерція вийде за межі Slack-каналу в Сан-Франциско.












