कृत्रिम बुद्धिमत्ता

एंथ्रोपिक के प्रोजेक्ट डील में क्लॉड एजेंट वास्तविक सामान का व्यापार करते हैं

Published April 25, 2026

Alex McFarland

एंथ्रोपिक ने 24 अप्रैल को “प्रोजेक्ट डील” के परिणाम प्रकाशित किए, जो एक सप्ताह के आंतरिक प्रयोग में थे, जिसमें क्लॉड एजेंट्स ने 69 कर्मचारियों की ओर से वास्तविक आइटम खरीदे और बेचे, जो कंपनी के सैन फ्रांसिस्को कार्यालय में थे।

एजेंट्स ने 186 सौदे किए, जो कि 4,000 डॉलर से अधिक के थे – और अध्ययन में पाया गया कि मजबूत मॉडल द्वारा प्रतिनिधित्व किए गए प्रतिभागियों ने अपने मानव समकक्षों की तुलना में मापदंडों से बेहतर परिणाम प्राप्त किए, जिसे उन्होंने कभी नहीं देखा।

परिणाम, एंथ्रोपिक शोधकर्ता केविन के. ट्रॉय, डायलन शील्ड्स, कीर ब्रैडवेल और पीटर मैकक्रोरी द्वारा लिखे गए, एक एआई-मध्यस्थ बाजार के व्यवहार की अब तक की सबसे स्पष्ट तस्वीर प्रदान करते हैं, जब एजेंट लेन-देन के दोनों पक्षों पर बातचीत कर रहे हों।

वे एक “असहज निहितार्थ” को भी सामने लाते हैं, जिसे कंपनी कहती है कि उद्योग, नियामक और उपयोगकर्ताओं को सामना करना होगा इससे पहले कि एजेंटिक वाणिज्य मुख्यधारा बन जाए।

प्रोजेक्ट डील कैसे काम करता था

प्रयोग दिसंबर 2025 में एक सप्ताह के लिए चला।

एंथ्रोपिक ने 69 कर्मचारियों को भर्ती किया, प्रत्येक को 100 डॉलर का “बजट” दिया (प्रयोग के बाद उपहार कार्ड के रूप में भुगतान किया गया, जो कि वे जो कुछ भी खरीदते या बेचते थे उसके मूल्य के अलावा), और क्लॉड ने प्रत्येक स्वयंसेवक के साथ एक संक्षिप्त साक्षात्कार आयोजित किया ताकि यह पता लगाया जा सके कि वे क्या बेचना चाहते थे, किस कीमत पर, वे क्या खरीदना चाहते थे, और उनके एजेंट को किस प्रकार की बातचीत करनी चाहिए। एंथ्रोपिक ने तब उन उत्तरों को प्रत्येक एजेंट के लिए एक कस्टम सिस्टम प्रॉम्प्ट में बदल दिया।

एंथ्रोपिक ने तब स्लैक चैनलों के अंदर चार समानांतर बाजार चलाए।

“रन ए और रन डी में, हर किसी का एजेंट क्लॉड ओपस 4.5 पर आधारित था, जो हमारा फ्रंटियर मॉडल था,” टीम ने कहा। “दूसरे दो रन (रन बी और सी) में, प्रतिभागियों के पास क्लॉड हाइकु 4.5, एक कम शक्तिशाली मॉडल, के साथ जुड़ने का 50-50 मौका था।”

केवल रन ए वह “वास्तविक” रन था जहां वास्तव में सामान बदले गए; अन्य तीन अध्ययन स्थितियां थीं, और प्रतिभागियों को यह नहीं बताया गया था कि कौन सा रन वास्तविक था जब तक कि प्रयोग के बाद एक सर्वेक्षण नहीं किया गया था।

एक बार एजेंट्स तैनात हो जाने के बाद लूप में कोई मानव नहीं था।

परियोजना के स्लैक चैनल ने एजेंट्स को यादृच्छिक रूप से पोस्ट किया, जिससे वे एक आइटम के लिए बोली लगा सकते थे, किसी और के सामान के लिए प्रस्ताव कर सकते थे, या सौदा कर सकते थे। महत्वपूर्ण बात यह थी कि प्रयोग शुरू होने के बाद कोई मानव हस्तक्षेप नहीं था।

500 से अधिक सूचीबद्ध आइटमों में, एजेंट्स ने मैचों की पहचान की, मूल्य का प्रस्ताव दिया, और सौदे स्वतंत्र रूप से बंद कर दिए। मानव केवल तब फिर से चित्र में आए जब उनके एजेंटों द्वारा सहमत व्यापार के लिए भौतिक रूप से सामान का आदान-प्रदान करना था।

मजबूत मॉडल शांतिपूर्वक बेहतर सौदे की बातचीत करते हैं

मुख्य निष्कर्ष सीधा है: एजेंट की गुणवत्ता महत्वपूर्ण है, और यह डॉलर में महत्वपूर्ण है।

चार रन में से कम से कम दो में बेचे गए 161 आइटमों में, एक ओपस विक्रेता ने औसतन 2.68 डॉलर अधिक प्राप्त किया, जबकि एक ओपस खरीदार ने 2.45 डॉलर कम भुगतान किया। जब एक ओपस विक्रेता का सामना हाइकु खरीदार से हुआ, तो औसत मूल्य 24.18 डॉलर था, जो कि ओपस-ऑन-ओपस सौदों के लिए 18.63 डॉलर था। एंथ्रोपिक का कहना है कि मध्य मूल्य 12 डॉलर और सभी रनों में औसत 20.05 डॉलर के साथ, ये अंतर महत्वपूर्ण नहीं हैं।

व्यक्तिगत मामले तेज थे।

एक ही टूटा हुआ फोल्डिंग बाइक, एक ही खरीदार, एक ही विक्रेता: ओपस एजेंट ने 65 डॉलर प्राप्त किया, हाइकु एजेंट को केवल 38 डॉलर मिले।

एक लैब-ग्रोन रूबी ओपस 65 डॉलर में बिकी, लेकिन जब हाइकु ने सूचीकरण संभाला, तो यह केवल 35 डॉलर में बिकी।

पकड़ यह है कि प्रतिभागियों ने क्या नहीं देखा।

स्पष्ट मूल्य अंतर के बावजूद, हाइकु एजेंट वाले प्रतिभागियों ने अपने सौदों की न्यायपूर्णता को ओपस उपयोगकर्ताओं के समान रेट किया: न्यायपूर्णता स्केल पर 4.06 बनाम 4.05।

“हमारे 28 प्रतिभागियों में से हाइकु और ओपस रन में हाइकु था और दूसरे में ओपस था,” कंपनी ने लिखा। “और हालांकि 17 ने अपने ओपस रन को अपने हाइकु रन से ऊपर रेट किया, 11 ने इसके विपरीत किया।”

एक दूसरा, अधिक विरोधाभासी परिणाम: प्रतिभागियों ने अपने साक्षात्कार साक्षात्कार में जो बातचीत शैली मांगी थी, वह परिणामों पर बिल्कुल भी प्रभाव नहीं डाली।

आक्रामक विक्रेता उच्च कीमतें प्राप्त करते थे, लेकिन केवल इसलिए कि वे शुरू से ही उच्च प्रारंभिक कीमतें निर्धारित करते थे, एंथ्रोपिक का कहना है।

आक्रामक निर्देशों ने बिक्री की संभावना, बिक्री मूल्य या खरीद मूल्य में कोई सांख्यिकीय रूप से महत्वपूर्ण वृद्धि नहीं की, एक बार जब उपयोगकर्ताओं द्वारा निर्धारित उच्च मांग वाली कीमतों को नियंत्रित किया गया। मॉडल चयन प्रॉम्प्टिंग से कहीं अधिक मायने रखता था।

एजेंटिक वाणिज्य के लिए इसका क्या अर्थ है

प्रोजेक्ट डील एक पायलट है, एक उत्पाद नहीं, और एंथ्रोपिक सावधानी से इसकी सीमाओं को ध्वजांकित करता है – एक स्व-चयनित कर्मचारी पूल, कम दांव, और कोई विरोधी अभिनेता नहीं। फिर भी, 46 प्रतिशत प्रतिभागियों ने कहा कि वे ऐसी सेवा के लिए भुगतान करेंगे, जिसे एंथ्रोपिक एजेंट-मध्यस्थ पियर-टू-पियर वाणिज्य के करीब नहीं होने के प्रमाण के रूप में प्रस्तुत करता है।

समय महत्वपूर्ण है क्योंकि एंथ्रोपिक ने क्लॉड को उपभोक्ता लेनदेन की ओर स्पष्ट रूप से मोड़ दिया है। कंपनी ने हाल ही में एक ब्लॉग पोस्ट प्रकाशित किया है जिसमें क्लॉड वार्ताओं को विज्ञापन-मुक्त रखने की प्रतिज्ञा की गई है, स्पष्ट रूप से एजेंटिक वाणिज्य का समर्थन किया गया है, और यह तीसरे पक्ष की सेवाओं में उपयोगकर्ताओं की ओर से कार्य करने के लिए मैनेज्ड एजेंट्स जैसी उद्यम बुनियादी ढांचे का निर्माण कर रही है। प्रोजेक्ट डील एक शोध कलाकृति के रूप में आता है जो उस भविष्य की विफलता मोड को चुपचाप मैप करता है।

एंथ्रोपिक तीन चिंताओं को उठाता है जो प्रयोग से बढ़ती हैं। पहला, कंपनियों के साथ एक दुनिया में, प्रोत्साहन बहुत अलग दिखेंगे। एआई एजेंट ध्यान के लिए अनुकूलन एक शक्तिशाली उपकरण बन सकता है जो लोगों के पक्ष में काम नहीं करता है।

दूसरा, एआई एजेंट ध्यान – मानव ध्यान के बजाय – के लिए अनुकूलन नई मैनिपुलेशन सतहों को पेश कर सकता है, जिनमें जेलब्रेकिंग और प्रॉम्प्ट इंजेक्शन शामिल हैं।

तीसरा, “एआई मॉडल के आसपास की नीति और कानूनी ढांचे जो हमारे नाम पर लेन-देन करते हैं वे अभी तक मौजूद नहीं हैं,” कंपनी लिखती है।

अनुत्तरित प्रश्न यह है कि क्या खुलासा धारणा अंतर को बंद कर सकता है। प्रोजेक्ट डील प्रतिभागियों को यह नहीं पता था कि कौन सा मॉडल उनका प्रतिनिधित्व कर रहा था, जो कि उपयोगकर्ताओं के सामने आने वाली स्थिति के लगभग बराबर है जब वे किसी उपभोक्ता रोलआउट में होंगे। यदि ओपस और हाइकु के बीच एक न्यायपूर्णता अंतर एंथ्रोपिक कार्यबल में एक स्व-चयनित आंतरिक प्रयोग में $100 के दांव के साथ दिखाई नहीं देता है, तो यह संभवतः पैमाने पर दिखाई नहीं देगा – जब तक कि बाजारों को यह प्रकट नहीं करना पड़े कि कौन सा एजेंट किसके लिए और किस क्षमता स्तर पर कार्य कर रहा है। यह वह नियामक प्रश्न है जिसे एंथ्रोपिक अब सार्वजनिक रूप से आमंत्रित कर रहा है, और यह सबसे अधिक संभावना है कि एजेंट-मध्यस्थ वाणिज्य सैन फ्रांसिस्को में एक स्लैक चैनल से परे जाने पर पहले उत्तर देगा।

Related Topics:AI AGENTS anthropic claude

Alex McFarland

एलेक्स मैकफारलैंड एक एआई पत्रकार और लेखक हैं जो कृत्रिम बुद्धिमत्ता में नवीनतम विकासों का अन्वेषण कर रहे हैं। उन्होंने विश्वभर के कई एआई स्टार्टअप्स और प्रकाशनों के साथ सहयोग किया है।