рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛
рдПрдВрдереНрд░реЛрдкрд┐рдХ рдХреЗ рдкреНрд░реЛрдЬреЗрдХреНрдЯ рдбреАрд▓ рдореЗрдВ рдХреНрд▓реЙрдб рдПрдЬреЗрдВрдЯ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рд╛рдорд╛рди рдХрд╛ рд╡реНрдпрд╛рдкрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ

एंथ्रोपिक ने 24 अप्रैल को “प्रोजेक्ट डील” के परिणाम प्रकाशित किए, जो एक सप्ताह के आंतरिक प्रयोग में थे, जिसमें क्लॉड एजेंट्स ने 69 कर्मचारियों की ओर से वास्तविक आइटम खरीदे और बेचे, जो कंपनी के सैन फ्रांसिस्को कार्यालय में थे।
एजेंट्स ने 186 सौदे किए, जो कि 4,000 डॉलर से अधिक के थे – और अध्ययन में पाया गया कि मजबूत मॉडल द्वारा प्रतिनिधित्व किए गए प्रतिभागियों ने अपने मानव समकक्षों की तुलना में मापदंडों से बेहतर परिणाम प्राप्त किए, जिसे उन्होंने कभी नहीं देखा।
परिणाम, एंथ्रोपिक शोधकर्ता केविन के. ट्रॉय, डायलन शील्ड्स, कीर ब्रैडवेल और पीटर मैकक्रोरी द्वारा लिखे गए, एक एआई-मध्यस्थ बाजार के व्यवहार की अब तक की सबसे स्पष्ट तस्वीर प्रदान करते हैं, जब एजेंट लेन-देन के दोनों पक्षों पर बातचीत कर रहे हों।
वे एक “असहज निहितार्थ” को भी सामने लाते हैं, जिसे कंपनी कहती है कि उद्योग, नियामक और उपयोगकर्ताओं को सामना करना होगा इससे पहले कि एजेंटिक वाणिज्य मुख्यधारा बन जाए।
प्रोजेक्ट डील कैसे काम करता था
प्रयोग दिसंबर 2025 में एक सप्ताह के लिए चला।
एंथ्रोपिक ने 69 कर्मचारियों को भर्ती किया, प्रत्येक को 100 डॉलर का “बजट” दिया (प्रयोग के बाद उपहार कार्ड के रूप में भुगतान किया गया, जो कि वे जो कुछ भी खरीदते या बेचते थे उसके मूल्य के अलावा), और क्लॉड ने प्रत्येक स्वयंसेवक के साथ एक संक्षिप्त साक्षात्कार आयोजित किया ताकि यह पता लगाया जा सके कि वे क्या बेचना चाहते थे, किस कीमत पर, वे क्या खरीदना चाहते थे, और उनके एजेंट को किस प्रकार की बातचीत करनी चाहिए। एंथ्रोपिक ने तब उन उत्तरों को प्रत्येक एजेंट के लिए एक कस्टम सिस्टम प्रॉम्प्ट में बदल दिया।
एंथ्रोपिक ने तब स्लैक चैनलों के अंदर चार समानांतर बाजार चलाए।
“रन ए और रन डी में, हर किसी का एजेंट क्लॉड ओपस 4.5 पर आधारित था, जो हमारा फ्रंटियर मॉडल था,” टीम ने कहा। “दूसरे दो रन (रन बी और सी) में, प्रतिभागियों के पास क्लॉड हाइकु 4.5, एक कम शक्तिशाली मॉडल, के साथ जुड़ने का 50-50 मौका था।”
केवल रन ए वह “वास्तविक” रन था जहां वास्तव में सामान बदले गए; अन्य तीन अध्ययन स्थितियां थीं, और प्रतिभागियों को यह नहीं बताया गया था कि कौन सा रन वास्तविक था जब तक कि प्रयोग के बाद एक सर्वेक्षण नहीं किया गया था।
एक बार एजेंट्स तैनात हो जाने के बाद लूप में कोई मानव नहीं था।
परियोजना के स्लैक चैनल ने एजेंट्स को यादृच्छिक रूप से पोस्ट किया, जिससे वे एक आइटम के लिए बोली लगा सकते थे, किसी और के सामान के लिए प्रस्ताव कर सकते थे, या सौदा कर सकते थे। महत्वपूर्ण बात यह थी कि प्रयोग शुरू होने के बाद कोई मानव हस्तक्षेप नहीं था।
500 से अधिक सूचीबद्ध आइटमों में, एजेंट्स ने मैचों की पहचान की, मूल्य का प्रस्ताव दिया, और सौदे स्वतंत्र रूप से बंद कर दिए। मानव केवल तब फिर से चित्र में आए जब उनके एजेंटों द्वारा सहमत व्यापार के लिए भौतिक रूप से सामान का आदान-प्रदान करना था।
मजबूत मॉडल शांतिपूर्वक बेहतर सौदे की बातचीत करते हैं
मुख्य निष्कर्ष सीधा है: एजेंट की गुणवत्ता महत्वपूर्ण है, और यह डॉलर में महत्वपूर्ण है।
चार रन में से कम से कम दो में बेचे गए 161 आइटमों में, एक ओपस विक्रेता ने औसतन 2.68 डॉलर अधिक प्राप्त किया, जबकि एक ओपस खरीदार ने 2.45 डॉलर कम भुगतान किया। जब एक ओपस विक्रेता का सामना हाइकु खरीदार से हुआ, तो औसत मूल्य 24.18 डॉलर था, जो कि ओपस-ऑन-ओपस सौदों के लिए 18.63 डॉलर था। एंथ्रोपिक का कहना है कि मध्य मूल्य 12 डॉलर और सभी रनों में औसत 20.05 डॉलर के साथ, ये अंतर महत्वपूर्ण नहीं हैं।
व्यक्तिगत मामले तेज थे।
एक ही टूटा हुआ फोल्डिंग बाइक, एक ही खरीदार, एक ही विक्रेता: ओपस एजेंट ने 65 डॉलर प्राप्त किया, हाइकु एजेंट को केवल 38 डॉलर मिले।
एक लैब-ग्रोन रूबी ओपस 65 डॉलर में बिकी, लेकिन जब हाइकु ने सूचीकरण संभाला, तो यह केवल 35 डॉलर में बिकी।
पकड़ यह है कि प्रतिभागियों ने क्या नहीं देखा।
स्पष्ट मूल्य अंतर के बावजूद, हाइकु एजेंट वाले प्रतिभागियों ने अपने सौदों की न्यायपूर्णता को ओपस उपयोगकर्ताओं के समान रेट किया: न्यायपूर्णता स्केल पर 4.06 बनाम 4.05।
“हमारे 28 प्रतिभागियों में से हाइकु और ओपस रन में हाइकु था और दूसरे में ओपस था,” कंपनी ने लिखा। “और हालांकि 17 ने अपने ओपस रन को अपने हाइकु रन से ऊपर रेट किया, 11 ने इसके विपरीत किया।”
एक दूसरा, अधिक विरोधाभासी परिणाम: प्रतिभागियों ने अपने साक्षात्कार साक्षात्कार में जो बातचीत शैली मांगी थी, वह परिणामों पर बिल्कुल भी प्रभाव नहीं डाली।
आक्रामक विक्रेता उच्च कीमतें प्राप्त करते थे, लेकिन केवल इसलिए कि वे शुरू से ही उच्च प्रारंभिक कीमतें निर्धारित करते थे, एंथ्रोपिक का कहना है।
आक्रामक निर्देशों ने बिक्री की संभावना, बिक्री मूल्य या खरीद मूल्य में कोई सांख्यिकीय रूप से महत्वपूर्ण वृद्धि नहीं की, एक बार जब उपयोगकर्ताओं द्वारा निर्धारित उच्च मांग वाली कीमतों को नियंत्रित किया गया। मॉडल चयन प्रॉम्प्टिंग से कहीं अधिक मायने रखता था।
एजेंटिक वाणिज्य के लिए इसका क्या अर्थ है
प्रोजेक्ट डील एक पायलट है, एक उत्पाद नहीं, और एंथ्रोपिक सावधानी से इसकी सीमाओं को ध्वजांकित करता है – एक स्व-चयनित कर्मचारी पूल, कम दांव, और कोई विरोधी अभिनेता नहीं। फिर भी, 46 प्रतिशत प्रतिभागियों ने कहा कि वे ऐसी सेवा के लिए भुगतान करेंगे, जिसे एंथ्रोपिक एजेंट-मध्यस्थ पियर-टू-पियर वाणिज्य के करीब नहीं होने के प्रमाण के रूप में प्रस्तुत करता है।
समय महत्वपूर्ण है क्योंकि एंथ्रोपिक ने क्लॉड को उपभोक्ता लेनदेन की ओर स्पष्ट रूप से मोड़ दिया है। कंपनी ने हाल ही में एक ब्लॉग पोस्ट प्रकाशित किया है जिसमें क्लॉड वार्ताओं को विज्ञापन-मुक्त रखने की प्रतिज्ञा की गई है, स्पष्ट रूप से एजेंटिक वाणिज्य का समर्थन किया गया है, और यह तीसरे पक्ष की सेवाओं में उपयोगकर्ताओं की ओर से कार्य करने के लिए मैनेज्ड एजेंट्स जैसी उद्यम बुनियादी ढांचे का निर्माण कर रही है। प्रोजेक्ट डील एक शोध कलाकृति के रूप में आता है जो उस भविष्य की विफलता मोड को चुपचाप मैप करता है।
एंथ्रोपिक तीन चिंताओं को उठाता है जो प्रयोग से बढ़ती हैं। पहला, कंपनियों के साथ एक दुनिया में, प्रोत्साहन बहुत अलग दिखेंगे। एआई एजेंट ध्यान के लिए अनुकूलन एक शक्तिशाली उपकरण बन सकता है जो लोगों के पक्ष में काम नहीं करता है।
दूसरा, एआई एजेंट ध्यान – मानव ध्यान के बजाय – के लिए अनुकूलन नई मैनिपुलेशन सतहों को पेश कर सकता है, जिनमें जेलब्रेकिंग और प्रॉम्प्ट इंजेक्शन शामिल हैं।
तीसरा, “एआई मॉडल के आसपास की नीति और कानूनी ढांचे जो हमारे नाम पर लेन-देन करते हैं वे अभी तक मौजूद नहीं हैं,” कंपनी लिखती है।
अनुत्तरित प्रश्न यह है कि क्या खुलासा धारणा अंतर को बंद कर सकता है। प्रोजेक्ट डील प्रतिभागियों को यह नहीं पता था कि कौन सा मॉडल उनका प्रतिनिधित्व कर रहा था, जो कि उपयोगकर्ताओं के सामने आने वाली स्थिति के लगभग बराबर है जब वे किसी उपभोक्ता रोलआउट में होंगे। यदि ओपस और हाइकु के बीच एक न्यायपूर्णता अंतर एंथ्रोपिक कार्यबल में एक स्व-चयनित आंतरिक प्रयोग में $100 के दांव के साथ दिखाई नहीं देता है, तो यह संभवतः पैमाने पर दिखाई नहीं देगा – जब तक कि बाजारों को यह प्रकट नहीं करना पड़े कि कौन सा एजेंट किसके लिए और किस क्षमता स्तर पर कार्य कर रहा है। यह वह नियामक प्रश्न है जिसे एंथ्रोपिक अब सार्वजनिक रूप से आमंत्रित कर रहा है, और यह सबसे अधिक संभावना है कि एजेंट-मध्यस्थ वाणिज्य सैन फ्रांसिस्को में एक स्लैक चैनल से परे जाने पर पहले उत्तर देगा।












