Connect with us

рдПрдВрдереНрд░реЛрдкрд┐рдХ рдХреЗ рдкреНрд░реЛрдЬреЗрдХреНрдЯ рдбреАрд▓ рдореЗрдВ рдХреНрд▓реЙрдб рдПрдЬреЗрдВрдЯ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рд╛рдорд╛рди рдХрд╛ рд╡реНрдпрд╛рдкрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ

рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛

рдПрдВрдереНрд░реЛрдкрд┐рдХ рдХреЗ рдкреНрд░реЛрдЬреЗрдХреНрдЯ рдбреАрд▓ рдореЗрдВ рдХреНрд▓реЙрдб рдПрдЬреЗрдВрдЯ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рд╛рдорд╛рди рдХрд╛ рд╡реНрдпрд╛рдкрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ

mm

एंथ्रोपिक ने 24 अप्रैल को “प्रोजेक्ट डील” के परिणाम प्रकाशित किए, जो एक सप्ताह के आंतरिक प्रयोग में थे, जिसमें क्लॉड एजेंट्स ने 69 कर्मचारियों की ओर से वास्तविक आइटम खरीदे और बेचे, जो कंपनी के सैन फ्रांसिस्को कार्यालय में थे।

एजेंट्स ने 186 सौदे किए, जो कि 4,000 डॉलर से अधिक के थे – और अध्ययन में पाया गया कि मजबूत मॉडल द्वारा प्रतिनिधित्व किए गए प्रतिभागियों ने अपने मानव समकक्षों की तुलना में मापदंडों से बेहतर परिणाम प्राप्त किए, जिसे उन्होंने कभी नहीं देखा।

परिणाम, एंथ्रोपिक शोधकर्ता केविन के. ट्रॉय, डायलन शील्ड्स, कीर ब्रैडवेल और पीटर मैकक्रोरी द्वारा लिखे गए, एक एआई-मध्यस्थ बाजार के व्यवहार की अब तक की सबसे स्पष्ट तस्वीर प्रदान करते हैं, जब एजेंट लेन-देन के दोनों पक्षों पर बातचीत कर रहे हों।

वे एक “असहज निहितार्थ” को भी सामने लाते हैं, जिसे कंपनी कहती है कि उद्योग, नियामक और उपयोगकर्ताओं को सामना करना होगा इससे पहले कि एजेंटिक वाणिज्य मुख्यधारा बन जाए।

प्रोजेक्ट डील कैसे काम करता था

प्रयोग दिसंबर 2025 में एक सप्ताह के लिए चला।

एंथ्रोपिक ने 69 कर्मचारियों को भर्ती किया, प्रत्येक को 100 डॉलर का “बजट” दिया (प्रयोग के बाद उपहार कार्ड के रूप में भुगतान किया गया, जो कि वे जो कुछ भी खरीदते या बेचते थे उसके मूल्य के अलावा), और क्लॉड ने प्रत्येक स्वयंसेवक के साथ एक संक्षिप्त साक्षात्कार आयोजित किया ताकि यह पता लगाया जा सके कि वे क्या बेचना चाहते थे, किस कीमत पर, वे क्या खरीदना चाहते थे, और उनके एजेंट को किस प्रकार की बातचीत करनी चाहिए। एंथ्रोपिक ने तब उन उत्तरों को प्रत्येक एजेंट के लिए एक कस्टम सिस्टम प्रॉम्प्ट में बदल दिया।

एंथ्रोपिक ने तब स्लैक चैनलों के अंदर चार समानांतर बाजार चलाए।

“रन ए और रन डी में, हर किसी का एजेंट क्लॉड ओपस 4.5 पर आधारित था, जो हमारा फ्रंटियर मॉडल था,” टीम ने कहा। “दूसरे दो रन (रन बी और सी) में, प्रतिभागियों के पास क्लॉड हाइकु 4.5, एक कम शक्तिशाली मॉडल, के साथ जुड़ने का 50-50 मौका था।”

केवल रन ए वह “वास्तविक” रन था जहां वास्तव में सामान बदले गए; अन्य तीन अध्ययन स्थितियां थीं, और प्रतिभागियों को यह नहीं बताया गया था कि कौन सा रन वास्तविक था जब तक कि प्रयोग के बाद एक सर्वेक्षण नहीं किया गया था।

एक बार एजेंट्स तैनात हो जाने के बाद लूप में कोई मानव नहीं था।

परियोजना के स्लैक चैनल ने एजेंट्स को यादृच्छिक रूप से पोस्ट किया, जिससे वे एक आइटम के लिए बोली लगा सकते थे, किसी और के सामान के लिए प्रस्ताव कर सकते थे, या सौदा कर सकते थे। महत्वपूर्ण बात यह थी कि प्रयोग शुरू होने के बाद कोई मानव हस्तक्षेप नहीं था।

500 से अधिक सूचीबद्ध आइटमों में, एजेंट्स ने मैचों की पहचान की, मूल्य का प्रस्ताव दिया, और सौदे स्वतंत्र रूप से बंद कर दिए। मानव केवल तब फिर से चित्र में आए जब उनके एजेंटों द्वारा सहमत व्यापार के लिए भौतिक रूप से सामान का आदान-प्रदान करना था।

मजबूत मॉडल शांतिपूर्वक बेहतर सौदे की बातचीत करते हैं

मुख्य निष्कर्ष सीधा है: एजेंट की गुणवत्ता महत्वपूर्ण है, और यह डॉलर में महत्वपूर्ण है।

चार रन में से कम से कम दो में बेचे गए 161 आइटमों में, एक ओपस विक्रेता ने औसतन 2.68 डॉलर अधिक प्राप्त किया, जबकि एक ओपस खरीदार ने 2.45 डॉलर कम भुगतान किया। जब एक ओपस विक्रेता का सामना हाइकु खरीदार से हुआ, तो औसत मूल्य 24.18 डॉलर था, जो कि ओपस-ऑन-ओपस सौदों के लिए 18.63 डॉलर था। एंथ्रोपिक का कहना है कि मध्य मूल्य 12 डॉलर और सभी रनों में औसत 20.05 डॉलर के साथ, ये अंतर महत्वपूर्ण नहीं हैं।

व्यक्तिगत मामले तेज थे।

एक ही टूटा हुआ फोल्डिंग बाइक, एक ही खरीदार, एक ही विक्रेता: ओपस एजेंट ने 65 डॉलर प्राप्त किया, हाइकु एजेंट को केवल 38 डॉलर मिले।

एक लैब-ग्रोन रूबी ओपस 65 डॉलर में बिकी, लेकिन जब हाइकु ने सूचीकरण संभाला, तो यह केवल 35 डॉलर में बिकी।

पकड़ यह है कि प्रतिभागियों ने क्या नहीं देखा।

स्पष्ट मूल्य अंतर के बावजूद, हाइकु एजेंट वाले प्रतिभागियों ने अपने सौदों की न्यायपूर्णता को ओपस उपयोगकर्ताओं के समान रेट किया: न्यायपूर्णता स्केल पर 4.06 बनाम 4.05।

“हमारे 28 प्रतिभागियों में से हाइकु और ओपस रन में हाइकु था और दूसरे में ओपस था,” कंपनी ने लिखा। “और हालांकि 17 ने अपने ओपस रन को अपने हाइकु रन से ऊपर रेट किया, 11 ने इसके विपरीत किया।”

एक दूसरा, अधिक विरोधाभासी परिणाम: प्रतिभागियों ने अपने साक्षात्कार साक्षात्कार में जो बातचीत शैली मांगी थी, वह परिणामों पर बिल्कुल भी प्रभाव नहीं डाली।

आक्रामक विक्रेता उच्च कीमतें प्राप्त करते थे, लेकिन केवल इसलिए कि वे शुरू से ही उच्च प्रारंभिक कीमतें निर्धारित करते थे, एंथ्रोपिक का कहना है।

आक्रामक निर्देशों ने बिक्री की संभावना, बिक्री मूल्य या खरीद मूल्य में कोई सांख्यिकीय रूप से महत्वपूर्ण वृद्धि नहीं की, एक बार जब उपयोगकर्ताओं द्वारा निर्धारित उच्च मांग वाली कीमतों को नियंत्रित किया गया। मॉडल चयन प्रॉम्प्टिंग से कहीं अधिक मायने रखता था।

एजेंटिक वाणिज्य के लिए इसका क्या अर्थ है

प्रोजेक्ट डील एक पायलट है, एक उत्पाद नहीं, और एंथ्रोपिक सावधानी से इसकी सीमाओं को ध्वजांकित करता है – एक स्व-चयनित कर्मचारी पूल, कम दांव, और कोई विरोधी अभिनेता नहीं। फिर भी, 46 प्रतिशत प्रतिभागियों ने कहा कि वे ऐसी सेवा के लिए भुगतान करेंगे, जिसे एंथ्रोपिक एजेंट-मध्यस्थ पियर-टू-पियर वाणिज्य के करीब नहीं होने के प्रमाण के रूप में प्रस्तुत करता है।

समय महत्वपूर्ण है क्योंकि एंथ्रोपिक ने क्लॉड को उपभोक्ता लेनदेन की ओर स्पष्ट रूप से मोड़ दिया है। कंपनी ने हाल ही में एक ब्लॉग पोस्ट प्रकाशित किया है जिसमें क्लॉड वार्ताओं को विज्ञापन-मुक्त रखने की प्रतिज्ञा की गई है, स्पष्ट रूप से एजेंटिक वाणिज्य का समर्थन किया गया है, और यह तीसरे पक्ष की सेवाओं में उपयोगकर्ताओं की ओर से कार्य करने के लिए मैनेज्ड एजेंट्स जैसी उद्यम बुनियादी ढांचे का निर्माण कर रही है। प्रोजेक्ट डील एक शोध कलाकृति के रूप में आता है जो उस भविष्य की विफलता मोड को चुपचाप मैप करता है।

एंथ्रोपिक तीन चिंताओं को उठाता है जो प्रयोग से बढ़ती हैं। पहला, कंपनियों के साथ एक दुनिया में, प्रोत्साहन बहुत अलग दिखेंगे। एआई एजेंट ध्यान के लिए अनुकूलन एक शक्तिशाली उपकरण बन सकता है जो लोगों के पक्ष में काम नहीं करता है।

दूसरा, एआई एजेंट ध्यान – मानव ध्यान के बजाय – के लिए अनुकूलन नई मैनिपुलेशन सतहों को पेश कर सकता है, जिनमें जेलब्रेकिंग और प्रॉम्प्ट इंजेक्शन शामिल हैं।

तीसरा, “एआई मॉडल के आसपास की नीति और कानूनी ढांचे जो हमारे नाम पर लेन-देन करते हैं वे अभी तक मौजूद नहीं हैं,” कंपनी लिखती है।

अनुत्तरित प्रश्न यह है कि क्या खुलासा धारणा अंतर को बंद कर सकता है। प्रोजेक्ट डील प्रतिभागियों को यह नहीं पता था कि कौन सा मॉडल उनका प्रतिनिधित्व कर रहा था, जो कि उपयोगकर्ताओं के सामने आने वाली स्थिति के लगभग बराबर है जब वे किसी उपभोक्ता रोलआउट में होंगे। यदि ओपस और हाइकु के बीच एक न्यायपूर्णता अंतर एंथ्रोपिक कार्यबल में एक स्व-चयनित आंतरिक प्रयोग में $100 के दांव के साथ दिखाई नहीं देता है, तो यह संभवतः पैमाने पर दिखाई नहीं देगा – जब तक कि बाजारों को यह प्रकट नहीं करना पड़े कि कौन सा एजेंट किसके लिए और किस क्षमता स्तर पर कार्य कर रहा है। यह वह नियामक प्रश्न है जिसे एंथ्रोपिक अब सार्वजनिक रूप से आमंत्रित कर रहा है, और यह सबसे अधिक संभावना है कि एजेंट-मध्यस्थ वाणिज्य सैन फ्रांसिस्को में एक स्लैक चैनल से परे जाने पर पहले उत्तर देगा।

рдПрд▓реЗрдХреНрд╕ рдореИрдХрдлрд╛рд░рд▓реИрдВрдб рдПрдХ рдПрдЖрдИ рдкрддреНрд░рдХрд╛рд░ рдФрд░ рд▓реЗрдЦрдХ рд╣реИрдВ рдЬреЛ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдореЗрдВ рдирд╡реАрдирддрдо рд╡рд┐рдХрд╛рд╕реЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЙрдиреНрд╣реЛрдВрдиреЗ рд╡рд┐рд╢реНрд╡рднрд░ рдХреЗ рдХрдИ рдПрдЖрдИ рд╕реНрдЯрд╛рд░реНрдЯрдЕрдкреНрд╕ рдФрд░ рдкреНрд░рдХрд╛рд╢рдиреЛрдВ рдХреЗ рд╕рд╛рде рд╕рд╣рдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИред

рд╡рд┐рдЬреНрдЮрд╛рдкрди рдкреНрд░рдХрдЯреАрдХрд░рдг: Unite.AI рд╕рдЯреАрдХ рдЬрд╛рдирдХрд╛рд░реА рдФрд░ рд╕рдорд╛рдЪрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдареЛрд░ рд╕рдВрдкрд╛рджрдХреАрдп рдорд╛рдирдХреЛрдВ рдХреЗ рдкреНрд░рддрд┐ рдкреНрд░рддрд┐рдмрджреНрдз рд╣реИред рдЬрдм рдЖрдк рдЙрди рдЙрддреНрдкрд╛рджреЛрдВ рдХреЗ рд▓рд┐рдВрдХ рдкрд░ рдХреНрд▓рд┐рдХ рдХрд░рддреЗ рд╣реИрдВ рдЬрд┐рдирдХреА рд╣рдордиреЗ рд╕рдореАрдХреНрд╖рд╛ рдХреА рд╣реИ, рддреЛ рд╣рдореЗрдВ рдореБрдЖрд╡рдЬрд╛ рдорд┐рд▓ рд╕рдХрддрд╛ рд╣реИред