Connect with us

Η Συμφωνία του Anthropic Επιτρέπει στους Πρακτορείς Claude να Ανταλλάσσουν Πραγματικά Εμπορεύματα

Τεχνητή νοημοσύνη

Η Συμφωνία του Anthropic Επιτρέπει στους Πρακτορείς Claude να Ανταλλάσσουν Πραγματικά Εμπορεύματα

mm

Το Anthropic στις 24 Απριλίου δημοσίευσε τα αποτελέσματα του “Project Deal,” ενός εβδομαδιαίου εσωτερικού πειράματος στο οποίο οι πράκτορες Claude αγόρασαν και πούλησαν πραγματικά αντικείμενα για λογαριασμό 69 υπαλλήλων στο γραφείο της εταιρείας στο Σαν Φρανσίσκο.

Οι πράκτορες κατέληξαν σε 186 συμφωνίες αξίας λίγο πάνω από 4.000 δολάρια – και η μελέτη διαπίστωσε ότι οι συμμετέχοντες που αντιπροσωπεύονταν από ισχυρότερες μοντέλα απέκτησαν μετρήσιμα καλύτερα αποτελέσματα που οι ανθρώπινοι ομόλογοί τους δεν έnoticed.

Τα ευρήματα, που γράφτηκαν από τους ερευνητές του Anthropic Kevin K. Troy, Dylan Shields, Keir Bradwell και Peter McCrory, δίνουν την πιο καθαρή εικόνα μέχρι τώρα για το πώς θα συμπεριφερθεί μια αγορά που μεσολαβείται από AI όταν οι πράκτορες διαπραγματεύονται και στις δύο πλευρές μιας συναλλαγής.

Επίσης, επιφέρουν μια “αδύνατη επιπτώσεις” που η εταιρεία λέει ότι η βιομηχανία, οι ρυθμιστές και οι χρήστες θα πρέπει να αντιμετωπίσουν πριν η εμπορική αγentic γίνει mainstream.

Πώς Λειτουργούσε το Project Deal

Το πείραμα διήρκεσε για μία εβδομάδα τον Δεκέμβριο του 2025.

Το Anthropic προσέλαβε 69 υπαλλήλους, έδωσε σε κάθε ένα “προϋπολογισμό” των 100 δολαρίων (πληρωμένα μετά το πείραμα με τη μορφή δωροκάρτας, συν ή πλην της αξίας ό,τι αγόρασαν ή πούλησαν) και είχε τον Claude να διεξάγει μια σύντομη συνέντευξη με κάθε εθελοντή για να κατανοήσει τι ήθελαν να πουλήσουν, σε ποια τιμή, τι ήθελαν να αγοράσουν και ποιο είδος διαπραγματευτικής τακτικής ο πράκτοράς τους θα πρέπει να χρησιμοποιήσει. Το Anthropic μετέτρεψε αυτές τις απαντήσεις σε ένα προσαρμοσμένο σύστημα προτροπής για κάθε πράκτορα.

Το Anthropic τότε έτρεξε τέσσερις παράλληλες αγορές μέσα σε κανάλια Slack.

Στις Διαδρομές A και D, ο πράκτορας κάθε personne ήταν βασισμένος στο Claude Opus 4.5, το μοντέλο μας τότε-μετωπικό,” είπε η ομάδα. “Στις άλλες δύο διαδρομές (Διαδρομές B και C), οι συμμετέχοντες είχαν 50% πιθανότητα να ανατεθούν στο Claude Haiku 4.5, ένα λιγότερο ισχυρό μοντέλο, αντίθετα.”

Μόνο η Διαδρομή A ήταν η “πραγματική” διαδρομή όπου τα εμπορεύματα άλλαξαν χέρια αργότερα· οι άλλες τρεις ήταν συνθήκες μελέτης και οι συμμετέχοντες δεν ενημερώθηκαν ποια διαδρομή ήταν πραγματική μέχρι μετά μια μετεξέτασης.

Δεν υπήρχε άνθρωπος στο βρόχο μια φορά που οι πράκτορες αναπτύχθηκαν.

Το κανάλι Slack του έργου τυχαία επαναλάμβανε τους πράκτορες, επιτρέποντάς τους να δημοσιεύσουν ένα αντικείμενο προς πώληση, να κάνουν μια προσφορά για τα εμπορεύματα κάποιου άλλου ή να κλείσουν μια συμφωνία. Κρίσιμο, δεν υπήρχε ανθρώπινη παρέμβαση μια φορά που το πείραμα ξεκίνησε.

Σε περισσότερα από 500 καταχωρημένα αντικείμενα, οι πράκτορες ταυτοποίησαν τις αντιστοιχίες, πρότειναν τιμές και έκλεισαν συμφωνίες αυτονομamente. Οι άνθρωποι επανεισήλθαν στην εικόνα μόνο στο τέλος για να ανταλλάξουν φυσικά τα εμπορεύματα που οι πράκτορές τους είχαν συμφωνήσει να ανταλλάξουν.

Ισχυρότεροι Πράκτορες Διαπραγματεύονται Σιωπηλά Καλύτερες Συμφωνίες

Η ενημερωμένη εύρεση είναι απλή: η ποιότητα του πράκτορα έχει σημασία και έχει σημασία σε δολάρια.

Σε 161 αντικείμενα που πωλήθηκαν σε τουλάχιστον δύο από τις τέσσερις διαδρομές, ένας πωλητής Opus έπαιρνε κατά μέσο όρο 2,68 δολάρια περισσότερα, ενώ ένας αγοραστής Opus πλήρωσε 2,45 δολάρια λιγότερα. Όταν ένας πωλητής Opus αντιμετώπισε έναν αγοραστή Haiku, η μέση τιμή έφτασε τα 24,18 δολάρια, σε σύγκριση με 18,63 δολάρια για συμφωνίες Opus-on-Opus. Με μέση τιμή 12 δολαρίων και μέσο όρο 20,05 δολαρίων σε όλες τις διαδρομές, το Anthropic λέει ότι αυτοί οι χάσματα δεν είναι τριβή.

Ατομικές περιπτώσεις ήταν πιο οξυδερκείς.

Το ίδιο σπασμένο ποδήλατο, ο ίδιος αγοραστής, ο ίδιος πωλητής: ο πράκτορας Opus έλαβε 65 δολάρια, ο πράκτορας Haiku μόνο 38 δολάρια.

Ένα εργαστηριακά καλλιεργημένο ρουμπίνι Opus που πουλήθηκε για 65 δολάρια, έπαιρνε μόνο 35 δολάρια όταν ο Haiku χειριζόταν την καταχώρηση.

Το πρόβλημα είναι τι οι συμμετέχοντες δεν αντιλήφθηκαν.

Παρά την σαφή διαφορά τιμής, οι συμμετέχοντες με πράκτορες Haiku αξιολόγησαν την αξιοπρέπεια των συμφωνιών τους σχεδόν την ίδια με τους χρήστες Opus: 4,06 έναντι 4,05 στην κλίμακα της αξιοπρέπειας.

“Είκοσι οκτώ από τους συμμετέχοντες μας είχαν Haiku σε μια Haiku-and-Opus διαδρομή και Opus σε μια άλλη. Και mặc dù 17 από αυτούς κατέταξαν την Opus διαδρομή τους πάνω από την Haiku διαδρομή τους, 11 έκαναν το αντίθετο,” έγραψε η εταιρεία.

Ένα δεύτερο, πιο αντίθετο αποτέλεσμα: οι τακτικές διαπραγμάτευσης που οι συμμετέχοντες ζήτησαν στις συνεντεύξεις τους σχεδόν δεν επηρέασαν τα αποτελέσματα.

Οι επιθετικοί πωλητές έπαιρναν υψηλότερες τιμές, αλλά μόνο επειδή έθεσαν υψηλότερες αρχικές τιμές από την αρχή, λέει το Anthropic.

Οι επιθετικές οδηγίες δεν παρήγαγαν keine στατιστικά σημαντική αύξηση στη πιθανότητα πώλησης, την τιμή πώλησης ή την τιμή αγοράς, μια φορά που οι υψηλότερες ζητούμενες τιμές που οι χρήστες ορίστηκαν ελέγχθηκαν. Η επιλογή μοντέλου είχε σημασία πολύ περισσότερο από την προτροπή.

Τι Σημαίνει για την Εμπορική Agentic

Το Project Deal είναι ένα πιλότο, όχι ένα προϊόν, και το Anthropic είναι προσεκτικό να σημειώσει τα όρια — ένα αυτοεκλεγμένο εργατικό δυναμικό, χαμηλά στοιχήματα και κανένα εχθρικό παράγοντα. Παρ ‘όλα αυτά, το 46% των συμμετεχόντων είπε ότι θα πλήρωναν για μια υπηρεσία σαν αυτή, κάτι που το Anthropic παρουσιάζει ως απόδειξη ότι η εμπορική αγentic peer-to-peer δεν είναι μακριά.

Αυτό το χρονικό σημείο έχει σημασία επειδή το Anthropic έχει οδηγήσει ορατά τον Claude προς τις καταναλωτικές συναλλαγές. Η εταιρεία δημοσίευσε πρόσφατα ένα blog post που δεσμεύεται να διατηρήσει τις συνομιλίες του Claude χωρίς διαφημίσεις, ενώ ενθαρρύνει ρητά την εμπορική agentic και έχει κατασκευάσει υποδομή επιχείρησης όπως Managed Agents για να επιτρέψει στον Claude να ενεργήσει για λογαριασμό των χρηστών σε υπηρεσίες τρίτων. Το Project Deal προσγειώνεται ως ένα ερευνητικό артеφάκτ που χαρτογραφεί σιωπηλά τις μεθόδους αποτυχίας του μελλοντικού.

Το Anthropic σημειώνει τρεις ανησυχίες που αναπτύσσονται από το πείραμα. Πρώτον, σε ένα κόσμο με εταιρείες αντί για εθελοντές, οι ενθαρρύνσεις θα φαίνονταν πολύ διαφορετικές. Η βελτιστοποίηση για την προσοχή του πράκτορα AI θα μπορούσε να γίνει ένα ισχυρό εργαλείο που δεν λειτουργεί αναγκαστικά προς όφελος των ανθρώπων.

Δεύτερον, η βελτιστοποίηση των συστημάτων για την προσοχή του πράκτορα AI — αντί για την ανθρώπινη προσοχή — θα μπορούσε να εισαγάγει νέες επιφάνειες χειραγώγησης, συμπεριλαμβανομένης της jailbreaking και prompt injection.

Τρίτον, “τα πολιτικά και νομικά πλαίσια γύρω από τα μοντέλα AI που συναλλάσσονται για λογαριασμό μας απλά δεν υπάρχουν ακόμη,” γράφει η εταιρεία.

Η ανυπαντρόητη ερώτηση είναι αν η αποκάλυψη μπορεί να κλείσει το χάσμα αντίληψης. Οι συμμετέχοντες του Project Deal δεν γνώριζαν ποιο μοντέλο τους αντιπροσώπευε, το οποίο είναι περίπου η κατάσταση που οι χρήστες θα αντιμετωπίσουν σε οποιαδήποτε καταναλωτική κυκλοφορία. Αν ένα χάσμα αξιοπρέπειας μεταξύ Opus και Haiku είναι αόρατο μέσα σε ένα αυτοεκλεγμένο εργατικό δυναμικό του Anthropic που τρέχει ένα εβδομαδιαίο πείραμα με στοιχήματα 100 δολαρίων, θα είναι πιθανό να είναι αόρατο σε κλίμακα — εκτός αν οι αγορές απαιτούν να αποκαλύψουν ποιο πράκτορας ενεργεί για ποιον και σε ποιο επίπεδο ικανότητας. Αυτό είναι το είδος της ρυθμιστικής ερώτησης που το Anthropic τώρα δημόσια προσκαλεί, και είναι αυτή που πιθανότατα θα προσγειωθεί πρώτα όταν η εμπορική agentic ξεπεράσει ένα κανάλι Slack στο Σαν Φρανσίσκο.

Ο Alex McFarland είναι δημοσιογράφος και συγγραφέας του AI που εξερευνά τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη. Έχει συνεργαστεί με πολλές startups και εκδόσεις του AI σε όλο τον κόσμο.