Ηγέτες σκέψης

Οι Υποσχέθηκαν να μας Δώσουν Πράκτορες, αλλά Ότι Παίρναμε Ήταν Στατικές Αλυσίδες

Published February 10, 2025

Updated April 26, 2026

Amnon Morag, VP of Product, AI21

Την άνοιξη του 2023, ο κόσμος ενθουσιάστηκε με την εμφάνιση των πρακτόρων AI που βασίζονται σε LLM. Δυνατά demos όπως το AutoGPT και το BabyAGI επέδειξαν το δυναμικό των LLMs που τρέχουν σε βρόχο, επιλέγοντας την επόμενη ενέργεια, παρατηρώντας τα αποτελέσματά της και επιλέγοντας την επόμενη ενέργεια, ένα βήμα κάθε φορά (γνωστό και ως πλαίσιο ReACT). Αυτή η νέα μέθοδος αναμενόταν να δώσει ενέργεια σε πράκτορες που θα εκτελούσαν αυτόνομα και γενικά πολυ-βήματα εργασίες. Δώστε τους ένα στόχο και ένα σύνολο εργαλείων και θα φροντίσουν για το υπόλοιπο. Μέχρι το τέλος του 2024, το τοπίο θα ήταν γεμάτο από πράκτορες AI και πλαίσια κατασκευής πρακτόρων. Αλλά πώς μετρούνται ενάντια στην υπόσχεση;

Είναι ασφαλές να πούμε ότι οι πράκτορες που τροφοδοτούνται από το ναΐφ πλαίσιο ReACT υποφέρουν από σοβαρές περιορισμούς. Δώστε τους μια εργασία που απαιτεί περισσότερα από quelques βήματα, χρησιμοποιώντας περισσότερα από quelques εργαλεία και θα αποτύχουν με λύπη. Πέρα από τα προφανή προβλήματα καθυστέρησης, θα χάσουν την πορεία, θα αποτύχουν να ακολουθήσουν τις οδηγίες, θα σταματήσουν πολύ νωρίς ή πολύ αργά και θα παράγουν άγρια διαφορετικά αποτελέσματα σε κάθε προσπάθεια. Και δεν είναι kein θαύμα. Το πλαίσιο ReACT παίρνει τις περιορισμούς των απρόβλεπτων LLMs και τις ενισχύει με τον αριθμό των βημάτων. Ωστόσο, οι κατασκευαστές πρακτόρων που επιδιώκουν να λύσουν πραγματικές περιπτώσεις χρήσης, ιδιαίτερα στην επιχείρηση, δεν μπορούν να κάνουν με αυτό το επίπεδο απόδοσης. Χρειάζονται αξιόπιστα, προβλέψιμα και εξηγημένα αποτελέσματα για σύνθετες πολυ-βήματα εργασίες. Και χρειάζονται συστήματα AI που μετριάζουν, αντί να ενισχύουν, την απρόβλεπτη φύση των LLMs.

Τότε, πώς κατασκευάζονται οι πράκτορες στην επιχείρηση σήμερα; Για περιπτώσεις χρήσης που απαιτούν περισσότερα από quelques εργαλεία και quelques βήματα (π.χ. συνομιλώντας RAG), οι κατασκευαστές πρακτόρων έχουν largamente εγκαταλείψει την δυναμική και αυτόνομη υπόσχεση του ReACT για μεθόδους που βασίζονται nặng στα στατικά chain – τη δημιουργία προκαθορισμένων αλυσίδων που σχεδιάζονται για να λύσουν μια συγκεκριμένη περίπτωση χρήσης. Αυτή η προσέγγιση μοιάζει με την παραδοσιακή μηχανική λογισμικού και είναι μακριά από την υπόσχεση του ReACT. Επιτυγχάνει υψηλότερα επίπεδα ελέγχου και αξιοπιστίας αλλά λείπει αυτονομία και ευελιξία. Οι λύσεις είναι επομένως εντατικές στην ανάπτυξη, στενές στην εφαρμογή και πολύ σκληρές για να αντιμετωπίσουν υψηλά επίπεδα παραλλαγής στο χώρο εισόδου και το περιβάλλον.

Για να είμαστε σίγουροι, οι πρακτικές στατικών αλυσίδων μπορούν να ποικίλλουν στο πόσο “στατικές” είναι. Ορισμένες αλυσίδες χρησιμοποιούν LLMs μόνο για να εκτελέσουν ατομικά βήματα (για παράδειγμα, για να εξαγάγουν πληροφορίες, να συνοψίσουν κείμενο ή να κατασκευάσουν ένα μήνυμα) ενώ άλλες χρησιμοποιούν επίσης LLMs για να λάβουν ορισμένες αποφάσεις δυναμικά κατά την εκτέλεση (για παράδειγμα, ένα LLM routing μεταξύ εναλλακτικών ροών στην αλυσίδα ή ένα LLM που επικυρώνει το αποτέλεσμα ενός βήματος για να καθορίσει αν πρέπει να εκτελεστεί ξανά). Σε κάθε περίπτωση, όσο τα LLMs είναι υπεύθυνα για οποιαδήποτε δυναμική λήψη αποφάσεων στη λύση – είμαστε αναπόφευκτα παγιδευμένοι σε ένα tradeoff μεταξύ αξιοπιστίας και αυτονομίας. Όσο μια λύση είναι στατική, είναι πιο αξιόπιστη και προβλέψιμη αλλά και λιγότερο αυτόνομη και επομένως στενότερη στην εφαρμογή και πιο εντατική στην ανάπτυξη. Όσο μια λύση είναι δυναμική και αυτόνομη, είναι πιο γενική και απλή να κατασκευαστεί αλλά και λιγότερο αξιόπιστη και προβλέψιμη.

Αυτό το tradeoff μπορεί να αναπαρασταθεί στο ακόλουθο γράφημα:

Αυτό μας οδηγεί στο ερώτημα, γιατί δεν έχουμε δει ακόμη ένα πλαίσιο πρακτόρων που μπορεί να τοποθετηθεί στην άνω δεξιά quadrant; Είμαστε καταδικασμένοι να ανταλλάξουμε την αξιοπιστία για αυτονομία; Δεν μπορούμε να πάρουμε ένα πλαίσιο που παρέχει τη απλή διεπαφή ενός πρακτόρα ReACT (πάρτε einen στόχο και ένα σύνολο εργαλείων και φροντίστε για το υπόλοιπο) χωρίς να θυσιάζουμε την αξιοπιστία;

Η απάντηση είναι – μπορούμε και θα το κάνουμε! Αλλά για αυτό, πρέπει να συνειδητοποιήσουμε ότι το κάνουμε όλα λάθος. Όλα τα τρέχοντα πλαίσια κατασκευής πρακτόρων μοιράζονται ένα κοινό ελάττωμα: βασίζονται στα LLMs ως το δυναμικό, αυτόνομο συστατικό. Ωστόσο, το κρίσιμο στοιχείο που λείπει – αυτό που χρειάζεται για να δημιουργήσουμε πράκτορες που είναι και αυτόνομοι και αξιόπιστοι – είναι η τεχνολογία σχεδιασμού. Και τα LLMs δεν είναι μεγάλοι σχεδιαστές.

Αλλά πρώτα, τι είναι “σχεδιασμός”; Με “σχεδιασμό” εννοούμε την ικανότητα να μοντελοποιήσουμε ρητά εναλλακτικές πορείες δράσης που οδηγούν σε ένα επιθυμητό αποτέλεσμα και να εξερευνήσουμε και να εκμεταλλευτούμε αυτές τις εναλλακτικές υπό περιορισμούς προϋπολογισμού. Ο σχεδιασμός πρέπει να γίνει τόσο στο μακροscopic όσο και στο μικροscopic επίπεδο. Ένας μακρο-σχεδιασμός διασπάει μια εργασία σε εξαρτημένες και ανεξάρτητες βήματα που πρέπει να εκτελεστούν για να επιτευχθεί το επιθυμητό αποτέλεσμα. Τι συχνά παραβλέπεται είναι η ανάγκη για μικρο-σχεδιασμό που στοχεύει να εγγυηθεί επιθυμητά αποτελέσματα στο επίπεδο του βήματος. Υπάρχουν πολλές διαθέσιμες στρατηγικές για την αύξηση της αξιοπιστίας και την επίτευξη εγγυήσεων στο επίπεδο του đơnου βήματος χρησιμοποιώντας περισσότερη υπολογιστική ισχύ. Για παράδειγμα, μπορείτε να παραφράσετε ερωτήσεις αναζήτησης σημασιολογικής αναζήτησης πολλές φορές, μπορείτε να ανακτήσετε περισσότερο контекст ανά ερώτηση, μπορείτε να χρησιμοποιήσετε ένα μεγαλύτερο μοντέλο και μπορείτε να πάρτε περισσότερες ερμηνείες από ένα LLM – όλα αυτά οδηγούν σε περισσότερα αποτελέσματα που ικανοποιούν τις απαιτήσεις από τα οποία να επιλέξετε το καλύτερο. Ένας καλός μικρο-σχεδιαστής μπορεί να χρησιμοποιήσει αποτελεσματικά την υπολογιστική ισχύ για να επιτύχει τα καλύτερα αποτελέσματα υπό einen δεδομένο προϋπολογισμό υπολογιστικής ισχύος και καθυστέρησης. Για να κλιμακωθεί η επένδυση πόρων ανάλογα με την ανάγκη της συγκεκριμένης εργασίας. Έτσι, οι σχεδιαστικοί AI συστήματα μπορούν να μετριάζουν την πιθανοτική φύση των LLMs για να επιτύχουν εγγυημένα αποτελέσματα στο επίπεδο του βήματος. Χωρίς τέτοιες εγγυήσεις, είμαστε πίσω στο πρόβλημα της συσσωρευμένης σφάλματος που θα υπονομεύσει ακόμη και τον καλύτερο μακρο-σχεδιασμό.

Αλλά γιατί δεν μπορούν τα LLMs να υπηρετήσουν ως σχεδιαστές; Μετά από όλα, είναι ικανοί να μεταφράζουν υψηλού επιπέδου οδηγίες σε λογικές αλυσίδες σκέψης ή σχέδια που ορίζονται σε φυσική γλώσσα ή κώδικα. Ο λόγος είναι ότι ο σχεδιασμός απαιτεί περισσότερα από αυτά. Ο σχεδιασμός απαιτεί την ικανότητα να μοντελοποιήσουμε εναλλακτικές πορείες δράσης που μπορεί να οδηγήσουν σε ένα επιθυμητό αποτέλεσμα ΚΑΙ να συλλογιστούμε για την αναμενόμενη उपयτικότητα και αναμενόμενα κόστη (σε υπολογιστική ισχύ και/ή καθυστέρηση) κάθε εναλλακτικής. Ενώ τα LLMs μπορούν να παράγουν αναπαραστάσεις των διαθέσιμων πορειών δράσης, δεν μπορούν να προβλέψουν την αναμενόμενη उपयτικότητα και κόστη. Για παράδειγμα, τι είναι η αναμενόμενη उपयτικότητα και κόστη της χρήσης του μοντέλου X αντί του μοντέλου Y για να παράγει μια απάντηση ανά einen συγκεκριμένο контекスト; Τι είναι η αναμενόμενη उपयτικότητα της αναζήτησης για ένα συγκεκριμένο κομμάτι πληροφορίας στο corpus εγγεγραμμένων εγγράφων αντί μιας κλήσης API στο CRM; Το LLM σας δεν έχει κανένα άγνοια. Και για καλό λόγο – ιστορικές ιχνηλατήσεις αυτών των πιθανοτικών ιδιοτήτων σπάνια βρίσκονται στη φύση και δεν περιλαμβάνονται στα δεδομένα εκπαίδευσης των LLMs. Επίσης, tend να είναι συγκεκριμένα στο συγκεκριμένο εργαλείο και περιβάλλον δεδομένων στο οποίο το σύστημα AI θα λειτουργήσει, αντί της γενικής γνώσης που τα LLMs μπορούν να αποκτήσουν. Και ακόμη και αν τα LLMs μπορούσαν να προβλέψουν την αναμενόμενη उपयτικότητα και κόστη, η συλλογιστική για αυτές τις εναλλακτικές για να επιλέξουν την πιο αποτελεσματική πορεία δράσης είναι μια λογική αποφασιστική αφαίρεση, που δεν μπορεί να υποτεθεί ότι θα εκτελεστεί αξιόπιστα από τις προβλέψεις του επόμενου token των LLMs.

Τότε, ποια είναι τα λείπαντα συστατικά για την τεχνολογία σχεδιασμού AI; Χρειάζουμε μοντέλα σχεδιαστών που μπορούν να μάθουν από την εμπειρία και την προσομοίωση για να μοντελοποιήσουν ρητά εναλλακτικές πορείες δράσης και αντίστοιχες πιθανότητες उपयτικότητας και κόστους ανά μια συγκεκριμένη εργασία σε ένα συγκεκριμένο εργαλείο και περιβάλλον δεδομένων. Χρειάζουμε μια Γλώσσα Ορισμάτων Σχεδιασμού (PDL) που μπορεί να χρησιμοποιηθεί για να αναπαραστήσει και να συλλογιστεί για τις εναλλακτικές πορείες δράσης και πιθανότητες. Χρειάζουμε einen μηχανισμό εκτέλεσης που μπορεί να εκτελέσει deterministically και αποτελεσματικά einen δεδομένο σχεδιασμό που ορίζεται σε PDL.

Ορισμένοι άνθρωποι είναι ήδη σκληρά στη δουλειά για να παραδώσουν αυτή την υπόσχεση. Μέχρι τότε, συνεχίστε να κατασκευάζετε στατικές αλυσίδες. Απλώς μην τις ονομάζετε “πράκτορες”.

Unite.AI

Οι Υποσχέθηκαν να μας Δώσουν Πράκτορες, αλλά Ότι Παίρναμε Ήταν Στατικές Αλυσίδες

You may like