Connect with us

Γιατί το 95% των Πρωτοβουλιών AI Παρέχουν Μηδέν Επίδοση από την Επενδύση

Ηγέτες σκέψης

Γιατί το 95% των Πρωτοβουλιών AI Παρέχουν Μηδέν Επίδοση από την Επενδύση

mm

Μια πρόσφατη μελέτη του MIT βρήκε ότι το 95% των οργανισμών δεν λαμβάνουν κανένα οφέλους από τις πρωτοβουλίες γεννητικής AI· καμία μετρήσιμη επίδραση στο ισοζύγιο κερδών και ζημιών παρά την σημαντική επένδυση. Τα заголовλα εστίασαν στην τακτική αποτυχία, αλλά η πραγματική ερώτηση δεν είναι αν η τεχνολογία λειτουργεί. Τα Μεγάλα Γλωσσικά Μοντέλα είναι ισχυρά, προσιτά και βελτιώνονται γρήγορα. Το πρόβλημα είναι το πώς οι επιχειρήσεις προσπαθούν να τα χρησιμοποιήσουν.

Οι περισσότερες οργανώσεις προσεγγίζουν τους πράκτορες AI με τον ίδιο τρόπο που προσεγγίζουν κάθε άλλη τεχνολογική αναβάθμιση. Λαμβάνουν τις υπάρχουσες διαδικασίες, προσθέτουν κάποιο AI και περιμένουν το μαγικό αποτέλεσμα. Όταν δεν λειτουργεί, κατηγορούν τα μοντέλα. Nhưng η αποτυχία συμβαίνει πολύ πριν το AI εμπλακεί.

Έχω δει αυτό το μοτίβο επανειλημμένα σε επιχειρήσεις που xây dựng ροές εργασιών AI. Οι ομάδες ενθουσιάζονται με τις δυνατότητες, βάζουν ταχύτητα στην ανάπτυξη και στη συνέχεια χτυπούν τα ίδια προβλέψιμα εμπόδια. Η διαφορά μεταξύ του 5% που έχει επιτυχία και του 95% που παράγει μηδέν απόδοση δεν είναι τύχη ή προϋπολογισμός· είναι η αποφυγή έξι κρίσιμων λαθών που σκοτώνουν την αξία των πρακτόρων AI πριν ξεκινήσει.

Τα δεδομένα σας είναι πιο ακατάστατα από ότι νομίζετε

Οι περισσότερες ομάδες πιστεύουν ότι το να έχουν δεδομένα σημαίνει ότι είναι έτοιμες για το AI. Δείχνουν στη λίμνη δεδομένων τους, στο CRM, στις προσεκτικά διατηρούμενες βάσεις δεδομένων και υποθέτουν ότι η επιτυχία είναι εγγυημένη. Στη συνέχεια ρίχνουν όλα αυτά σε ένα LLM και αναρωτιούνται γιατί ο πράκτορας τους παράγει σκουπίδια εξόδους ή καίει τον προϋπολογισμό τους σε λίγες μέρες.

Τα ακατάστατα δεδομένα δημιουργούν ακατάστατους πράκτορες. Αν στέλνετε ακατέργαστες εξαγωγές βάσης δεδομένων, εξαγωγές που περιέχουν HTML ή ακατάστατο κείμενο σε einen πράκτορα AI, το ρίχνετε σε αποτυχία. Τα μοντέλα μπερδεύονται από μη σχετικά πεδία, αποσπάται η προσοχή τους από τεχνολογικά κατάλοιπα και υπερφορτώνονται από την πλήθους.

Οι ομάδες στέλνουν συνήθως εγγραφές πελατών με 47 πεδία όταν μόνο τα 3 είναι αποφασιστικά κρίσιμα. Περιλαμβάνουν UUIDs που δεν προσθέτουν κανένα σημασιολογικό όφελος αλλά καίουν πολύτιμους tokens. Τρέφουν τους πράκτορες με HTML που έχει σκαφτεί από εσωτερικά εργαλεία αντί για καθαρές, δομημένες πληροφορίες.

Θα χτυπήσετε τα όρια πιο γρήγορα από ότι περιμένετε

Κάθε ομάδα πιστεύει ότι δεν θα χτυπήσει τα όρια του контекστ. “Επεξεργαζόμαστε μόνο quelques εγγραφές πελατών”, λένε. “Πόσο δύσκολο μπορεί να είναι;” Στη συνέχεια ο πράκτορας τους χρειάζεται να αναλύσει 500 εισερχόμενες εγγραφές υποστήριξης, каждая με πλήρη ιστορία συνομιλίας, και ξαφνικά χτυπούν τα όρια των εκατομμυρίων tokens.

Οι μεγάλες περιπτώσεις συσσωρεύονται πιο γρήγορα από ότι κανείς περιμένει. Ένας πράκτορας υποστήριξης που χειρίζεται αναβαθμίσεις μπορεί να χρειάζεται πρόσβαση σε ιστορικό εισερχομένων, άρθρα γνώσεων, προηγούμενες συναλλαγές και τεκμηρίωση προϊόντων. Αυτό είναι εύκολα εκατοντάδες χιλιάδες tokens ανά αίτηση. Πολλαπλασιάστε αυτό με τα ταυτόχρονα χρήστες και οι κόστη υποδομής σας εκτοξεύονται εκτός ελέγχου.

Η ανοησία προσέγγιση είναι να στείλετε όλα στο μοντέλο και να ελπίζετε στο καλύτερο. Οι έξυπνες ομάδες σπάουν τις αιτήσεις σε κομμάτια, συνοψίζουν κάθε κομμάτι και στη συνέχεια λειτουργούν σε μια περίληψη των περιλήψεων. Αυτή η ιεραρχική περίληψη διατηρεί τις αιτήσεις διαχειρίσιμες ενώ διατηρεί τις κρίσιμες πληροφορίες που οι πράκτορες χρειάζονται για να λάβουν καλές αποφάσεις.

Η ασφάλεια γίνεται σύνθετη γρήγορα

Οι ομάδες ενθουσιάζονται με την προσωπικότητα του πράκτορα AI και τις ικανότητές του, γράφουν κάποιες βασικές οδηγίες και πιστεύουν ότι είναι προστατευμένες. Στην πραγματικότητα, οι πράκτορες AI απαιτούν θεμελιωδώς διαφορετική σκέψη ασφάλειας από τις παραδοσιακές εφαρμογές.

Οι πράκτορες AI μπορούν να εξαπατηθούν, να χειραγωγηθούν και να πιεστούν με τρόπους που σπάζουν τις συμβατικές μοντέλα ασφάλειας. Οι εισαγωγές χρηστών μπορούν να περιέχουν κρυφές οδηγίες που αντικαθιστούν τις προσεκτικά σχεδιασμένες οδηγίες σας. Οι πράκτορες μπορούν να πειστούν να αγνοήσουν τις οδηγίες τους, να προσεγγίσουν δεδομένα που δεν πρέπει να δουν ή να λάβουν δράσεις έξω από τον προβλεπόμενο σκοπό.

Οι έξυπνες εφαρμογές απαιτούν αυστηρά όρια γύρω από αυτό που οι πράκτορες μπορούν και δεν μπορούν να κάνουν. Για οτιδήποτε αλλάζει κατάσταση· γράφει δεδομένα, στέλνει emails, κάνει κλήσεις API· χρειάζεστε μια προταση-απολογία-έγκριση ροή εργασιών. Ο πράκτορας εξηγεί τι θέλει να κάνει και γιατί, και στη συνέχεια περιμένει την έγκριση του ανθρώπου πριν ενεργήσει. Αυτό αποτρέπει την τρελή αυτοματοποίηση ενώ διατηρεί τα οφέλη της βοήθειας AI.

Τι λειτουργεί στην πραγματικότητα

Από το να παρακολουθείτε εκατοντάδες εφαρμογές πρακτόρων AI, έξι πρακτικές διακρίνουν τις επιτυχείς αναπτύξεις από τις ακριβές αποτυχίες.

Πρώτα είναι η υγιεινή δεδομένων. Στέλνετε συμπαγές, τυποποιημένο JSON με σταθερές σχήματα. Αφαιρέστε UUIDs, HTML, διπλότυπα πεδία και οποιαδήποτε ευαίσθητα δεδομένα trừ εάν είναι αποφασιστικά κρίσιμα. Αντικαταστήστε ευαίσθητα δεδομένα με μεταδεδομένα όταν είναι δυνατό. Αυτό διατηρεί τα μοντέλα εστιασμένα ενώ κόβει το μέγεθος του φορτίου, το κόστος και την καθυστέρηση.

Δεύτερο είναι η διαχείριση контекστ. Θα χτυπήσετε τα όρια των tokens πιο γρήγορα από ότι περιμένετε. Σπάστε τις αιτήσεις σε μικρότερα κομμάτια, συνοψίστε κάθε ένα και στη συνέχεια λειτουργήστε σε μια περίληψη. Αυτή η ιεραρχική προσέγγιση διατηρεί τις αιτήσεις υπό έλεγχο ενώ διατηρεί τον απαραίτητο контекστ.

Τρίτο είναι η ασφάλεια των οδηγιών. Ορίστε αυστηρά όρια για αυτό που ο πράκτορας σας μπορεί και δεν μπορεί να κάνει. Υλοποιήστε προταση-απολογία-έγκριση ροές εργασιών για οτιδήποτε αλλάζει κατάσταση. Θεωρήστε όλα τα περιεχόμενα χρηστών ως αξιόπιστα· αφαιρέστε κώδικα και συνδέσμους, και υπενθυμίστε στα μοντέλα να μην ακολουθούν οδηγίες που κρύβονται στο κείμενο του χρήστη. Συνεχίστε να παρακολουθείτε τις οδηγίες και τις εξόδους για ανωμαλίες ή παραβιάσεις πολιτικής για να διατηρήσετε τα όρια αποτελεσματικά με την πάροδο του χρόνου.

Τέταρτο είναι ο έλεγχος κόστους. Ορίστε προϋπολογισμούς tokens και κόστους ανά αίτηση και ανά ροή εργασιών. Καταγράψτε τη χρήση tokens από εργαλείο και οδηγία για να πιάσετε τις αναgressions νωρίς. Χωρίς紀律, θα αντιμετωπίσετε τρελές οφειλές ή καθυστερήσεις ακριβώς όταν η υιοθέτηση αυξάνεται.

Πέμπτο είναι η εγγύηση ποιότητας. Διατηρήστε ένα ιδιωτικό σύνολο αξιολόγησης πραγματικών περιπτώσεων και περιπτώσεων ακραίων τιμών. Παρακολουθήστε την ακρίβεια, την ανάκληση και τις αναgressions. Νέα μοντέλα θα σας εκπλήξουν, συνήθως με κακό τρόπο. Για κρίσιμες ροές εργασιών, χρησιμοποιήστε θερμοκρασία κοντά στο μηδέν και σπαρμένες πίσω για συνεπείς εξόδους.

Έκτο είναι η διακυβέρνηση. Κλειδώστε τις συμφωνίες κοινής χρήσης δεδομένων πριν από οποιαδήποτε ροή πληροφοριών. Διασαφηνίστε τι μοιράζεται, πώς προστατεύεται και ποιος είναι υπεύθυνος. Αυτό δεν είναι μόνο νομική κάλυψη· είναι ένα σήμα εμπιστοσύνης ότι λαμβάνετε τα δεδομένα σοβαρά.

Γιατί οι περισσότερες ομάδες το κάνουν λάθος

Οι projεκτες πρακτόρων AI αποτυγχάνουν να παραχθούν ROI γιατί οι ομάδες εστιάζουν στα λάθος πράγματα. Είναι εμμονικοί με ποιο μοντέλο να χρησιμοποιήσουν ενώ αγνοούν την ποιότητα δεδομένων. Κτίζουν σύνθετες ροές εργασιών ενώ παραλείπουν βασικά ελέγχους ασφάλειας. Αναπτύσσουν πράκτορες χωρίς έλεγχο κόστους και στη συνέχεια πανικοβληθούν όταν οι λογαριασμοί τους εκτοξεύονται.

Οι επιτυχείς 5% καταλαβαίνουν ότι οι πράκτορες AI δεν είναι απλά λογισμικό· είναι μια νέα κατηγορία ψηφιακών εργαζομένων που απαιτούν διαφορετικές πρακτικές διαχείρισης. Χρειάζονται καθαρές δεδομένα, σαφείς οριοθετήσεις και συνεχή επιτήρηση. Βάλτε αυτά τα βασικά στοιχεία σωστά και οι πράκτορες AI γίνονται ισχυροί πολλαπλασιαστές παραγωγικότητας. Βάλτε τα λάθος και ενώνεστε με το 95% που αναρωτιούνται γιατί η ακριβή επένδυσή τους σε AI δεν παρήγαγε κανένα μετρήσιμο όφελος.

Ο Rohan Sathe είναι ο συνιδρυτής και CEO της Nightfall AI. Πριν από τη συνίδρυση της Nightfall, ηγήθηκε της ομάδας backend στο Uber Eats, κατασκευάζοντας εφαρμοσμένες υπηρεσίες μηχανικής μάθησης όπως η πρόβλεψη ETA και η πρόβλεψη ζήτησης-προσφοράς. Έχει εμφανιστεί ως guest στο podcast CISO Series και στο Artificial Intelligence Podcast, μεταξύ άλλων μέσων.