Συνδεθείτε μαζί μας

Η Κρίση Μνήμης της Τεχνητής Νοημοσύνης: Χτίζουμε μια Ψηφιακή Σκοτεινή Εποχή

Ηγέτες της σκέψης

Η Κρίση Μνήμης της Τεχνητής Νοημοσύνης: Χτίζουμε μια Ψηφιακή Σκοτεινή Εποχή

mm

Εκατομμύρια πράκτορες Τεχνητής Νοημοσύνης εισέρχονται σε συστήματα παραγωγής. Σχεδόν κανένας δεν μπορεί να μοιραστεί επιχειρησιακή εμπειρία. Αυτός είναι ο λόγος για τον οποίο έχει σημασία αυτή η αρχιτεκτονική επιλογή - και τι αλλάζει αν την κάνουμε σωστά;

Στις 2:06 μ.μ., ένας πελάτης κάνει μια ηλεκτρονική παραγγελία για έναν φορητό υπολογιστή.

Ο εκπρόσωπος ολοκλήρωσης αγοράς ερωτά τη βάση δεδομένων λειτουργίας του: καθαρό ιστορικό αγορών, ποσό εντός κανονικού εύρους, διεύθυνση αποστολής που χρησιμοποιήθηκε προηγουμένως, συσκευή και τοποθεσία που συμφωνούν με πρόσφατες επιτυχημένες παραγγελίες. Όλα φαίνονται φυσιολογικά. Ο εκπρόσωπος εγκρίνει την παραγγελία.

Ταυτόχρονα, ένας παράγοντας συμπεριφοράς επεξεργάζεται δεδομένα clickstream στο data lakehouse της εταιρείας. Από την περίοδο σύνδεσης, εξάγει ένα μοτίβο: ο χρήστης έφτασε απευθείας σε μια διεύθυνση URL deep checkout χωρίς συμπεριφορά περιήγησης ή σύγκρισης. Αυτό το σήμα είναι αδύναμο από μόνο του, αλλά αποτελεί γνωστό πρόδρομο σε σενάρια κατάληψης λογαριασμού όταν συνδυάζεται με κατά τα άλλα φυσιολογικές αγορές.

Ο πράκτορας συμπεριφοράς καταγράφει αυτήν την ερμηνεία ως παράγωγη γνώση για μεταγενέστερη ανάλυση και εκπαίδευση μοντέλου.

Ο εκπρόσωπος ολοκλήρωσης αγοράς δεν το βλέπει ποτέ. Όχι επειδή το σήμα δεν υπολογίστηκε και όχι επειδή αγνοήθηκε — αλλά επειδή η γνώση βρίσκεται μέσα σε ένα σύστημα, ο εκπρόσωπος ολοκλήρωσης αγοράς δεν συμβουλεύεται κατά την εξουσιοδότηση.

Κάθε πράκτορας συμπεριφέρεται σωστά δεδομένου αυτού που μπορεί να δει. Κάθε ένας γράφει στο σύστημα που του ανήκει. Αλλά η γνώση που προκύπτει από τον έναν πράκτορα είναι αόρατη στον άλλον κατά τη στιγμή της λήψης της απόφασης.

Ο φορητός υπολογιστής αποστέλλεται.

Τριάντα έξι ώρες αργότερα, η κατηγορία αμφισβητείται. Η έρευνα επιβεβαιώνει ότι ο λογαριασμός είχε παραβιαστεί νωρίτερα την ίδια ημέρα. Ο εισβολέας διατήρησε τη συναλλαγή εντός των φυσιολογικών ορίων, βασιζόμενος στο γεγονός ότι η μόνη έγκαιρη προειδοποίηση υπήρχε ως γνώση συμπεριφοράς που είχε παγιδευτεί εκτός του πλαισίου απόφασης του ταμείου.

Η αποτυχία δεν ήταν η έλλειψη δεδομένων, η αργή επεξεργασία ή ένα κακό μοντέλο. Ήταν ένα σιλό πρακτόρων: η γνώση σχηματιζόταν, αλλά δεν μοιραζόταν.

Και αυτό αποκαλύπτει ένα πρόβλημα για το οποίο σχεδόν κανείς δεν μιλάει. Έχουμε δημιουργήσει αρχιτεκτονικές όπου οι πράκτορες Τεχνητής Νοημοσύνης που λαμβάνουν αποφάσεις δεν μπορούν να έχουν πρόσβαση σε ό,τι έχουν ήδη ανακαλύψει άλλοι πράκτορες Τεχνητής Νοημοσύνης.

Το πρόβλημα που έλυσε το τυπογραφείο

Πριν από την τυπογραφία, η γνώση ήταν εύθραυστη. Όταν ένας μελετητής πέθαινε, πολλά από αυτά που είχε μάθει πέθαιναν μαζί του. Ένας μαθηματικός στο Λονδίνο μπορεί να περνούσε δεκαετίες ανακαλύπτοντας αρχές που ένας μαθηματικός στο Παρίσι θα ανακάλυπτε ανεξάρτητα ξανά πενήντα χρόνια αργότερα. Η πρόοδος ήταν πραγματική, αλλά ήταν τοπική, αργή και επαναλαμβανόμενη.

Το τυπογραφείο Δεν έκανε τα άτομα πιο έξυπνα. Εξωτερικοποίησε τη μνήμη. Η γνώση έπαψε να είναι συνδεδεμένη με ένα μόνο μυαλό και άρχισε να επιμένει πέρα ​​από τη ζωή του δημιουργού της. Οι γνώσεις μπορούσαν να μοιραστούν, να επανεξεταστούν και να βασιστούν σε αυτές από γενιά σε γενιά. Αυτό επέτρεψε στην πρόοδο να ενταθεί.

Διατρέχουμε τον κίνδυνο να επαναλάβουμε το λάθος της προεκτυπωτικής μηχανής με την Τεχνητή Νοημοσύνη.

Οι περισσότεροι οργανισμοί αναπτύσσουν πλέον πράκτορες τεχνητής νοημοσύνης σε όλα τα συστήματα παραγωγής., με πολλούς ακόμη να πειραματίζονται ενεργά σε τομείς όπως η υποστήριξη πελατών, η ανάπτυξη λογισμικού, η έρευνα και η ανίχνευση απάτης. Αυτοί οι πράκτορες συνήθως αναπτύσσονται ως ανεξάρτητες υπηρεσίες ευθυγραμμισμένες με τις σύγχρονες αρχιτεκτονικές μικρουπηρεσιών, το καθένα με τα δικά του δεδομένα και λειτουργικά όρια. Ακόμα και μέσα στον ίδιο οργανισμό, οι πράκτορες αντλούν γνώσεις από τη δική τους εμπειρία παραγωγής, αλλά σπάνια μοιράζονται τη γνώση που παράγουν με άλλους πράκτορες που λαμβάνουν σχετικές αποφάσεις.

Ως αποτέλεσμα, η επιχειρησιακή γνώση παραμένει κατακερματισμένη. Οι τοπικές αποφάσεις μπορεί να βελτιωθούν, αλλά η εμπειρία δεν συσσωρεύεται σε ολόκληρο το σύστημα. Κάθε σημαντική ανακάλυψη που παραμένει παγιδευμένη μέσα σε έναν μόνο παράγοντα είναι μια σημαντική ανακάλυψη που δεν μπορεί να συνδυαστεί.

Αυτή τη φορά, ο περιοριστικός παράγοντας δεν είναι η νοημοσύνη ή η ταχύτητα. Είναι η μνήμη. Χωρίς έναν τρόπο για τα συστήματα Τεχνητής Νοημοσύνης να εξωτερικεύουν και να μοιράζονται ό,τι ανακαλύπτουν, η πρόοδος επαναφέρεται συχνότερα παρά χτίζεται.

Πώς Μοιάζει Πραγματικά η Κοινή Μνήμη

Τα μεγαλύτερα παράθυρα περιβάλλοντος μπορούν να εμπλουτίσουν την ατομική συλλογιστική, αλλά δεν δημιουργούν κοινόχρηστο, διαρκής εμπειρία μεταξύ των πρακτόρων.

Η κοινή μνήμη αλλάζει τα αποτελέσματα όχι βελτιώνοντας τα μοντέλα, αλλά αλλάζοντας αυτό που μπορούν να δουν οι πράκτορες τη στιγμή της λήψης αποφάσεων.

Σε ένα σύστημα siloed, κάθε πράκτορας συλλογίζεται σωστά εντός των ορίων του. Ο πράκτορας ολοκλήρωσης αγοράς αξιολογεί τον συναλλακτικό κίνδυνο. Ο πράκτορας συμπεριφοράς αναλύει τα μοτίβα ροής κλικ. Κάθε πράκτορας γράφει τα συμπεράσματά του στο σύστημα που του ανήκει και αυτά τα συμπεράσματα παραμένουν αόρατα σε άλλους πράκτορες που λειτουργούν παράλληλα. Οι αποφάσεις είναι τοπικά σωστές, αλλά συνολικά ελλιπείς.

Με ένα κοινόχρηστο επίπεδο μνήμης, αυτό το όριο εξαφανίζεται.

Καθώς ο πράκτορας συμπεριφοράς επεξεργάζεται μια συνεδρία, παράγει ένα αδύναμο αλλά ουσιαστικό σήμα: ένα μοτίβο πλοήγησης που σχετίζεται με πρώιμες προσπάθειες ανάληψης λογαριασμού. Αντί να αποθηκεύει αυτήν την πληροφορία μόνο για ανάλυση εκτός σύνδεσης, γράφει το σήμα σε κοινόχρηστη μνήμη, συνδεδεμένη με την ενεργή συνεδρία.

Λίγο αργότερα, όταν ο εκπρόσωπος ολοκλήρωσης αγοράς αξιολογεί την αγορά, ρωτά την ίδια μνήμη. Η συναλλαγή εξακολουθεί να φαίνεται κανονική. Αλλά τώρα βλέπει επιπλέον πλαίσιο: μια προειδοποίηση συμπεριφοράς που διαφορετικά θα απουσίαζε. Κανένα από τα δύο σήματα δεν είναι καθοριστικό από μόνο του. Μαζί, ξεπερνούν το όριο για περαιτέρω επαλήθευση.

Τίποτα στους ίδιους τους πράκτορες δεν έχει αλλάξει. Κανένα μοντέλο δεν έχει επανεκπαιδευτεί. Κανένας κεντρικός ελεγκτής δεν παρεμβαίνει. Η διαφορά είναι η ορατότητα: μια εικόνα που σχηματίζεται από έναν πράκτορα γίνεται διαθέσιμη σε έναν άλλο όσο εξακολουθεί να έχει σημασία.

Το κρίσιμο είναι ότι αυτή η γνώση παραμένει. Όταν το αποτέλεσμα γίνει αργότερα γνωστό - απάτη ή νόμιμο - καταγράφεται η συσχέτιση μεταξύ του σήματος και του αποτελέσματος. Με την πάροδο του χρόνου, το σύστημα συσσωρεύει ένα εμπειρικό αρχείο για το ποιοι ασθενείς δείκτες τείνουν να έχουν σημασία και υπό ποιες συνθήκες. Οι μελλοντικές αποφάσεις βασίζονται στην εμπειρία που εκτείνεται πέρα ​​από οποιαδήποτε μεμονωμένη αλληλεπίδραση ή παράγοντα.

Η κοινόχρηστη μνήμη δεν είναι αποθήκη δεδομένων ούτε λειτουργική βάση δεδομένων. Είναι ένα υπόστρωμα χαμηλής καθυστέρησης για το παράγωγο περιβάλλον: σήματα, ερμηνείες και συσχετίσεις που επιβιώνουν της αλληλεπίδρασης που τα παρήγαγε και παραμένουν ερωτηματικά από άλλους πράκτορες που λαμβάνουν σχετικές αποφάσεις.

Έτσι συνδυάζεται η εμπειρία—όχι μέσα σε κάποιο μοντέλο, αλλά σε ολόκληρο το σύστημα.

Το αρχιτεκτονικό συμβιβασμό πίσω από τα σιλό πρακτόρων

Τα σιλό πρακτόρων δεν αποτελούν σφάλμα υλοποίησης. Είναι το προβλέψιμο αποτέλεσμα των αρχιτεκτονικών επιχειρήσεων που έχουν σχεδιαστεί γύρω από ένα διαφορετικό είδος καταναλωτή.

Για δεκαετίες, τα συστήματα παραγωγής διαχωρίζουν τα φόρτα εργασίας ανά λειτουργία. Τα λειτουργικά συστήματα βελτιστοποιήθηκαν για συναλλαγές με χαμηλή καθυστέρηση και συνέπεια, ενώ τα αναλυτικά συστήματα βελτιστοποιήθηκαν για συσσωμάτωση μεγάλης κλίμακας και ανακάλυψη ιστορικών μοτίβων (OLTP εναντίον OLAPΑυτός ο διαχωρισμός αντανακλούσε τον τρόπο με τον οποίο καταναλώνονταν οι γνώσεις: τα αναλυτικά αποτελέσματα παράγονταν για ανθρώπους, όχι για μηχανές, και ως εκ τούτου αναμενόταν να φτάσουν ασύγχρονα και εκτός της κρίσιμης διαδρομής λήψης αποφάσεων.

Οι πράκτορες της Τεχνητής Νοημοσύνης κληρονομούν αυτό το αρχιτεκτονικό διαχωρισμό, αλλά δεν ταιριάζουν σε αυτό.

Η συνέπεια δεν είναι απλώς η καθυστερημένη γνώση, αλλά και τα δομικά τυφλά σημεία. Οι γνώσεις που παράγονται σε αναλυτικά συστήματα, εκ σχεδιασμού, ανακαλύπτονται αφού έχουν ήδη ληφθεί αποφάσεις σε πραγματικό χρόνο. Υπάρχουν σήματα που θα μπορούσαν να αλλάξουν τα αποτελέσματα, αλλά δεν μπορούν να αναδυθούν κατά τη στιγμή της λήψης αποφάσεων, επειδή βρίσκονται σε συστήματα που δεν προορίζονται να υποβάλλονται σε συνεχή ερωτήματα από αυτόνομοι υπεύθυνους λήψης αποφάσεων.

Η αρχιτεκτονική δεν είναι σπασμένη. Δεν ταιριάζει με τις απαιτήσεις των αυτόνομων συστημάτων.

Το Λείπειν Κλάδος: Μηχανική Πλαισίου

Η κοινή μνήμη εισάγει ένα πρόβλημα που οι περισσότερες ομάδες δεν είναι έτοιμες να λύσουν: την απόφαση για το ποια εμπειρία θα πρέπει να διατηρηθεί.

Τα συστήματα τεχνητής νοημοσύνης παράγουν τεράστιες ποσότητες ακατέργαστης εμπειρίας — συναλλαγές, κλικ, μηνύματα, ενέργειες, αποτελέσματα. Η επιμονή σε όλα αυτά δεν είναι ούτε πρακτική ούτε χρήσιμη. Χωρίς σκόπιμη επιλογή, η κοινόχρηστη μνήμη γίνεται θόρυβος. Η πρόκληση δεν είναι η συλλογή περισσότερων δεδομένων, αλλά η διαμόρφωση της εμπειρίας σε ένα πλαίσιο που μπορούν να χρησιμοποιήσουν και άλλοι πράκτορες.

Αυτός είναι ο ρόλος του μηχανική περιβάλλοντος.

Η μηχανική πλαισίου είναι ο κλάδος που αποφασίζει ποιες παρατηρήσεις γίνονται ανθεκτικά σήματα, πώς αναπαρίστανται αυτά τα σήματα και πότε πρέπει να εκτίθενται σε άλλους πράκτορες. Βρίσκεται ανάμεσα σε ακατέργαστα συμβάντα και συλλογισμό πρακτόρων, μετατρέποντας την παροδική δραστηριότητα σε κοινή, σχετική με τη λήψη αποφάσεων κατανόηση.

Στην πράξη, αυτό σημαίνει την ανύψωση μοτίβων, δεικτών και υπό όρους συσχετίσεων, επιτρέποντας παράλληλα στην περισσότερη ακατέργαστη εμπειρία να εξασθενίσει. Ένα αδύναμο σήμα ή μια περίπτωση ορίου μπορεί να μην έχει σημασία μεμονωμένα, αλλά γίνεται πολύτιμο όταν συσσωρεύεται και αναδύεται την κατάλληλη στιγμή.

Η μηχανική πλαισίου καθορίζει εάν η κοινόχρηστη μνήμη απλώς αποθηκεύει την εμπειρία ή της επιτρέπει να τη συνθέτει.

Τι θα συμβεί αν το κάνουμε σωστά

Αυτό δεν αποτελεί μελλοντική ανησυχία. Είναι μια αρχιτεκτονική απόφαση που λαμβάνεται —συχνά έμμεσα— από τις ομάδες υποδομών σήμερα.

Η προεπιλεγμένη διαδρομή είναι η απομόνωση. Οι πράκτορες της Τεχνητής Νοημοσύνης ενεργούν ανεξάρτητα, βασιζόμενοι μόνο στη δική τους εμπειρία. Ο καθένας λαμβάνει γρήγορες, τοπικά σωστές αποφάσεις, αλλά η νοημοσύνη σταθεροποιείται. Οι ίδιες ακραίες περιπτώσεις επαναλαμβάνονται, τα αδύναμα σήματα ανακαλύπτονται ξανά και οι αποτυχίες επαναλαμβάνονται με μεγαλύτερη ταχύτητα και όγκο.

Η εναλλακτική λύση είναι ένα κοινόχρηστο επίπεδο μνήμης.

Όταν το παράγωγο πλαίσιο επιμένει και είναι ορατό κατά τη στιγμή της λήψης αποφάσεων, η εμπειρία σταματά να εξατμίζεται. Οι γνώσεις που ανακαλύπτονται μία φορά παραμένουν διαθέσιμες. Τα αδύναμα σήματα αποκτούν νόημα μέσω της συσσώρευσης. Οι αποφάσεις βελτιώνονται όχι επειδή αλλάζουν τα μοντέλα, αλλά επειδή οι πράκτορες δεν συλλογίζονται πλέον μεμονωμένα.

Αυτό δεν απαιτεί μεγαλύτερα μοντέλα, επανεκπαίδευση σε πραγματικό χρόνο ή κεντρικό έλεγχο. Απαιτεί την αντιμετώπιση της μνήμης ως αρχιτεκτονικού επιπέδου πρώτης κατηγορίας—σχεδιασμένο για πρόσβαση με χαμηλή καθυστέρηση, επιμονή και κοινή ορατότητα.

Οι αρχιτεκτονικές προεπιλογές σκληραίνουν γρήγορα. Συστήματα που κατασκευάζονται χωρίς κοινόχρηστη μνήμη καθίστανται ολοένα και πιο δύσκολο να αναβαθμιστούν καθώς οι πράκτορες πολλαπλασιάζονται. Η επιλογή είναι απλή: να χτίζονται συστήματα που συσσωρεύουν εμπειρία—ή συστήματα που επαναφέρονται ασταμάτητα.

Ο Xiaowei Jiang είναι Διευθύνων Σύμβουλος και Κύριος Αρχιτέκτονας της Τακνοδ, όπου επικεντρώνεται στην κατασκευή υποδομής περιβάλλοντος για πράκτορες Τεχνητής Νοημοσύνης.