Τεχνητή νοημοσύνη
Το Δίλημμα της Μάθησης-Εξουσίας: Τι Συμβαίνει Όταν Η Ικανότητα του Πράκτορα Τεχνητής Νοημοσύνης Υπερβαίνει την Ανθρώπινη Εποπτεία;

Βρισκόμαστε σε ένα σταυροδρόμι στην τεχνητή νοημοσύνη. Για χρόνια, κατασκευάσαμε συστήματα τεχνητής νοημοσύνης που ακολουθούσαν τις εντολές μας. Τώρα, κατασκευάζουμε πράκτορες τεχνητής νοημοσύνης που δεν ακολουθούν μόνο εντολές, αλλά μαθαίνουν, προσαρμόζονται και λαμβάνουν αυτόνομες αποφάσεις σε πραγματικό χρόνο. Αυτά τα συστήματα μεταβαίνουν από το ρόλο των εργαλείων στο ρόλο των αντιπροσώπων. Αυτή η μεταβολή δημιουργεί αυτό που θα μπορούσαμε να ονομάσουμε το Δίλημμα της Μάθησης-Εξουσίας. Όταν η ικανότητα ενός πράκτορα τεχνητής νοημοσύνης να επεξεργάζεται πληροφορίες και να εκτελεί σύνθετες εργασίες υπερβαίνει τη δική μας, και όταν συνεχίζει να μαθαίνει και να εξελίσσεται μετά την ανάπτυξή του, η ίδια η έννοια της ανθρώπινης εποπτείας γίνεται σύνθετη. Πώς μπορεί ένας ανθρώπινος επόπτης να εξετάσει ή να ακυρώσει μια απόφαση που λήφθηκε από ένα σύστημα που κατανοεί το контέκστ σε ένα επίπεδο που δεν μπορούμε να κατανοήσουμε; Πώς διατηρούμε την εξουσία πάνω σε κάτι που, από σχεδιασμό, είναι πιο έξυπνο και γρήγορο από εμάς στο συγκεκριμένο τομέα;
Η Κατάρρευση της Ανθρώπινης Εποπτείας
Παραδοσιακά, η ασφάλεια στην τεχνολογία βασίζονταν σε ένα απλό αρχή: άνθρωπος στο βρόχο. Ένας ανθρώπινος χειριστής εξετάζει την έξοδο, επικυρώνει τη λογική και πιέζει το κουμπί. Αλλά ο πράκτωρ τεχνητής νοημοσύνης σπάει αυτό το μοντέλο. Αυτοί οι πράκτορες σχεδιάζονται για να ακολουθούν στόχους σε ψηφιακά περιβάλλοντα. Μπορούν να κλείσουν ταξίδια, να διαπραγματευτούν συμβάσεις, να διαχειριστούν αλυσίδες εφοδιασμού ή ακόμη και να γράψουν κώδικα.
Το πρόβλημα δεν είναι μόνο η ταχύτητα. Είναι η αδιαφάνεια. Αυτά τα συστήματα συχνά χρησιμοποιούν μεγάλες γλωσσικές μοντέλα ή σύνθετο ενισχυμένο μάθηση. Οι διαδρομές λήψης αποφάσεων τους δεν είναι εύκολο να μειωθούν σε απλές κανόνες αν-τότε που ένας άνθρωπος μπορεί να ελέγξει γραμμή προς γραμμή. Ακόμη και οι μηχανικοί που κατασκεύασαν τα συστήματα μπορεί να μην κατανοούν πλήρως γιατί μια συγκεκριμένη ενέργεια έγινε σε μια νέα κατάσταση.
Αυτό οδηγεί σε ένα επικίνδυνο χάσμα. Ζητάμε από τους ανθρώπους να εποπτεύουν συστήματα που δεν μπορούν πλήρως να κατανοήσουν. Όταν ο πράκτωρ “μαθαίνει” και προσαρμόζει τις στρατηγικές του, ο ανθρώπινος επόπτης μένει να αντιδράσει στα αποτελέσματα, ανίκανος να επέμβει στη διαδικασία. Γινόμαστε παρατηρητές αποφάσεων αντί να είμαστε αυτοί που τις διαμορφώνουν.
Η Παγίδα της Αυτονομίας
Ο φιλόσοφος Philipp Koralus στο Πανεπιστήμιο της Οξφόρδης περιγράφει αυτό ως το “δίλημμα της αυτονομίας-πράκτορα”. Αν δεν χρησιμοποιήσουμε προηγμένα συστήματα τεχνητής νοημοσύνης για να μας βοηθήσουν να χειριστούμε einen όλο και πιο σύνθετο κόσμο, κινδυνεύουμε να γίνουμε αναποτελεσματικοί και να χάσουμε τον έλεγχο μας. Απλά δεν μπορούμε να ανταγωνιστούμε την επεξεργαστική δύναμη μιας μηχανής.
Αλλά αν εξαρτηθούμε από αυτά, κινδυνεύουμε να χάσουμε την αυτονομία μας. Αρχίζουμε να εξωτερικεύουμε όχι μόνο εργασίες, αλλά και το κρίσιμο μας. Ο πράκτωρ φιλτράρει τις πληροφορίες μας, προτεραιοποιεί τις επιλογές μας και μας οδηγεί προς συμπεράσματα που ταιριάζουν στο μοντέλο βελτιστοποίησής του. Με τον καιρό, αυτό το είδος ψηφιακής επίδρασης μπορεί να διαμορφώσει τι πιστεύουμε και πώς επιλέγουμε ακόμη και χωρίς να το καταλάβουμε.
Ο κίνδυνος είναι ότι αυτά τα συστήματα είναι πολύ χρήσιμα για να τα αγνοήσουμε. Βοηθούν να χειριστούμε τη σύνθετη πολυπλοκότητα που νιώθουμε. Αλλά καθώς εξαρτόμαστε από αυτά, μπορεί να χάσουμε σιγά-σιγά τις ικανότητες, όπως η κριτική σκέψη, η ηθική κρίση και η επίγνωση του контέκστ, που χρειαζόμαστε για να οδηγήσουμε και να ελέγξουμε αυτά.
Η Αντιφάση της Ευθύνης-Ικανότητας
Πρόσφατη έρευνα εισάγει την έννοια της “Αντιφάσης της Ευθύνης-Ικανότητας”. Αυτό είναι το κεντρικό μέρος του δίλημματος. Όσο πιο ικανό γίνεται ένα σύστημα τεχνητής νοημοσύνης, τόσο περισσότερες εργασίες του αναθέτουμε. Όσο περισσότερες εργασίες του αναθέτουμε, τόσο λιγότερο ασκούμε αυτές τις ικανότητες. Όσο λιγότερο ασκούμε, τόσο πιο δύσκολο γίνεται να κρίνουμε αν το σύστημα τεχνητής νοημοσύνης εκτελεί καλά. Η ικανότητά μας να κάνουμε το σύστημα υπεύθυνο μειώνεται αναλογικά με την ικανότητα του συστήματος.
Αυτό δημιουργεί einen κύκλο εξάρτησης. Εμπιστευόμαστε το σύστημα τεχνητής νοημοσύνης γιατί είναι συνήθως σωστό. Αλλά επειδή το εμπιστευόμαστε, παύουμε να το ελέγχουμε. Όταν τελικά κάνει ένα λάθος, και θα το κάνει γιατί όλα τα συστήματα αποτυγχάνουν, δεν είμαστε προετοιμασμένοι να το πιάσουμε. Λείπει η “επίγνωση της κατάστασης” για να βγάλουμε τον έλεγχο πίσω και να πάρουμε τον έλεγχο.
Αυτό είναι ιδιαίτερα επικίνδυνο σε τομείς υψηλού κινδύνου, όπως η δημόσια υγεία ή οι χρηματαγορές. Ένας πράκτωρ τεχνητής νοημοσύνης μπορεί να πάρει einen απρόβλεπτο δρόμο που οδηγεί σε σοβία ζημιά. Όταν συμβεί αυτό, ο ανθρώπινος επόπτης είναι ακόμη υπεύθυνος για μια απόφαση που δεν έλαβε και δεν μπορούσε να προβλέψει. Η μηχανή ενεργεί, αλλά ο άνθρωπος πληρώνει την τιμή.
Τα Όρια του “Νudge” και η Ανάγκη για “Σωκρατική” Σχεδίαση
Πολλά τρέχοντα συστήματα κατασκευάζονται με μια “νudge” φιλοσοφία. Προσπαθούν να οδηγήσουν τη συμπεριφορά του χρήστη προς αυτό που το αλγόριθμο βρίσκει ως την καλύτερη επιλογή. Αλλά όταν ο πράκτωρ μεταβαίνει από την πρόταση στην εκτέλεση, αυτό το νudge γίνεται κάτι πιο ισχυρό. Γίνεται μια προεπιλογή για την πραγματικότητα.
Για να λύσουμε το Δίλημμα της Μάθησης-Εξουσίας, πρέπει να σταματήσουμε να σχεδιάζουμε πράκτορες που δίνουν μόνο απαντήσεις. Αντίθετα, πρέπει να κατασκευάσουμε πράκτορες που ενθαρρύνουν ερωτήσεις, αναστοχασμό και συνεχιζόμενη κατανόηση. Ο Koralus το ονομάζει την “φιλοσοφική στροφή” στην τεχνητή νοημοσύνη. Αντί για έναν πράκτωρα που κλείνει einen κύκλο με την ολοκλήρωση μιας εργασίας, χρειαζόμαστε έναν πράκτωρα που ανοίγει einen κύκλο με την τοποθέτηση διευκρινιστικών ερωτήσεων.
Αυτός ο Σωκρατικός πράκτωρ δεν θα εκτελέσει απλώς μια εντολή για “κράτηση του καλύτερου πτήσης”. Θα εμπλακεί τον χρήστη σε διάλογο. Θα ρωτήσει, “Επιλέξατε αυτό το πτήση λόγω της χαμηλής τιμής, αλλά προστίθεται έξι ώρες στο ταξίδι σας. Τιμείτε την τιμή πάνω από τον χρόνο σήμερα;” Αυτό αναγκάζει τους ανθρώπους να παραμείνουν εμπλεγμένοι στη διαδικασία σκέψης.
Με τη διατήρηση αυτής της γνωστικής παύσης μεταξύ της εντολής και της ενέργειας, προστατεύουμε την ικανότητά μας να σκεφτόμαστε. Διατηρούμε αυτό που ορισμένοι ερευνητές ονομάζουν το “μη-αποσπασμένο πυρήνα” της ανθρώπινης κρίσης. Πιο σημαντικά, δεν πρέπει να παραδώσουμε στις τεχνητές νοημοσύνες αποφάσεις που αφορούν αξίες, ηθική ή άγνωστους κινδύνους.
Η Κατασκευή της Υποδομής Διακυβέρνησης
Η αντιμετώπιση του δίλημματος δεν είναι μόνο μια φιλοσοφία σχεδίασης, αλλά απαιτεί σκληρή υποδομή. Δεν μπορούμε να βασιστούμε σε καλές προθέσεις ή μετα-εξεταστικές ελέγχους. Χρειαζόμαστε τεχνική επιβολή.
Μια υποσχόμενη κατεύθυνση είναι η έννοια του “Φρουρού” συστήματος ή ενός εξωτερικού επιτηρητικού επιπέδου που παρακολουθεί τη συμπεριφορά της τεχνητής νοημοσύνης σε πραγματικό χρόνο. Αυτό δεν είναι ένας άνθρωπος που παρακολουθεί μια οθόνη, αλλά ένας άλλος πράκτωρ, ένας εποπτικός αλγόριθμος, που ψάχνει για ανωμαλίες, παραβιάσεις πολιτικής ή πτώσεις εμπιστοσύνης. Όταν ανιχνεύσει ένα πρόβλημα, μπορεί να ενεργοποιήσει einen σκληρό χειρισμό σε έναν άνθρωπο.
Αυτό απαιτεί την ορισμό σαφών “ελέγχου” έναντι “εποπτείας” ορίων. Ο έλεγχος είναι η ικανότητα να προλαμβάνει μια ενέργεια σε πραγματικό χρόνο. Η εποπτεία είναι η ικανότητα να ελέγχετε τα αρχεία μετά τα γεγονότα. Για πραγματικά αυτόνομους πράκτορες, ο έλεγχος από τους ανθρώπους σε πραγματικό χρόνο είναι συχνά αδύνατος. Επομένως, πρέπει να κατασκευάσουμε συστήματα με σκληρά στάματα. Για παράδειγμα, ένας πράκτωρ που λειτουργεί σε einen υψηλού κινδύνου τομέα πρέπει να έχει einen “kill switch” αρχιτεκτονική. Αν η εμπιστοσύνη του πράκτορα πέσει κάτω από einen κατώτατο όριο, ή αν συναντήσει einen σενάριο που δεν εκπαιδεύτηκε, πρέπει να σταματήσει και να περιμένει οδηγίες.
Επιπλέον, χρειαζόμαστε einen ομοσπονδιακό προσεγγίσει στη διακυβέρνηση. Αντί για einen μονολιθικό μοντέλο που ορίζει την αλήθεια, μπορούμε να χρησιμοποιήσουμε einen σμήνος από διαφορετικούς πράκτορες που αμοιβαία επικυρώνουν ο ένας τον άλλον. Η αποκεντρωμένη αναζήτηση αλήθειας σημαίνει ότι κανένας單ός πράκτωρ δεν έχει το τελικό λόγο. Αν δύο πράκτορες διαφωνούν, αυτή η σύγκρουση είναι ένα σήμαμα για ανθρώπινη παρέμβαση.
Το Βασικό
Όπως στέκουμε στο χείλος πραγματικά αυτόνομων συστημάτων, πρέπει να θυμόμαστε ότι η νοημοσύνη δεν είναι μόνο για το να ξέρουμε. Είναι για να διακρίνουμε. Είναι για να κρατάμε δύο αντίθετες ιδέες και να λαμβάνουμε ακόμη μια κρίση. Αυτή είναι μια ανθρώπινη ικανότητα. Αν την αναθέσουμε, δεν χάνουμε μόνο τον έλεγχο των μηχανών μας. Χάνουμε τον έλεγχο ourselves.












