Ηγέτες σκέψης

Πώς το Εξηγητό AI Κτίζει Εμπιστοσύνη και Ευθύνη

Published May 21, 2025

Updated April 26, 2026

Jamie Twiss, CEO of Carrington Labs

Οι επιχειρήσεις έχουν ήδη βυθιστεί στο AI, αγωνιζόμενοι να αναπτύξουν chatbots, γενераторες περιεχομένου και εργαλεία υποστήριξης αποφάσεων σε όλες τις επιχειρησιακές τους δραστηριότητες. Σύμφωνα με τη McKinsey, το 78% των εταιρειών χρησιμοποιούν AI σε τουλάχιστον μία επιχειρησιακή λειτουργία.

Η φρενίτιδα της εφαρμογής είναι κατανοητή — όλοι βλέπουν την πιθανή αξία. Αλλά σε αυτή τη βιασύνη, πολλές οργανώσεις παραβλέπουν το γεγονός ότι όλες οι τεχνολογίες που βασίζονται σε νευρωνικά δίκτυα, συμπεριλαμβανομένων όλων των LLM και γεννητικών συστημάτων AI που χρησιμοποιούνται σήμερα και για το προβλέψιμο μέλλον, μοιράζονται ένα σημαντικό ελάττωμα: Είναι απρόβλεπτες και στο τέλος ακαταμάχητες.

Όπως κάποιοι έχουν μάθει, μπορεί να υπάρξει πραγματική πτώση ως αποτέλεσμα. Σε einen Chevrolet εμπόρο που είχε αναπτύξει ένα chatbot στην ιστοσελίδα του, ένας πελάτης έπεισε το ChatGPT-ενεργοποιημένο bot να του πουλήσει ένα $58,195 Chevy Tahoe για μόνο $1. Ένας άλλος πελάτης έ促ωσε το ίδιο chatbot να γράψει ένα Python script για σύνθετες εξισώσεις δυναμικής ροής, το οποίο το έκανε χαρούμενο. Ο εμπόρος απέκλεισε τα bots μετά από αυτά τα περιστατικά που έγιναν ιοί.

Πέρσι, η Air Canada έχασε σε δικαστήριο μικρών απαιτήσεων όταν υποστήριξε ότι το chatbot της, το οποίο έδωσε στον επιβάτη ανακριβείς πληροφορίες σχετικά με μια έκπτωση θρήνου, «είναι ένα ξεχωριστό νομικό πρόσωπο που ευθύνεται για τις δικές του ενέργειες».

Αυτή η απρόβλεπτη προέλευση προέρχεται από την θεμελιώδη αρχιτεκτονική των LLM. Είναι τόσο μεγάλες και σύνθετες που είναι αδύνατο να κατανοηθεί πώς φτάνουν σε συγκεκριμένες απαντήσεις ή να προβλέψουν τι θα παράγουν μέχρι να παράγουν μια έξοδο. Οι περισσότερες οργανώσεις απαντούν σε αυτό το ζήτημα αξιοπιστίας χωρίς να το αναγνωρίζουν πλήρως.

Η κοινή αίσθηση λύση είναι να ελέγξουν τα αποτελέσματα του AI με το χέρι, το οποίο λειτουργεί αλλά περιορίζει δραστικά το потенシャル της τεχνολογίας. Όταν το AI ανατεθεί να είναι ένα προσωπικό βοηθό — να συντάσσει κείμενο, να λαμβάνει σημειώσεις συναντήσεων, να συνοψίζει έγγραφα και να βοηθά με τον κώδικα — παρέχει μετριοπαθείς κέρδη παραγωγικότητας. Δεν είναι αρκετό για να επαναφέρουν την οικονομία.

Τα πραγματικά οφέλη του AI θα έρθουν όταν σταματήσουμε να το χρησιμοποιούμε για να βοηθήσουμε τις υφιστάμενες δουλειές και αντ’ αυτού να ξανασχεδιάσουμε ολόκληρες διαδικασίες, συστήματα και εταιρείες για να χρησιμοποιήσουν το AI χωρίς ανθρώπινη εμπλοκή σε κάθε βήμα. Συμβουλή για την επεξεργασία δανείων: αν μια τράπεζα δώσει στους υπαλλήλους δανείων einen AI βοηθό για να συνοψίσει αιτήσεις, μπορεί να εργαστούν 20-30% πιο γρήγορα. Αλλά η ανάπτυξη του AI για να χειριστεί ολόκληρη τη διαδικασία απόφασης (με κατάλληλες προφυλάξεις) θα μπορούσε να μειώσει τα κόστη πάνω από 90% και να εξαφανίσει σχεδόν όλο τον χρόνο επεξεργασίας. Αυτή είναι η διαφορά μεταξύ της σταδιακής βελτίωσης και της μεταμόρφωσης.

Η οδός για αξιόπιστη εφαρμογή του AI

Η αξιοποίηση του πλήρους потенταλίου του AI χωρίς να υποκύψει στην απρόβλεπτη φύση του απαιτεί ένα σύνθετο μείγμα τεχνικών προσεγγίσεων και στρατηγικής σκέψης. Ενώ πολλές τρέχουσες μεθόδους προσφέρουν μερικές λύσεις, κάθε μια έχει σημαντικές περιορισμοί.

Ορισμένες οργανώσεις προσπαθούν να μετριάσουν τα ζητήματα αξιοπιστίας μέσω της προώθησης του συστήματος — να οδηγούν τη συμπεριφορά του AI σε επιθυμητές κατευθύνσεις ώστε να ανταποκρίνεται σε συγκεκριμένες εισόδους. Ερευνητές του Anthropic έδειξαν τη fragility αυτής της προσέγγισης αναγνωρίζοντας ένα «χαρακτηριστικό της Γέφυρας του Χρυσού Πύργου» στο νευρωνικό δίκτυο του Claude και, με την τεχνητή ενίσχυση, προκάλεσαν στον Claude μια κρίση ταυτότητας. Όταν ρωτήθηκε για τη φυσική του μορφή, αντί να αναγνωρίσει ότι δεν είχε καμία, ο Claude ισχυρίστηκε ότι ήταν η Γέφυρα του Χρυσού Πύργου. Αυτό το πείραμα αποκάλυψε πώς εύκολα μπορεί να αλλάξει η βασική λειτουργία ενός μοντέλου και ότι κάθε προώθηση αντιπροσωπεύει ένα tradeoff, потенτικά βελτιώνοντας ένα аспект της απόδοσης ενώ υποβαθμίζει άλλους.

Μια άλλη προσέγγιση είναι να έχει το AI να παρακολουθεί άλλο AI. Ενώ αυτή η στρωματοποιημένη προσέγγιση μπορεί να πιάσει κάποια λάθη, εισάγει πρόσθετη πολυπλοκότητα και ακόμα δεν φθάνει σε ολοκληρωμένη αξιοπιστία. Οι προγραμματισμένες φρουροί είναι μια πιο直接ική παρέμβαση, όπως το μπλοκάρισμα απαντήσεων που περιέχουν συγκεκριμένα κλειδιά ή πρότυπα, όπως τα προκαταρκτικά συστατικά για όπλα. Ενώ είναι αποτελεσματικά ενάντια σε γνωστά ζητήματα, αυτοί οι φρουροί δεν μπορούν να προβλέψουν νέες προβληματικές εξόδους που προκύπτουν από αυτά τα σύνθετα συστήματα.

Μια πιο αποτελεσματική προσέγγιση είναι η κατασκευή διαδικασιών που επικεντρώνονται στο AI και μπορούν να λειτουργούν αυτονομικά, με ανθρώπινη επιτήρηση στρατηγικά τοποθετημένη για να πιάσει ζητήματα αξιοπιστίας πριν προκαλέσουν πραγματικά προβλήματα. Δεν θα ήθελες το AI να εγκρίνει ή να απορρίπτει αιτήσεις δανείων, αλλά το AI θα μπορούσε να διεξάγει μια αρχική αξιολόγηση για ανθρώπινους χειριστές να αναθεωρήσουν. Αυτό μπορεί να λειτουργήσει, αλλά εξαρτάται από την ανθρώπινη επιτήρηση για να πιάσει τα λάθη του AI και υπονόμευσε τα πιθανά κέρδη αποδοτικότητας από τη χρήση του AI.

Κατασκευή για το μέλλον

Αυτές οι μερικές λύσεις δείχνουν προς μια πιο ολοκληρωμένη προσέγγιση. Οι οργανώσεις που ξανασκέφτονται θεμελιωδώς πώς γίνεται η δουλειά τους αντί να simply αναβαθμίζουν τις υφιστάμενες διαδικασίες με την βοήθεια του AI θα κερδίσουν το μεγαλύτερο πλεονέκτημα. Αλλά το AI δεν πρέπει ποτέ να είναι το τελευταίο βήμα σε μια διαδικασία ή απόφαση υψηλού κινδύνου, οπότε τι είναι ο καλύτερος δρόμος προς τα εμπρός;

Πρώτον, το AI κατασκευάζει μια επαναλαμβανόμενη διαδικασία που θα παραδώσει σταθερά και διαφανώς συνεπή αποτελέσματα. Δεύτερον, οι άνθρωποι αναθεωρούν τη διαδικασία για να διασφαλίσουν ότι κατανοούν πώς λειτουργεί και ότι οι εισόδους είναι κατάλληλες. Τέλος, η διαδικασία λειτουργεί αυτονομικά — χρησιμοποιώντας κανένα AI — με περιοδική ανθρώπινη αναθεώρηση των αποτελεσμάτων.

Συμβουλή για την ασφαλιστική βιομηχανία. Η συμβατική προσέγγιση θα μπορούσε να προσθέσει βοηθούς AI για να βοηθήσουν τους επεξεργαστές αιτήσεων να εργαστούν πιο αποτελεσματικά. Μια πιο επαναστατική προσέγγιση θα χρησιμοποιούσε το AI για να αναπτύξει νέα εργαλεία — όπως η υπολογιστική όραση που αναλύει φωτογραφίες ζημιών ή ενισχυμένα μοντέλα ανίχνευσης απάτης που αναγνωρίζουν ύποπτα πρότυπα — και στη συνέχεια να συνδυάσει αυτά τα εργαλεία σε αυτοματοποιημένα συστήματα που διέπονται από σαφείς, κατανοητές κανόνες. Οι άνθρωποι θα σχεδίαζαν και θα παρακολουθούσαν αυτά τα συστήματα αντί να επεξεργάζονται ατομικές αιτήσεις.

Αυτή η προσέγγιση διατηρεί την ανθρώπινη επιτήρηση στο κρίσιμο σημείο όπου έχει τη μεγαλύτερη σημασία: το σχέδιο και η επαλήθευση του συστήματος. Επιτρέπει την εκθετική αύξηση της αποδοτικότητας ενώ εξαφανίζει τον κίνδυνο ότι η απρόβλεπτη φύση του AI θα οδηγήσει σε βλαβερά αποτελέσματα σε ατομικές περιπτώσεις.

Ένα AI θα μπορούσε να αναγνωρίσει πιθανές ενδείξεις ικανότητας αποπληρωμής δανείου σε δεδομένα συναλλαγών, για παράδειγμα. Οι ανθρώπινοι εμπειρογνώμονες θα μπορούσαν τότε να αξιολογήσουν αυτές τις ενδείξεις για δίκαιότητα και να κατασκευάσουν σαφείς, κατανοητές μοντέλα για να επιβεβαιώσουν τη προβλεπτική τους δύναμη.

Αυτή η προσέγγιση του εξηγητού AI θα δημιουργήσει μια σαφέστερη διαίρεση μεταξύ των οργανισμών που χρησιμοποιούν το AI επιφανειακά και εκείνων που μεταμορφώνουν τις επιχειρήσεις τους γύρω του. Οι τελευταίοι θα αυξάνουν σταδιακά μπροστά στις βιομηχανίες τους,能够 να προσφέρουν προϊόντα και υπηρεσίες σε τιμές που οι ανταγωνιστές τους δεν μπορούν να ταιριάσουν.

Σε αντίθεση με το AI black-box, τα συστήματα AI με εξήγηση διασφαλίζουν ότι οι άνθρωποι διατηρούν σημαντική επιτήρηση της εφαρμογής της τεχνολογίας, δημιουργώντας ένα μέλλον όπου το AI ενισχύει την ανθρώπινη δυνατότητα αντί να αντικαθιστά απλώς την ανθρώπινη εργασία.

Jamie Twiss, CEO of Carrington Labs

Ο Jamie Twiss είναι ένας έμπειρος τραπεζικός και επιστήμονας δεδομένων που εργάζεται στο σημείο τομής της επιστήμης δεδομένων, της τεχνητής νοημοσύνης και του καταναλωτικού δανεισμού. Şu anda υπηρετεί ως Chief Executive Officer της Carrington Labs, ενός ηγέτη παρόχου εξηγητέας AI-ενισχυμένης πιστωτικής κινδύνου αξιολόγησης και λύσεων δανεισμού. Προηγουμένως, ήταν ο Chief Data Officer σε μια μεγάλη Αυστραλιανή τράπεζα. Πριν από αυτό, εργάστηκε σε μια ποικιλία ρόλων σε τράπεζες και χρηματοοικονομικές υπηρεσίες μετά την έναρξη της καριέρας του ως συμβούλου με την McKinsey & Company.

Unite.AI

Πώς το Εξηγητό AI Κτίζει Εμπιστοσύνη και Ευθύνη

Η οδός για αξιόπιστη εφαρμογή του AI

Κατασκευή για το μέλλον

You may like