Connect with us

Ισαΐα Ν. Γκράνετ, Συνιδρυτής και Διευθύνων Σύμβουλος της Bland – Σειρά Συνεντεύξεων

Συνεντεύξεις

Ισαΐα Ν. Γκράνετ, Συνιδρυτής και Διευθύνων Σύμβουλος της Bland – Σειρά Συνεντεύξεων

mm

Ισαΐα Ν. Γκράνετ, Συνιδρυτής και Διευθύνων Σύμβουλος της Bland, είναι ιδρυτής εταιρείας και μηχανικός με背景 που συνδυάζει τεχνική εκτέλεση με πρώιμη επιχειρηματική εμπειρία και μακροχρόνια κοινωνική επίδραση. Πριν από την εκκίνηση της τρέχουσας επιχείρησής του, συμμετείχε στο Z Fellows και Y Combinator, απέκτησε εμπειρία μηχανικής στη Lantern και ίδρυσε το San Diego Chill, một μη κερδοσκοπική οργάνωση που raised πάνω από 2,5 εκατομμύρια δολάρια για να βοηθήσει τα παιδιά με αναπτυξιακές αναπηρίες να συμμετέχουν σε αθλήματα, κερδίζοντας εθνική αναγνώριση και συνεχίζοντας μέχρι σήμερα με την συμμετοχή του στο διοικητικό συμβούλιο.

Bland επικεντρώνεται στην κατασκευή υποδομής για τηλεφωνικές κλήσεις που βασίζονται στο AI, επιτρέποντας στις επιχειρήσεις να αναπτύξουν φωνητικούς πράκτορες που μπορούν να χειριστούν την υποστήριξη πελατών, τις πωλήσεις και τις λειτουργικές ροές εργασιών σε κλίμακα. Η πλατφόρμα σχεδιάστηκε για να αντικαταστήσει ή να συμπληρώσει τις παραδοσιακές κέντρα κλήσεων, προσφέροντας προγραμματιζόμενες φωνητικές αλληλεπιδράσεις, πραγματική απόκριση και βαθιά ολοκλήρωση με επιχειρησιακά συστήματα, θέτοντας τον εαυτό της ως βασικό επίπεδο στον τρόπο με τον οποίο οι εταιρείες αυτοματοποιούν την επικοινωνία με τους πελάτες.

Ιδρύσατε το San Diego Chill ως έφηβος για να δημιουργήσετε ενεργητική πρόσβαση σε αθλήματα για παιδιά με αναπτυξιακές αναπηρίες, πολύ πριν εισέλθετε στο Y Combinator ή ξεκινήσετε την Bland. Πώς επηρέασε η πρώιμη εμπειρία σας στην κατασκευή μιας πραγματικής οργάνωσης τον τρόπο με τον οποίο προσεγγίσατε την ίδρυση μιας εταιρείας φωνητικού AI που τώρα βρίσκεται μεταξύ επιχειρήσεων και πελατών;

Πολύ από τη ζωή και την εργασία μου επικεντρώθηκε στην κατασκευή. Από νεαρή ηλικία, είχα αυτήν την συνεχή επιθυμία να φέρω πράγματα στη ζωή. Μόλις μια ιδέα ή μια πίστη για τον κόσμο εμφανίζεται στο μυαλό μου, γίνεται αδύνατο για μένα να την αγνοήσω. Η κατασκευή του San Diego Chill δεν μου taught μόνο πώς να δημιουργήσω και να διευθύνω μια οργάνωση, αλλά και πώς να επηρεάσω τους άλλους. Να μπορώ να δώσω πίσω δημιουργώντας μια οργάνωση που δεν θα υπήρχε αλλιώς είναι κάτι που με γεμίζει με ικανοποίηση. Τα μαθήματα και οι αξίες που έμαθα από το Chill με συνοδεύουν κάθε μέρα.

Μετά από το YC το 2023, τι σας πείσε ότι η υποδομή φωνητικών κλήσεων για τις επιχειρήσεις ήταν ακόμη θεμελιωδώς ελαττωματική, ώστε να δικαιολογήσετε την κατασκευή ενός ολοκληρωμένου συστήματος αντί να επικαλύψετε LLMs πάνω από παραδοσιακά εργαλεία IVR;

Σκεφτείτε την τελευταία φορά που χρησιμοποιήσατε ένα chatbot τράπεζας. Πιθανότατα περιμένατε περισσότερο από ό,τι θα έπρεπε, έλαβα μια απάντηση που δεν ανταποκρίνεται σε αυτό που ζητήσατε και τελικά καλέσατε. Έπειτα, μια ρομποτική φωνή σας οδήγησε μέσω ενός μενού επιλογών που δεν ήθελε και πατώντας το 0 δεν έκανε τίποτα χρήσιμο.

Οι τράπεζες έχουν δαπανήσει δισεκατομμύρια για να κάνουν αυτήν την εμπειρία δυνατή, και τα chatbot κατατάσσονται τελευταία στην ικανοποίηση του πελάτη στο 29%. Χαμηλότερα από το email. Χαμηλότερα από τα κέντρα κλήσεων, τα οποία όλοι ήδη παραπονιούνται.

Αυτό ήταν η δυναμική για δύο δεκαετίες. Οι επιχειρήσεις προσπαθούν να κρατήσουν τους πελάτες μακριά από το προσωπικό τους. Οι πελάτες συνεχίζουν να προσπαθούν να φτάσουν σε ένα άτομο. Κανένας από τους δύο δεν κερδίζει.

Το ζήτημα δεν είναι ότι οι εταιρείες δεν θέλουν να το διορθώσουν. Απλά δεν μπορούν να το κάνουν με τον τρόπο που είναι. Ένα κέντρο κλήσεων που χειρίζεται ένα εκατομμύριο κλήσεις το μήνα είναι eine ακριβή και δύσκολη λειτουργία, και η ποιότητα είναι ασυνεπής σχεδόν κατά definition.

Τι άλλαξε είναι ότι το AI τελικά κάνει δυνατή την επίλυση κλήσεων αντί να τις οδηγεί ή να τις αποτρέπει. Όχι δέντρα τηλεφώνου. Όχι μουσική αναμονής. Ένας πράκτορας που καταλαβαίνει τι ζητά ο πελάτης και το χειρίζεται.

Αλλά αυτό λειτουργεί μόνο αν το σύστημα είναι κατασκευασμένο για πραγματικό χρόνο φωνής από την αρχή. Όταν επικαλύψετε LLMs πάνω από παραδοσιακά εργαλεία IVR ή ράψετε μαζί υπηρεσίες τρίτων, η καθυστέρηση εισέρχεται και η αξιοπιστία πέφτει. Οι συνομιλίες διασπώνται.

Γι’ αυτό εστιάσαμε στην κατασκευή της υποδομής από την αρχή. Η φωνή λειτουργεί μόνο αν feels άμεση και φυσική. Αν δεν είναι, ο πελάτης κρέμεται.

Η Bland έχει πάρει το ασυνήθιστο βήμα της κατασκευής και φιλοξενίας του δικού της TTS, inference και transcription stack εσωτερικά. Ποια tradeoffs είδε στην εξάρτηση από APIs τρίτων που σας ώθησαν τελικά να κατέχετε το πλήρες επίπεδο φωνητικής υποδομής;

Κάθε επίπεδο που εξαγοράζετε προστίθεται καθυστέρηση και προστίθεται κίνδυνος.

Οι περισσότερες πλατφόρμες φωνητικού AI είναι πωλητές. Λαμβάνουν μεταγραφές τρίτων, προσθέτουν μοντέλο τρίτων, το οδηγούν μέσω TTS τρίτων και σας δίνουν το αποτέλεσμα. Αυτό μπορεί να λειτουργήσει σε ένα ελεγχόμενο demo. Σπάνια διαρκεί όταν η κλήση του όγκου σπάει ή κάτι στην αλυσίδα πάει λάθος.

Υπάρχει επίσης ένα πρόβλημα δεδομένων. Οι παρόχοι μοντέλων foundation, το OpenAI είναι το σαφές παράδειγμα, έχουν χρησιμοποιήσει δεδομένα πελατών για να εκπαιδεύσουν μοντέλα. Λέει ότι οι άδειες επιχείρησης είναι διαφορετικές. Ίσως είναι. Αλλά αυτή η αβεβαιότητα είναι αρκετή για να κάνει πολλές ομάδες ασφαλείας και συμμόρφωσης να αισθανθούν άβολα.

Όταν αυτοφιλοξενείτε το ολόκληρο stack — μεταγραφή, inference, TTS, ορχήστρα — ελέγχετε κάθε χιλιοστό του δευτερολέπτου και κάθε ενημέρωση μοντέλου. Τα δεδομένα του πελάτη παραμένουν μέσα στο οικοσύστημα του πελάτη. Δεν αγγίζουν κανένα pipeline εκπαίδευσης τρίτων, δεν περνούν από υποδομή που δεν μπορείτε να ελέγξετε, και δεν κινείται trừ जब ο πελάτης αποφασίσει ότι πρέπει.

Μπορείτε να δώσετε σε κάθε επιχειρηματικό πελάτη αφιερωμένη υποδομή, ώστε μια αύξηση από μια άλλη εταιρεία να μην αγγίξει την απόδοσή τους. Και όταν κάτι σπάσει, μπορείτε να το διορθώσετεจริง, αντί να περιμένετε από έναν προμηθευτή να το κάνει.

Για τις ρυθμιζόμενες βιομηχανίες, ορισμένοι πελάτες χρειάζονται το ολόκληρο stack στο δικό τους VPC ή σε τοπικό επίπεδο. Αυτό είναι δυνατό μόνο αν ο προμηθευτής πραγματικά κατέχει αυτό που αναπτύσσει.

Η παραδοσιακή αυτοματοποίηση κέντρων κλήσεων έχει επικεντρωθεί έντονα στην απομάκρυνση απλών κλήσεων υποστήριξης. Γιατί αποφασίσατε να προτεραιότητα τις σύνθετες, μακροχρόνιες αλληλεπιδράσεις πελατών αντί να βελτιστοποιήσετε για αυτοματοποίηση όγκου;

Η παραδοσιακή αυτοματοποίηση κέντρων κλήσεων έχει επικεντρωθεί κυρίως στην απομάκρυνση απλών κλήσεων υποστήριξης. Γιατί προτεραιότητα τις σύνθετες, μακροχρόνιες αλληλεπιδράσεις;

Πήραμε την αντίθετη προσέγγιση. Αν μπορούμε να χειριστούμε με αξιοπιστία τις πιο σύνθετες και ευαίσθητες κλήσεις, όλα τα άλλα γίνονται απλά. Ο στόχος δεν είναι να χτίσουμε demos, αλλά να παραδώσουμε πλήρη επίλυση κλήσεων με πράκτορες σε κλίμακα. Αυτό απαιτεί συστήματα χαμηλής καθυστέρησης, υψηλής αξιοπιστίας που μπορούν να χειριστούν τις περιπτώσεις άκρου που ορίζουν πραγματικές συνομιλίες πελατών.

Οι πράκτορές σας ολοκληρώνονται ολοένα και περισσότερο με CRMs και λειτουργικά базικά δεδομένα για να επιλύσουν κλήσεις από άκρο σε άκρο. Πώς αλλάζει η φωνητική αυτοματοποίηση την αρχιτεκτονική των επιχειρηματικών ροών εργασιών σε σύγκριση με τις chat-βασισμένες συν-πιλότους;

Τα παραδοσιακά συστήματα συχνά δεν μιλούν μεταξύ τους. CRMs, εργαλεία προγραμματισμού και πλατφόρμες χρέωσης είναι απομονωμένα. Χωρίς πρόσβαση σε αυτά τα συστήματα, ένας φωνητικός πράκτορας μπορεί να απαντήσει σε γενικές ερωτήσεις και τίποτα άλλο.

Δεν μπορεί να αναζητήσει ένα λογαριασμό, να ενημερώσει ένα αρχείο, ή να κλείσει einen ραντεβού. Συλλέγει πληροφορίες και τις παραδίδει. Εν τω μεταξύ, οι ανθρώπινοι εκπρόσωποι δαπανάνε χρόνο σε εργασία που δεν πρέπει να αγγίξει ένα άτομο: καταγράφοντας σημειώσεις κλήσεων, χειρίζοντας ραντεβού, τραβώντας αναφορές για να καταλάβουν ποιος χρειάζεται μια επανεξέταση.

Η βαθιά ολοκλήρωση είναι αυτό που κάνει δυνατή την πλήρη επίλυση. Χωρίς αυτήν, έχετε αυτοματοποιήσει την προσφώνηση, όχι την κλήση.

Η πρόσφατη demo του Soulja Boy voice clone υπογράμμισε πώς οι συνομιλητές πράκτορες μπορούν να επεκταθούν πέρα από τις εσωτερικές λειτουργίες σε εμπειρίες μάρκας. Βλέπετε τους πράκτορες φωνής επιχείρησης να εξελίσσονται σε ψηφιακούς αντιπροσώπους που λειτουργούν συνεχώς σε κανάλια πωλήσεων, υποστήριξης και μάρκετινγκ;

Απόλυτα. Βλέπουμε ένα κόσμο στον οποίο κάθε πελάτης έχει μια προσωπική σχέση με τις αγαπημένες και απαραίτητες επιχειρήσεις του. Τι είναι σημαντικό είναι ότι το AI δεν είναι μόνο “διασκεδαστικό” αλλά ικανό να επιλύσει πραγματικά τα πιο σύνθετα προβλήματα.

Η πραγματική φωνητική εισαγωγή καθυστέρηση, αλλοίωση και προκλήσεις ταυτοποίησης που δεν υπάρχουν σε αναπτύξεις AI κειμένου. Ποια ήταν τα πιο δύσκολα τεχνικά περιορισμοί που αντιμετωπίσατε όταν χτίζατε πράκτορες που χρειάζονται να απαντήσουν σε λιγότερο από ένα δευτερόλεπτο ενώ διατηρούν την ακρίβεια της συνομιλίας;

Καθυστέρηση. Αυτό είναι όπου πεθαίνουν τα περισσότερα demos.

Αν ένα chatbot χρειάζεται τρία δευτερόλεπτα για να απαντήσει, ο χρήστης περιμένει. Αν ένας φωνητικός πράκτορας παύει άβολα μετά από ολοκλήρωση της ομιλίας σας, η συνομιλία έχει ήδη σπάσει. Οι απαντήσεις πρέπει να επιστρέφουν σε λιγότερο από 400 χιλιοστά του δευτερολέπτου. Τα περισσότερα συστήματα δεν μπορούν να φτάσουν εκεί γιατί είναι ραμμένα μαζί με πολλαπλά υπηρεσίες τρίτων, κάθε μια από τις οποίες προστίθεται καθυστέρηση.

Αλλά η καθυστέρηση είναι μόνο μέρος του. Οι πραγματικές κλήσεις πελατών είναι ακατάστατες με τρόπους που τα demos ποτέ δεν καταγράφουν. Οι άνθρωποι διακόπτουν μέσα στη πρόταση. Ο θόρυβος φόνου κοπεί. Οι κλήσεις αλλάζουν γλώσσα. Οι αιτήσεις είναι ασαφείς. Το φωνητικό AI που αντέχει στην παραγωγή χειρίζεται διακοπές χωρίς να χάσει το контέκστ, προσαρμόζεται όταν οι συνομιλίες πηγαίνουν εκτός σεναρίου και το κάνει χωρίς να ακούγεται σαν να είναι buffer.

Οι πελάτες δεν συγκρίνουν το φωνητικό AI με άλλα bots. Το συγκρίνουν με το να μιλήσουν με ένα άτομο. Αυτό είναι ο στόχος.

Υπάρχει αυξανόμενη επιτήρηση γύρω από το πώς τα συστήματα AI που ακούγονται ανθρώπινα αντιπροσωπεύουν τον εαυτό τους κατά τη διάρκεια των αλληλεπιδράσεων. Πώς πρέπει οι επιχειρήσεις να σκέφτονται την διαφάνεια όταν αναπτύσσουν συνομιλητές πράκτορες που μπορεί να είναι μη διακριτοί από το προσωπικό;

Πιστεύουμε ακράδαντα στην ειλικρίνεια και τη διαφάνεια για τον τελικό χρήστη. Ενώ κάποια ρύθμιση είναι δυσχερής και καταπιεστική, οποιαδήποτε μορφή απάτης δεν είναι αποδεκτή. Συνεργαζόμαστε με τις επιχειρήσεις για να αναπτύξουμε ομαλές εμπειρίες που βασίζονται στη βάση της εμπιστοσύνης με τον πελάτη.

Όταν οι πράκτορες AI αρχίζουν να χειρίζονται εκατομμύρια ταυτόχρονων αλληλεπιδράσεων πελατών, ποια λειτουργικά προκλήματα τείνουν να εμφανιστούν πρώτα όταν οι εταιρείες μεταβαίνουν από πιλοτικές αναπτύξεις σε αναπτύξεις κλίμακας;

Λίγα πράγματα έχουν σημασία στην πράξη. Το πρώτο είναι η modulaire αρχιτεκτονική προτροπής. Οι μονολιθικές προτροπές είναι σχεδόν αδύνατο να αποσφαλιστεί. Όταν μια κλήση πάει λάθος, πρέπει να απομονώσετε ακριβώς πού και γιατί συνέβη, όχι να κοιτάξετε ένα τοίχωμα οδηγιών προσπαθώντας να καταλάβετε ποια γραμμή προκάλεσε το πρόβλημα.

Η πλήρης παρατηρησιμότητα έχει επίσης μεγάλη σημασία. Οι περίληψεις κλήσεων μετά δεν είναι αρκετές. Χρειάζεστε πραγματική ορατότητα σε αυτό που κάνει ο πράκτορας σε κάθε σημείο κάθε αλληλεπίδρασης.

Τα φράγματα είναι επίσης απαραίτητα, ιδιαίτερα στις ρυθμιζόμενες βιομηχανίες. Ο πράκτορας πρέπει να παραμείνει εντός πολιτικής. Αυτό δεν είναι προαιρετικό. Και αν δεν το κάνει, πρέπει να υπάρχει μια εύκολη πτώση.

Τέλος, υπάρχει η διαχείριση γνώσεων. Ο πράκτορας πρέπει να έχει πρόσβαση σε ιδιωτικά δεδομένα όπως προϊόντα, πολιτικές και διαδικασίες. Η πλατφόρμα πρέπει επίσης να επιφέρει γκρίνες γνώσεων αυτόματα καθώς εμφανίζονται σε πραγματικές κλήσεις, όχι εβδομάδες αργότερα μετά από μια καταγγελία πελάτη.

Κοιτάζοντας μπροστά, πιστεύετε ότι οι πράκτορες φωνής επιχείρησης θα παραμείνουν εργαλεία ειδικών εργασιών ή θα εξελιχθούν σε γενικευμένους πράκτορες AI ικανούς να διαχειρίζονται αυτόνομα ολόκληρες επιχειρηματικές διαδικασίες που ξεκινούν μέσω συνομιλίας;

Αν μόνο είχα την απάντηση! Νομίζω ότι οι πράκτορες φωνής θα εξελιχθούν σε όλο το επιχειρηματικό στάκ. Αλλά είναι απίθανο να δούμε μια ολόκληρη επιχείρηση να διευθύνεται από einen φωνητικό πράκτορα. Αυτό που πιστεύω είναι ότι οι άνθρωποι θα μπορέσουν να λάβουν άμεια, ακριβή και πιο ολοκληρωμένη υπηρεσία από τους πράκτορες AI από ότι λαμβάνουν σήμερα. Πράγματι, πιστεύουμε ότι θα υπάρξουν περισσότερες τηλεφωνικές κλήσεις όταν αυτό συμβεί. Όχι λιγότερες.

Ευχαριστώ για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Bland.

Ο Antoine είναι ένας οραματιστής ηγέτης και συνιδρυτής του Unite.AI, οδηγείται από μια αμετάβλητη страсть για το σχήμα και την προώθηση του μέλλοντος του AI και της ρομποτικής. Ένας σειριακός επιχειρηματίας, πιστεύει ότι το AI θα είναι τόσο διαταρακτικό για την κοινωνία όσο η ηλεκτρική ενέργεια, και συχνά πιάνεται να μιλάει για το δυναμικό των διαταρακτικών τεχνολογιών και του AGI.

Ως futurist, είναι αφοσιωμένος στο να εξερευνήσει πώς αυτές οι καινοτομίες θα σχήματίσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στις επενδύσεις σε τεχνολογίες που αναedefinουν το μέλλον και ανασχήματίσουν ολόκληρους τομείς.