Connect with us

Nick Lahoika, Συνιδρυτής και Διευθύνων Σύμβουλος της Vocal Image – Σειρά Συνεντεύξεων

Συνεντεύξεις

Nick Lahoika, Συνιδρυτής και Διευθύνων Σύμβουλος της Vocal Image – Σειρά Συνεντεύξεων

mm

Ο Nick Lahoika είναι ο συνιδρυτής και Διευθύνων Σύμβουλος της Vocal Image, μια εταιρεία coaching που βοηθά τους ανθρώπους να αναπτύξουν μα 軟ες δεξιότητες. Ένας σειριακός επιχειρηματίας με περισσότερη από 10 χρόνια εμπειρίας στις τεχνολογίες πληροφορικής και ανάπτυξης επιχειρήσεων, ο Nick εξόδωσε επιτυχώς δύο εγχειρήματα πριν δημιουργήσει την Vocal Image. Το ταξίδι του Nick είναι βαθιά προσωπικό· τον δίωξαν στο σχολείο για ασαφή ομιλία, γεγονός που ενέπνευσε την αποστολή του να βοηθήσει τους ανθρώπους να επικοινωνούν καλύτερα. 

Μετά τη βία να εγκαταλείψει τη χώρα του μετά την επανάσταση του 2020, ο Nick έφτασε στην Εσθονία με ελάχιστη γνώση της αγγλικής γλώσσας και χρησιμοποίησε την εφαρμογή του για να εκπαιδεύσει τη φωνή του, εξασφαλίζοντας τη πρώτη γύρα финансировσης μέσα σε έξι μήνες. Ο νικητής του AWS AI Challenge και του Meta x Hugging Face European AI Startup Program, η Vocal Image raised最近 raised ένα $3.6M seed γύρο led από την Educapital (Γαλλία) και scaled σε πάνω από $14M ARR.

Ιδρύσατε την Vocal Image το 2021. Τι σας ενέπνευσε να δημιουργήσετε einen AI coach για μα 軟ες δεξιότητες και ποιο πρόβλημα προσπαθούσατε να λύσετε στην αρχή;

Η αγχώδης ομιλία ήταν μέρος της ζωής μου για πολύ καιρό. Με δίωξαν στο σχολείο για ασαφή ομιλία, και αυτή η εμπειρία πραγματικά με έμεινε. Αργότερα, ως φοιτητής στην τεχνολογία πληροφορικής, έπρεπε να παρουσιάσω σε υψηλόβαθμα clients, και ο ίδιος φόβος επανήλθε.

Στη συνέχεια, το 2021, μετά την αποτυχημένη επανάσταση στη Λευκορωσία, έπρεπε να μετακομίσω στην Ευρώπη από τη μια μέρα στην άλλη. Ξαφνικά, έπρεπε να παρουσιάσω σε επενδυτές στην αγγλική γλώσσα, μια γλώσσα που几乎 δεν μιλούσα. Ήταν τρομακτικό, αλλά δεν υπήρχε επιλογή. Έπρεπε να περάσω ώρες κάθε μέρα να εξασκώ την προφορά μου χρησιμοποιώντας μια πολύ πρώιμη έκδοση της εφαρμογής που αργότερα θα γινόταν η Vocal Image. Ακόμη και χρειάστηκαν εβδομάδες για να μάθω να προφέρω σωστά το ήχο “V” για να μπορέσω να πω το όνομα της δικής μου εταιρείας.

Ξεκινήσαμε με μια εφαρμογή που ήταν ουσιαστικά όπως το YouTube, αλλά με μια ενσωματωμένη ηχογράφηση και μια λειτουργία σχολίων. Οι χρήστες μπορούσαν να παρακολουθήσουν βίντεο, να εξασκούν την επανάληψη των γραμμών και στη συνέχεια να ακούσουν τις δικές τους ηχογραφήσεις. Παρακολουθώντας πώς οι χρήστες την χρησιμοποιούσαν, γρήγορα συνειδητοποιήσαμε ότι είχαν ανάγκη από άμεση ανατροφοδότηση. Οι πρώτοι μας χρήστες μας έδειξαν ότι η απλή κατανάλωση περιεχομένου δεν ήταν αρκετή για να πάρουν πραγματικά αποτελέσματα· χρειάζονταν άμεση ανατροφοδότηση. Προσπαθήσαμε να παρέχουμε ανατροφοδότηση μέσω ανθρώπινων coaches, αλλά αυτή η προσέγγιση δεν ήταν κλιμακώσιμη, και αυτό είναι πώς κατέληξαμε στο να χρησιμοποιούμε τον AI.

Ήταν η προσωπική μου έμπνευση ότι ήταν πιο εύκολο για μένα να εξασκώ τις πρώτες μου παρουσιάσεις με την πλατφόρμα μας αντί με ένα άτομο. Δεν υπήρχε πίεση, δεν υπήρχε κρίση. Αυτή η ελευθερία άλλαξε τα πάντα για μένα. Μόλις λύσα το δικό μου πρόβλημα, συνειδητοποίησα πόσοι άνθρωποι αντιμετωπίζουν το ίδιο πρόβλημα. Περισσότεροι από 200 εκατομμύρια άνθρωποι πλήττονται από την αγχώδη ομιλία.

Πριν από την Vocal Image, διηύθυνατε ένα στούντιο χορού. Πώς η προηγούμενη εμπειρία σας στη κίνηση και την έκφραση επηρέασε την προσέγγισή σας στην επικοινωνία και την εύθραυστη φωνή;

Δεν ήμουν χορευτής· στην πραγματικότητα, έχτισα μια επιχείρηση που επικεντρωνόταν στην αυτοέκφραση και τους ανθρώπους. Μέσω αυτής της δουλειάς, συνειδητοποίησα ότι μπορείτε να πείτε πολλά για την εσωτερική αυτοπεποίθηση ενός ατόμου απλώς παρακολουθώντας τον να χορεύει.

Η κίνηση παίζει επίσης ένα τεράστιο ρόλο στη方式 που εκφράζεστε. Ο τρόπος που κινείστε, η στάση σας, η αναπνοή σας, όλα αυτά είναι μέρος της επικοινωνίας. Αυτό είναι το σημείο όπου ο AI coaching γίνεται ισχυρός, καθώς μπορεί να βοηθήσει τους ανθρώπους να εκπαιδεύσουν σε όλα αυτά τα πεδία σε ένα μέρος.

Παλαιότερα, οι εταιρείες έπρεπε να雇ουν πολλούς διαφορετικούς coaches. Έναν για την ομιλία, έναν για τη σώμα γλώσσα, έναν για την αυτοπεποίθηση. Τώρα, με τον AI, όλα είναι συνδεμένα. Μπορείτε να χτίσετε το πλήρες πορτρέτο της επικοινωνίας, όχι μόνο ένα κομμάτι της.

Αντιθέτως με τα περισσότερα εργαλεία AI επικοινωνίας, αποφασίσατε να μην χρησιμοποιήσετε το ChatGPT ως βάση για τον coach σας. Ποιο ήταν το κίνητρο για αυτή την απόφαση;

Ο θόρυβος γύρω από το ChatGPT στην πραγματικότητα έγινε ένα τεράστιο σημείο για μας. Όταν έγινε mainstream, δημιούργησε μια τεράστια αύξηση της εμπιστοσύνης στο AI, και μπορούσαμε να εκμεταλλευτούμε αυτό για να κάνουμε τους ανθρώπους να πιστεύουν στην τεχνολογία μας.

Αλλά εδώ είναι το ζήτημα: δεν ήθελε να το χρησιμοποιήσουμε ως βάση. Ο στόχος μας από την αρχή ήταν να χρησιμοποιήσουμε το μοναδικό μας μοντέλο για να αξιολογήσουμε τις φωνές και τα μοτίβα ομιλίας των ανθρώπων. Χρησιμοποιούμε μεγάλες γλώσσες μοντέλα όπως Gemini, Claude και ChatGPT και γνώσεις, συμβουλές και τεχνικές από τη λογοτεχνία επικοινωνίας στα τρέχοντα μοντέλα μας, αλλά δεν είναι η βάση του μηχανισμού ανατροφοδότησης μας. Η πραγματική βάση της ανατροφοδότησης μας είναι η ανθρώπινη εισαγωγή.

Ο φόβος ότι ο AI coaching θα φανεί ρομποτικός είναι πραγματικός. Για να αντεπεξέλθουμε σε αυτό, δημιουργήσαμε μια κοινότητα μέσα στην Vocal Image όπου οι χρήστες μπορούν να συνδεθούν άμεσα, να μοιραστούν το κοινό στόχο της βελτίωσης της επικοινωνίας τους και να υποστηρίξουν την πορεία του άλλου. Και αυτή η κοινότητα συνεχίζει να μεγαλώνει και να βελτιώνει τον AI μας.

Μπορείτε να εξηγήσετε πώς η εκπαίδευση του AI σας αποκλειστικά σε ανθρώπινες φωνές διαφέρει από τις παραδοσιακές προσεγγίσεις LLM σε σχέση με τα αποτελέσματα και την αυθεντικότητα;

Χρησιμοποιούμε μεγάλες γλώσσες μοντέλα ως μέρος της διαδικασίας για αξιολόγηση και контекστ. αλλά η πραγματική βάση του συστήματος μας είναι τα δεδομένα πίσω του. Το βασικό μοντέλο μας εκπαιδεύτηκε στη δική μας κοινότητα, που αποτελείται από ανθρώπους που ήρθαν μαζί για να βελτιώσουν τις δεξιότητες επικοινωνίας τους.

Ο AI είναι τόσο καλός όσο και οι άνθρωποι από τους οποίους μαθαίνει. Η ιδιοκτησιακή μας βάση δεδομένων περιλαμβάνει πάνω από ένα εκατομμύριο μοναδικές ανθρώπινες φωνές, κάθε μια από τις οποίες φέρει τόνο, ρυθμό και συναισθήματα, όλα τα οποία αντιπροσωπεύουν την πραγματική ουσία της επικοινωνίας. 

Η βάση δεδομένων σας περιλαμβάνει πάνω από ένα εκατομμύριο ανθρώπινες φωνές. Ποια ήταν τα προκλήματα που αντιμετωπίσατε κατά την επιμέλεια και την επισήμανση τέτοιου είδους dataset;

Δεν μπορείτε να βασιστείτε εξίσου σε κάθε σημείο δεδομένων. Ορισμένοι χρήστες αξιολογούν προσεκτικά, άλλοι απλώς κάνουν κλικ. Έπρεπε να σχεδιάσουμε ένα σύστημα που να διακρίνει την προσεκτική ανατροφοδότηση από το θόρυβο. Με τον καιρό, μάθαμε να δίνουμε περισσότερο βάρος σε χρήστες με συνεχή συμμετοχή και αξιόπιστη κρίση, ενώ φιλτράρουμε την τυχαία εισαγωγή.

Το πιο δύσκολο μέρος ήταν λειτουργικό, το οποίο αφορούσε την κατασκευή ενός οικοσυστήματος αξιολόγησης που ανταμείβει την ποιότητα hơn από την ποσότητα. Εκεί είναι που η κοινότητά μας έγινε απαραίτητη. Αυτοί δεν είναι τυχαίοι χρήστες του διαδικτύου, είναι άνθρωποι που πραγματικά προσπαθούν να βελτιώσουν τις μα 軟ες δεξιότητες και να βοηθήσουν τους άλλους να κάνουν το ίδιο. Όλες οι αξιολογήσεις είναι ανώνυμες, γεγονός που βοηθά να保持ει την ανατροφοδότηση αμερόληπτη και αυθεντική.

Η κοινότητα-κίνητη “Tinder-like” μηχανισμός αξιολόγησης είναι ενδιαφέρων — πώς αυτή η ανατροφοδότηση βρόχου διαμορφώνει τη συνεχιζόμενη μάθηση του AI σας;

Κάθε αξιολόγηση, σε κάθε γλώσσα, γίνεται ένα μικρό κομμάτι της νοημοσύνης που βελτιώνει το μοντέλο μας. Είναι ένας ζωντανός βρόχος ανατροφοδότησης. Όσο περισσότεροι άνθρωποι εκπαιδεύονται και αξιολογούν, τόσο πιο έξυπνο γίνεται το σύστημα στο να αναγνωρίζει τις νюανς της ομιλίας και του συναισθήματος, μαθαίνοντας πώς οι άνθρωποι πραγματικά αντιλαμβάνονται την αυτοπεποίθηση, τη ζεστασιά ή την εξουσία σε διάφορες κουλτούρες.

Τι ήταν τα βασικά μαθήματα που έμαθε κατά την ανάπτυξη ενός μοντέλου AI που επικεντρώνεται στις μα 軟ες δεξιότητες αντί για τις τεχνικές ικανότητες;

Η κύρια πρόκληση ήταν η μέτρηση. Δεν υπάρχει καθολική μετρική για “αξιόπιστο” ή “χαρίσμα”. Έπρεπε να δημιουργήσουμε τη δική μας.

Εδώ είναι το σημείο όπου η Νόμος των Μεγάλων Αριθμών ήρθε. Αν 100.000 άνθρωποι συμφωνούν ότι μια bestimmte φωνή ακούγεται αυτοπεποίθηση ή εмпαθητική, μπορείτε να αρχίσετε να εμπιστεύεστε αυτή την συλλογική αντίληψη. Με τον καιρό, δίδαξαμε τον AI μας να προβλέψει υποκειμενικές ποιότητες, πράγματα που δεν μπορούν να βαθμολογηθούν με ένα απλό σωστό ή λάθος. Αυτό ήταν η đột phá: μάθαμε να ποσοτικοποιούμε αυτό που είχε πάντα θεωρηθεί αφηρημένο.

Με $14 εκατομμύρια σε ετήσιο ανακυκλώσιμο έσοδο και ένα φρέσκο $3.6 εκατομμύριο σπορ γύρο, ποια είναι τα κύρια προτεραιότητά σας για这一 επόμενη φάση της ανάπτυξης — είτε είναι η πρόοδος του μοντέλου AI, η επέκταση της βάσης χρηστών, ή η εμβάθυνση της εμπειρίας της κοινότητας;

Η αποστολή μας ήταν πάντα ανθρωποκεντρική. Βοηθάμε τους ανθρώπους να επικοινωνούν με περισσότερη αυτοπεποίθηση και αυθεντικότητα.

Η επόμενη φάση είναι για την κλιμάκωση αυτής της επίδρασης παγκοσμίως. Επεκτείνουμε σε νέες γλώσσες και γεωγραφικές περιοχές, και αναπτύσσουμε νέες μα 軟ες δεξιότητες όπως διαπραγμάτευση, ενεργό ακρόαση και ευγλωττία. 

Πολλοί χρήστες λένε ότι οι AI coaches φαίνονται ρομποτικοί ή ατομικοί. Πώς εξασφαλίζετε ότι η Vocal Image παρέχει συναισθηματικά αντηχητικές και контекστ-παρατηρητικές ανατροφοδοτήσεις;

Επικεντρωνόμαστε στην υπερ-προσωποποίηση. Από την πρώτη互動, μαθαίνουμε ποιος είσαι, συμπεριλαμβανομένης της προφοράς, της ηλικίας, του επαγγελματικού περιβάλλοντος και των μοτίβων ομιλίας. Με τον καιρό, έχουμε μνήμη, θυμόμαστε πώς έχεις βελτιωθεί, πού δυσκολεύεσαι, και ποια ανατροφοδότηση αντηχεί περισσότερο.

Αυτό μας επιτρέπει στον AI να προσαρμοστεί δυναμικά. Η εμπειρία feels προσωπική γιατί είναι προσωπική. Διαμορφώνεται εξ ολοκλήρου από τα δεδομένα και την πορεία σου, όχι από ένα γενικό σενάριο.

Κοιτάζοντας μπροστά, πώς βλέπετε την εξέλιξη του AI coaching για μα 軟ες δεξιότητες καθώς η γεννητική και συναισθηματική AI συνεχίζουν να ωριμάζουν;

Η ανθρώπινη ανάπτυξη έχει πάντα ήταν ένα μείγμα φύσης και ανατροφής. Η επιστήμη μας λέει ότι η ηγεσία είναι περίπου το ήμισυ κληρονομική, το ήμισυ μαθημένη. Το μαθημένο μέρος χρησιμοποιούσε να είναι आरκεστό για εκτελεστίους που μπορούσαν να πληρώσουν ακριβούς coaches. Για πολύ καιρό, οι εταιρείες έπρεπε να πληρώσουν μεταξύ $7,000 και $25,000 το χρόνο για την εκπαίδευση ενός seul ηγέτη. Ο AI αλλάζει αυτό.

Επίσης, η αλληλεπίδραση με ανθρώπινους εκπαιδευτές θα απαιτούσε την雇ση πολλών ξεχωριστών coaches. Ενώ ένας AI coach μπορεί να αντικαταστήσει όλους τους.

Τώρα, χρησιμοποιούμε μια σειρά από διαφορετικά μοντέλα για να αναλύσουμε διαφορετικά аспектια της επικοινωνίας, αλλά το μέλλον είναι ένα ενιαίο, ολοκληρωμένο σύστημα που αξιολογεί και οδηγεί ολιστικά. Αυτή η τεχνολογία θα δημοκρατίσει την ανάπτυξη. Δεν θα χρειαστεί να γεννηθείτε με χάρισμα ή να έχετε ένα μεγάλο εταιρικό προϋπολογισμό για να κυριαρχήσετε στην επικοινωνία. Θα χρειαστείτε μόνο περιέργεια και πρόσβαση, και η δημιουργία του περιβάλλοντος για να ανθίσει αυτό είναι αυτό που με κάνει να πηγαίνω κάθε μέρα.

Ευχαριστούμε για τη μεγάλη συνέντευξη, οι αναγνώστες που επιθυμούν να μάθουν περισσότερα πρέπει να επισκεφθούν Vocal Image.

Ο Antoine είναι ένας οραματιστής ηγέτης και συνιδρυτής του Unite.AI, οδηγείται από μια αμετάβλητη страсть για το σχήμα και την προώθηση του μέλλοντος του AI και της ρομποτικής. Ένας σειριακός επιχειρηματίας, πιστεύει ότι το AI θα είναι τόσο διαταρακτικό για την κοινωνία όσο η ηλεκτρική ενέργεια, και συχνά πιάνεται να μιλάει για το δυναμικό των διαταρακτικών τεχνολογιών και του AGI.

Ως futurist, είναι αφοσιωμένος στο να εξερευνήσει πώς αυτές οι καινοτομίες θα σχήματίσουν τον κόσμο μας. Επιπλέον, είναι ο ιδρυτής του Securities.io, μια πλατφόρμα που επικεντρώνεται στις επενδύσεις σε τεχνολογίες που αναedefinουν το μέλλον και ανασχήματίσουν ολόκληρους τομείς.