Connect with us

Nick Lahoika, Co-Fondatore e Amministratore Delegato di Vocal Image – Serie di Interviste

Interviste

Nick Lahoika, Co-Fondatore e Amministratore Delegato di Vocal Image – Serie di Interviste

mm

Nick Lahoika è il co-fondatore e amministratore delegato di Vocal Image, una startup di coaching che aiuta le persone a sviluppare le competenze trasversali. Un imprenditore seriale con più di 10 anni di esperienza nel settore IT e nello sviluppo aziendale, Nick ha avuto un exit di successo da due venture prima di creare Vocal Image. Il percorso di Nick è profondamente personale; è stato vittima di bullismo per la sua dizione poco chiara a scuola, ciò lo ha ispirato a aiutare le persone a comunicare meglio. 

Dopo essere stato costretto a fuggire dal suo paese natale a seguito della rivoluzione del 2020, Nick è arrivato in Estonia con una conoscenza minima dell’inglese e ha utilizzato la sua stessa app per allenare la sua voce, ottenendo il suo primo round di finanziamenti in soli sei mesi. Il vincitore della sfida AWS AI e del programma di startup AI europeo Meta x Hugging Face, Vocal Image ha recentemente raccolto un round di finanziamenti seed di 3,6 milioni di dollari guidato da Educapital (Francia) e ha scalato a oltre 14 milioni di dollari di ricavi annuali ricorrenti.

Hai fondato Vocal Image nel 2021. Cosa ti ha ispirato a costruire un coach di competenze trasversali basato sull’intelligenza artificiale e quale problema stavi cercando di risolvere all’inizio?

L’ansia da parlare è stata una parte della mia vita per molto tempo. Sono stato vittima di bullismo a scuola per la mia dizione poco chiara e quell’esperienza mi è veramente rimasta impressa. In seguito, come studente di ingegneria informatica, ho dovuto presentare a clienti di alto livello e la stessa paura è tornata.

Poi, nel 2021, dopo la fallita rivoluzione in Bielorussia, ho dovuto trasferirmi in Europa da un giorno all’altro. Improvvisamente mi sono trovato a presentare a investitori in inglese, una lingua che parlavo a malapena. È stato terrificante, ma non c’era scelta. Ho trascorso ore ogni giorno a praticare la mia pronuncia utilizzando una versione molto precoce di ciò che sarebbe diventato Vocal Image. Mi ci sono volute anche settimane solo per imparare a pronunciare correttamente il suono “V” in modo da poter dire il nome della mia stessa azienda.

Abbiamo iniziato con un’app che era essenzialmente come YouTube, ma con un registratore vocale integrato e una funzione di commento. Gli utenti potevano guardare video, ripetere le linee e poi ascoltare le proprie registrazioni. Osservando come le persone la utilizzavano, ci siamo resi conto che avevano disperatamente bisogno di un feedback. I nostri utenti ci hanno mostrato che semplicemente consumare contenuti non era sufficiente per ottenere risultati reali; avevano bisogno di un feedback immediato. Abbiamo provato a fornire il feedback attraverso coach umani, ma quell’approccio non era scalabile, ed è così che siamo arrivati all’utilizzo dell’intelligenza artificiale.

È stata la mia intuizione personale che è stato più facile per me poter praticare i miei primi pitch con la nostra piattaforma invece che con una persona. Non c’era pressione, non c’era giudizio. Quella libertà ha cambiato tutto per me. Una volta che ho risolto il mio problema, mi sono reso conto di quanti persone affrontano lo stesso problema. Oltre 200 milioni di persone lottano con l’ansia da parlare.

Prima di Vocal Image, gestivi uno studio di danza. Come ha influenzato il tuo approccio alla comunicazione e alla fiducia vocale il tuo background nel movimento e nell’espressione?

Non ero un ballerino; in realtà ho costruito un’attività centrata sull’espressione di sé e sulle persone. È stato attraverso quel lavoro che mi sono reso conto che puoi capire molto della fiducia interna di una persona semplicemente guardandola ballare.

Il movimento gioca anche un ruolo enorme nel modo in cui ti esprimi. Il modo in cui ti muovi, la tua postura, il tuo respiro, tutto fa parte della comunicazione. È lì che il coaching basato sull’intelligenza artificiale diventa potente, poiché può aiutare le persone ad allenarsi in tutte quelle aree in un unico posto.

Prima, le aziende dovevano assumere diversi coach. Uno per la comunicazione pubblica, uno per il linguaggio del corpo, uno per la fiducia. Ora, con l’intelligenza artificiale, tutto è connesso. Puoi costruire l’intero quadro della comunicazione, non solo un pezzo di essa.

A differenza della maggior parte degli strumenti di comunicazione basati sull’intelligenza artificiale, hai deciso di non utilizzare ChatGPT come base per il tuo coach. Cosa ha portato a questa decisione?

L’entusiasmo intorno a ChatGPT è effettivamente diventato un punto di svolta enorme per noi. Quando è diventato mainstream, ha creato un’enorme impennata nella fiducia nell’intelligenza artificiale e siamo stati in grado di sfruttarla per far credere alle persone nella nostra tecnologia.

Ma ecco il punto: non abbiamo assolutamente voluto utilizzarlo come base. Il nostro obiettivo fin dall’inizio è stato quello di utilizzare il nostro modello unico per valutare le voci e i modelli di discorso delle persone. Utilizziamo grandi modelli linguistici come Gemini, Claude e ChatGPT e conoscenze, suggerimenti e trucchi dalla letteratura sulla comunicazione nei nostri modelli attuali, ma non sono il nucleo del nostro meccanismo di feedback. La vera base del nostro feedback è l’input umano.

La paura che il coaching basato sull’intelligenza artificiale sembri robotico è reale. Per contrastare ciò, abbiamo creato all’interno di Vocal Image una comunità in cui gli utenti possono connettersi istantaneamente, condividere l’obiettivo comune di migliorare la propria comunicazione e sostenere a vicenda il proprio percorso. E questa comunità cresce costantemente e migliora la nostra intelligenza artificiale.

Puoi spiegare come l’allenamento del tuo modello di intelligenza artificiale esclusivamente su voci umane differisce dagli approcci basati sui modelli linguistici tradizionali in termini di risultati e autenticità?

Utilizziamo grandi modelli linguistici come parte del processo di valutazione e contesto, ma la vera base del nostro sistema sono i dati che lo sostengono. Il nostro modello principale è stato addestrato sulla nostra comunità, composta da persone che si sono unite specificamente per migliorare le proprie competenze di comunicazione.

L’intelligenza artificiale è solo buona quanto gli esseri umani da cui impara. Il nostro set di dati proprietario include ora oltre un milione di voci umane uniche, ognuna delle quali porta tono, ritmo ed emozione, tutte rappresentazioni dell’essenza reale della comunicazione. 

Il tuo set di dati include oltre un milione di voci umane. Quali sfide hai affrontato nel curare e etichettare un corpus così unico?

Non puoi affidarti ugualmente a ogni punto dati. Alcuni utenti valutano con attenzione, altri semplicemente cliccano. Abbiamo dovuto progettare un sistema che distingua il feedback pensato dal rumore. Nel tempo, abbiamo imparato a dare più peso agli utenti con una partecipazione coerente e un giudizio affidabile, filtrando nel contempo l’input casuale.

La parte più difficile è stata operativa, che ha comportato la costruzione di un ecosistema di valutazione che premia la qualità sulla quantità. È lì che la nostra comunità è diventata inestimabile. Queste non sono utenti internet casuali, sono persone che cercano sinceramente di migliorare le proprie competenze trasversali e aiutare gli altri a fare lo stesso. Tutte le valutazioni sono anonime, il che aiuta a mantenere il feedback imparziale e autentico.

Il meccanismo di valutazione “simile a Tinder” basato sulla comunità è affascinante — come influenza questo ciclo di feedback l’apprendimento continuo del tuo modello di intelligenza artificiale?

Ogni valutazione, in ogni lingua, diventa un piccolo pezzo di intelligenza che raffina il nostro modello. È un ciclo di feedback vivo. Più le persone si allenano e valutano, più il sistema diventa intelligente nel riconoscere le sfumature del discorso e dell’emozione, imparando come le persone percepiscono effettivamente la fiducia, il calore o l’autorità attraverso le culture.

Quali sono state le lezioni chiave apprese durante lo sviluppo di un modello di intelligenza artificiale centrato sulle competenze trasversali piuttosto che sulle competenze tecniche?

La principale sfida è stata la misurazione. Non esiste un metro universale per “degno di fiducia” o “carismatico”. Abbiamo dovuto crearne uno nostro.

È qui che è entrata in gioco la Legge dei grandi numeri . Se 100.000 persone concordano che una certa voce suona fiduciosa o empatica, puoi iniziare a fidarti di quella percezione collettiva. Nel tempo, abbiamo insegnato al nostro modello di intelligenza artificiale a prevedere qualità soggettive, cose che non possono essere valutate con un semplice giusto o sbagliato. Quello è stato il punto di svolta: imparare a quantificare ciò che era sempre stato considerato intangibile.

Con 14 milioni di dollari di ricavi annuali ricorrenti e un fresco $3,6 milioni di round di finanziamenti seed, quali sono le tue principali priorità per questa prossima fase di crescita — che si tratti di avanzare il modello di intelligenza artificiale, espandere la base di utenti o approfondire l’esperienza della comunità?

La nostra missione è sempre stata centrata sull’essere umano. Aiutiamo le persone a comunicare con più fiducia e autenticità.

La prossima fase è quella di scalare quell’impatto a livello globale. Stiamo espandendo in nuove lingue e geografie e sviluppando nuovi moduli di competenze trasversali come la negoziazione, l’ascolto attivo e l’eloquenza. 

Molti utenti dicono che i coach basati sull’intelligenza artificiale sembrano robotici o impersonali. Come assicuri che Vocal Image fornisca un feedback emotivamente risonante e consapevole del contesto?

Ci concentriamo sull’iper-personalizzazione. Dalla prima interazione, impariamo chi sei, compreso il tuo accento, la tua età, il tuo contesto professionale e i tuoi modelli di parlare. Nel tempo, abbiamo memoria, ricordando come hai migliorato, dove lotti e quale feedback risuona di più.

Ciò consente all’intelligenza artificiale di adattarsi dinamicamente. L’esperienza sembra personale perché lo è. È plasmata interamente dai tuoi dati e dal tuo percorso, non da un copione generico.

Guardando avanti, come vedi l’evoluzione del coaching delle competenze trasversali basato sull’intelligenza artificiale mentre l’intelligenza artificiale generativa e emotiva continua a maturare?

Lo sviluppo umano è sempre stato un mix di natura e cultura. La scienza ci dice che il leadership è approssimativamente la metà innata, la metà appresa. La metà appresa un tempo era riservata agli esecutivi che potevano permettersi coach costosi. Per lungo tempo, le aziende hanno dovuto spendere tra i 7.000 e i 25.000 dollari all’anno per la formazione di un singolo leader. L’intelligenza artificiale cambia questo.

Inoltre, interagire con formatori umani richiederebbe di dover mantenere molti coach separati, mentre un coach basato sull’intelligenza artificiale può sostituirli tutti.

Al momento, utilizziamo una pipeline di diversi modelli per analizzare diversi aspetti della comunicazione, ma il futuro è un sistema unificato che valuta e guida in modo olistico. Questa tecnologia democratizzerà la crescita. Non avrai bisogno di essere nato carismatico o avere un grande budget aziendale per padroneggiare la comunicazione. Avrai solo bisogno di curiosità e accesso, e creare l’ambiente per far fiorire questo è ciò che mi guida ogni giorno.

Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare Vocal Image.

Antoine è un leader visionario e socio fondatore di Unite.AI, guidato da una passione incrollabile per plasmare e promuovere il futuro dell'AI e della robotica. Un imprenditore seriale, crede che l'AI sarà altrettanto disruptiva per la società quanto l'elettricità, e spesso viene colto a parlare con entusiasmo del potenziale delle tecnologie disruptive e dell'AGI.
Come futurist, è dedicato a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Securities.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e ridisegnando interi settori.