Interviews
Nick Lahoika, Co-Founder and CEO van Vocal Image – Interview Series

Nick Lahoika is de co-founder en CEO van Vocal Image, een coaching startup die mensen helpt bij het ontwikkelen van soft skills. Een serie-ondernemer met meer dan 10 jaar ervaring in IT en bedrijfsontwikkeling, Nick verliet met succes twee ondernemingen voordat hij Vocal Image creëerde. Nick’s reis is diep persoonlijk; hij werd gepest vanwege zijn onduidelijke dictie op school, wat zijn missie inspireerde om mensen te helpen beter te communiceren.
Na te zijn gedwongen zijn thuisland te verlaten na de revolutie van 2020, arriveerde Nick in Estland met een minimale beheersing van het Engels en gebruikte zijn eigen app om zijn stem te trainen, waarmee hij zijn eerste ronde van financiering binnen zes maanden veiligstelde. De winnaar van de AWS AI Challenge en Meta x Hugging Face European AI Startup Program, Vocal Image heeft onlangs een seedronde van $3,6 miljoen opgehaald onder leiding van Educapital (Frankrijk) en is gegroeid tot meer dan $14 miljoen aan jaarlijkse omzet.
U heeft Vocal Image in 2021 opgericht. Wat inspireerde u om een AI-soft skills coach op te bouwen, en welk probleem probeerde u aan het begin op te lossen?
Sprekengezien was een deel van mijn leven voor een lange tijd. Ik werd gepest op school vanwege mijn onduidelijke dictie, en die ervaring is echt bij me blijven hangen. Later, als IT-studentstage, moest ik presenteren voor hoog niveau klanten, en dezelfde angst kwam terug.
Toen in 2021, na de mislukte revolutie in Wit-Rusland, moest ik overhaast naar Europa verhuizen. Plotseling moest ik investeerders in het Engels benaderen, een taal die ik amper sprak. Het was angstaanjagend, maar er was geen keuze. Ik bracht uren per dag door met het oefenen van mijn uitspraak met een zeer vroege versie van wat later Vocal Image zou worden. Het duurde zelfs weken om te leren hoe ik de “V”-klank correct kon uitspreken, zodat ik de naam van mijn eigen bedrijf kon zeggen.
We begonnen met een app die eigenlijk zoals YouTube was, maar met een ingebouwde spraakrecorder en een commentaarfunctie. Gebruikers konden video’s bekijken, regels herhalen en dan naar hun eigen opnames luisteren. Door te zien hoe mensen het gebruikten, realiseerden we ons snel dat ze wanhopig feedback nodig hadden. Onze vroege gebruikers lieten ons zien dat het alleen consumeren van inhoud niet genoeg was om echte resultaten te behalen; ze hadden onmiddellijke feedback nodig. We probeerden feedback te geven via menselijke coaches, maar die aanpak was niet schaalbaar, en dat is hoe we zijn gekomen tot het gebruik van AI.
Het was mijn persoonlijke inzicht dat het voor mij gemakkelijker was om mijn eerste pitches te oefenen met ons platform in plaats van met een persoon. Er was geen druk, geen oordeel. Die vrijheid veranderde alles voor me. Zodra ik mijn eigen probleem had opgelost, realiseerde ik me hoeveel mensen hetzelfde probleem hebben. Meer dan 200 miljoen mensen hebben last van sprekengezien.
Voordat u Vocal Image oprichtte, had u een dansstudio. Hoe heeft uw achtergrond in beweging en expressie uw aanpak voor communicatie en vocale zelfverzekerdheid beïnvloed?
Ik was geen danser; ik bouwde eigenlijk een bedrijf dat zich richtte op zelfexpressie en mensen. Het was door die werk dat ik me realiseerde dat je veel over iemands innerlijke zelfverzekerdheid kon zeggen door naar hun dans te kijken.
Beweging speelt ook een enorme rol in hoe je jezelf uitdrukt. De manier waarop je je beweegt, je houding, je ademhaling, het is allemaal onderdeel van communicatie. Dat is waar AI-coaching krachtig wordt, omdat het mensen kan helpen trainen in al die gebieden op één plek.
Vroeger moesten bedrijven verschillende coaches in dienst nemen. Een voor openbare spreken, een voor lichaamstaal, een voor zelfverzekerdheid. Nu, met AI, is het allemaal verbonden. Je kunt het volledige beeld van communicatie opbouwen, niet alleen één stuk ervan.
In tegenstelling tot de meeste AI-communicatietools, besloot u niet om ChatGPT als basis voor uw coach te gebruiken. Wat leidde tot die beslissing?
De hype rond ChatGPT werd eigenlijk een enorme keerpunt voor ons. Toen het mainstream werd, creëerde het een enorme piek in AI-vertrouwen, en we konden dat gebruiken om mensen te laten geloven in onze eigen technologie.
Maar hier is het punt: we wilden het absoluut niet gebruiken als onze basis. Ons doel vanaf het begin was om onze unieke model te gebruiken om mensen’s stem en spraakpatronen te evalueren. We gebruiken grote taalmodellen zoals Gemini, Claude en ChatGPT en kennisbases, tips en trucs uit communicatieliteratuur in onze huidige modellen, maar ze vormen niet de kern van onze feedbackmechanisme. De echte basis van onze feedback is menselijke input.
De angst dat AI-coaching robotachtig of onpersoonlijk aanvoelt, is reëel. Om dat te counteren, hebben we een gemeenschap binnen Vocal Image gefosterd waar gebruikers onmiddellijk kunnen verbinden, een gemeenschappelijk doel delen om hun communicatie te verbeteren, en elkaars reis kunnen ondersteunen. En deze gemeenschap groeit en verbetert onze AI constant.
Kunt u uitleggen hoe het trainen van uw AI uitsluitend op menselijke stemmen verschilt van traditionele LLM-gebaseerde benaderingen in termen van resultaten en authenticiteit?
We gebruiken grote taalmodellen als onderdeel van het proces voor evaluatie en context, maar de echte basis van ons systeem is de data erachter. Ons coremodel is getraind op onze eigen gemeenschap, bestaande uit mensen die specifiek samenkwamen om hun communicatieve vaardigheden te verbeteren.
AI is alleen zo goed als de mensen waar het van leert. Onze propriëtaire dataset omvat nu meer dan één miljoen unieke menselijke stemmen, elk met toon, ritme en emotie, allemaal vertegenwoordigen de echte essentie van communicatie.
Uw dataset omvat meer dan één miljoen menselijke stemmen. Wat waren de uitdagingen die u tegenkwam bij het cureren en labelen van zo’n unieke corpus?
Je kunt niet evenveel vertrouwen op elk datapunt. Sommige gebruikers beoordelen zorgvuldig, anderen klikken gewoon door. We moesten een systeem ontwerpen dat zorgvuldige feedback onderscheidt van ruis. Na verloop van tijd leerden we om meer gewicht te geven aan gebruikers met consistente deelname en betrouwbare oordeel, terwijl we willekeurige input filterden.
Het moeilijkste deel was operationeel, wat het opbouwen van een beoordelings-ecosysteem inhield dat kwaliteit boven kwantiteit beloont. Dat is waar onze gemeenschap onmisbaar werd. Deze zijn geen willekeurige internetgebruikers, het zijn mensen die echt proberen hun soft skills te verbeteren en anderen te helpen hetzelfde te doen. Alle beoordelingen zijn anoniem, wat helpt om de feedback onbevooroordeeld en authentiek te houden.
De community-gedreven “Tinder-achtige” evaluatiemechanisme is fascinerend — hoe vormt deze feedbacklus de voortdurende leercurve van uw AI?
Elke beoordeling, in elke taal, wordt een klein stukje intelligentie dat onze model verfijnt. Het is een levende feedbacklus. Hoe meer mensen trainen en evalueren, hoe slimmer het systeem wordt in het herkennen van nuances in spraak en emotie, en het leren hoe mensen werkelijk perceptie, vertrouwen, warmte of autoriteit over culturen heen ervaren.
Wat waren de belangrijkste lessen die u leerde bij het ontwikkelen van een AI-model dat zich richt op soft skills in plaats van technische competenties?
De belangrijkste uitdaging was meting. Er is geen universele maatstaf voor “betrouwbaar” of “charismatisch”. We moesten onze eigen maatstaf creëren.
Dit is waar de Wet van de grote aantallen kwam in. Als 100.000 mensen het erover eens zijn dat een bepaalde stem vertrouwenwekkend of empathisch klinkt, kun je beginnen dat collectieve begrip te vertrouwen. Na verloop van tijd leerden we onze AI om subjectieve kwaliteiten te voorspellen, dingen die niet eenvoudigweg met goed of fout kunnen worden beoordeeld. Dat was de doorbraak: leren om wat altijd als intuïtief werd beschouwd te kwantificeren.
Met $14 miljoen aan jaarlijkse omzet en een verse $3,6 miljoen seedronde, wat zijn uw belangrijkste prioriteiten voor deze volgende fase van groei — of het nu gaat om het verbeteren van het AI-model, het uitbreiden van de gebruikersbasis, of het verdiepen van de community-ervaring?
Onze missie is altijd mensgericht geweest. We helpen mensen om met meer zelfverzekerdheid en authenticiteit te communiceren.
De volgende fase gaat over het opschalen van die impact wereldwijd. We breiden uit naar nieuwe talen en geografische gebieden, en ontwikkelen nieuwe soft-skill modules zoals onderhandelen, actief luisteren en eloquentie.
Veel gebruikers zeggen dat AI-coaches robotachtig of onpersoonlijk aanvoelen. Hoe zorgt u ervoor dat Vocal Image emotioneel resonante en contextueel bewuste feedback levert?
We focussen op hyperpersonalisatie. Vanaf de eerste interactie leren we wie je bent, inclusief je accent, leeftijd, professionele context en spreekpatronen. Na verloop van tijd hebben we geheugen, herinneren we ons hoe je bent verbeterd, waar je worstelt, en welke feedback het meest resoneert.
Dat stelt de AI in staat om dynamisch aan te passen. De ervaring voelt persoonlijk omdat het persoonlijk is. Het is volledig gevormd door uw gegevens en uw reis, niet door een generieke script.
Kijkt u vooruit, hoe ziet u AI-soft skills coaching evolueren naarmate generatieve en emotionele AI verder ontwikkelen?
Menselijke ontwikkeling is altijd een mengeling van natuur en opvoeding geweest. Wetenschap vertelt ons dat leiderschap ongeveer voor de helft aangeboren en voor de helft aangeleerd is. Het aangeleerde deel was voorheen gereserveerd voor executives die dure coaches konden betalen. Voor een lange tijd moesten bedrijven tussen de $7.000 en $25.000 per jaar betalen voor het coachen van één leider. AI verandert dat.
Ook moet men met menselijke trainers omgaan, wat het inhuren van veel afzonderlijke coaches noodzakelijk maakt, terwijl een AI-coach al deze coaches kan vervangen.
Op dit moment gebruiken we een pijplijn van verschillende modellen om verschillende aspecten van communicatie te analyseren, maar de toekomst is een enkel, geïntegreerd systeem dat u holistisch evalueert en begeleidt. Deze technologie zal groei democratiseren. U hoeft niet charmant of een groot bedrijfsbudget te hebben om communicatie te beheersen. U hebt alleen nieuwsgierigheid en toegang nodig, en het creëren van een omgeving waarin dat kan floreren, is wat me elke dag drijft.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten Vocal Image bezoeken.












