Haastattelut

Nick Lahoika, Vocal Image -yhtiön perustaja ja toimitusjohtaja – Haastattelusarja

Published November 20, 2025

Updated April 25, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Nick Lahoika on Vocal Image -valmennusstart-upin perustaja ja toimitusjohtaja, joka auttaa ihmisiä kehittämään viestintätaitojaan. Sarjayrittäjä, jolla on yli 10 vuoden kokemus IT- ja liiketoimintakehityksen alalta, Nick onnistui poistumaan kahdesta aiemmasta yrityksestään ennen Vocal Imagen perustamista. Nickin matka on syvästi henkilökohtainen; häntä kiusattiin koulussa epäselvän lausumisen vuoksi, mikä innoitti hänen tehtäväänsä auttaa ihmisiä viestimään paremmin.

Pakotettu pakenemaan kotimaastaan vuoden 2020 vallankumouksen jälkeen, Nick saapui Viroon vähäisen englannin kielen taidon kanssa ja käytti omaa sovellusta äänen harjoitteluun, varmistaen ensimmäisen rahoituskierroksensa vain kuuden kuukauden kuluttua. AWS AI Challenge -voittaja ja Meta x Hugging Face European AI Startup Program, Vocal Image on kerännyt äskettäin 3,6 miljoonan dollarin siemenvaiheen rahoituksen Educapitalilta (Ranska) ja laajentunut yli 14 miljoonan dollarin vuosittaiseen toistuvaan liikevaihtoon.

Perustit Vocal Imagen vuonna 2021. Mikä innoitti sinua rakentamaan tekoälypohjaisen viestintävalmentajan, ja mikä ongelma yritit ratkaista aluksi?

Puhumisen pelko on ollut osa elämääni pitkään. Koulussa minut kiusattiin epäselvän lausumisen vuoksi, ja se kokemus jäi todella mieleeni. Myöhemmin IT-opiskelijana minun piti esittää asiakkaille, ja sama pelko palasi.

Sitten vuonna 2021, kun vallankumous epäonnistui Valko-Venäjällä, minun piti muuttaa Eurooppaan yötä hiljaa. Yhtäkkiä minun piti esittää sijoittajille englanniksi, kieltä jota minä tuskin puhuin. Se oli pelottavaa, mutta valinnanvaraa ei ollut. Vietin tunteja joka päivä harjoitellen ääntäni hyvin varhaisella versiolla siitä, mikä myöhemmin tulisi Vocal Imageksi. Se vei jopa viikkoja opetella lausumaan ”V”-äänteen oikein, jotta voin sanoa oman yhtiön nimen.

Aloimme sovelluksella, joka oli käytännössä kuin YouTube, mutta sisälsi äänittimen ja kommenttifunktion. Käyttäjät voivat katsoa videoita, harjoitella toistamalla lauseita ja kuunnella omia äänityksiään. Katsellessamme, miten ihmiset käyttivät sitä, tajusimme nopeasti, että he tarvitsivat palautetta. Varhaiset käyttäjämme osoittivat meille, että sisällön kuluttaminen ei ollut riittävää saadakseen todellisia tuloksia; he tarvitsivat välitöntä palautetta. Yritimme toimittaa palautetta ihmiscoachien kautta, mutta se lähestymistapa ei ollut skaalautuva, ja siksi päädyimme käyttämään tekoälyä.

Se oli henkilökohtainen oivallus, että minulle oli helpompaa harjoitella ensimmäisiä esityksiäni alustallamme ihmisen sijaan. Siinä ei ollut painetta, ei tuomionpelkoa. Se vapaus muutti kaiken minulle. Kun ratkaisin oman ongelmani, tajusin, kuinka moni ihminen kohtaa samaa ongelmaa. Yli 200 miljoonaa ihmistä kamppailee puhumisen pelon kanssa.

Ennen Vocal Imagea, johtit tanssituntia. Miten taustasi liikkeessä ja ilmeisyydessä vaikuttaa lähestymistapaasi viestintään ja äänen luottamukseen?

En ollut tanssija; itse asiassa rakensin liiketoimintaa, joka keskittyi itseilmaisuun ja ihmisiin. Se työ osoitti minulle, että voit kertoa paljon ihmisen sisäisestä luottamuksesta vain katsomalla, miten hän tanssii.

Liike myös vaikuttaa suuresti siihen, miten ilmaisee itseään. Tapa, jolla liikkuu, asento, hengitys, kaikki se on osa viestintää. Siinä tekoälyvalmennus tulee voimaan, koska se voi auttaa ihmisiä harjoittelemaan kaikkia näitä alueita yhdessä paikassa.

Aikaisemmin yritysten piti palkata useita eri valmentajia. Yksi puhumisvalmennukseen, yksi kehonkielen, yksi luottamukseen. Nyt tekoälyllä kaikki on yhteydessä. Voit rakentaa koko viestinnän kuvan, ei vain yhtä osaa siitä.

Toisin kuin useimmat tekoälyviestintätyökalut, päättäit äläkä käytä ChatGPT:ä valmentajasi perustana. Mikä johti tähän päätökseen?

ChatGPT:n hype oli meille suuri käännekohta. Kun se tuli suosituksi, se loi massiivisen hyppäyksen tekoälyn luottamukseen, ja pystyimme hyödyntämään sitä saadaksemme ihmiset uskomaan omaan teknologiaamme.

Mutta tässä on jokin asia: emme halunneet käyttää sitä perustana. Tavoitteemme alusta alkaen oli käyttää omaa malliamme arvioidaksemme ihmisten ääni- ja puhetapoja. Käytämme suuria kielimalleja, kuten Gemini, Claude ja ChatGPT, sekä viestintäkirjallisuuden tietokantoja, vinkkejä ja temppuja nykyisissä malleissamme, mutta ne eivät ole palauttemekanismimme ydintä. Todellinen perusta palauttelemme on ihmisten panos.

Pelko tekoälyvalmennuksen tuntumisesta robottimaiselta on todellinen. Vastataksemme siihen, loimme Vocal Imagessa yhteisön, jossa käyttäjät voivat yhdistää, jakaa yhteisen tavoitteen viestintätaitojen parantamiseksi ja tukea toistensa matkaa. Ja tämä yhteisö kasvaa jatkuvasti ja parantaa tekoälyämme.

Voihsinhan selittää, miten tekoälysi kouluttaminen yksinomaan ihmisten äänillä eroaa perinteisistä LLM-pohjaisista lähestymistavoista tuloksien ja aidonisuuden suhteen?

Käytämme suuria kielimalleja osana arviointiprosessia, mutta järjestelmämme todellinen perusta on taustalla oleva data. Perusmallimme on koulutettu oman yhteisömme avulla, joka koostuu ihmisistä, jotka ovat kokoontuneet erityisesti parantamaan viestintätaitojaan.

Tekoäly on vain niin hyvä kuin ihmiset, joilta se oppii. Oma tietokantamme sisältää nyt yli miljoona ainutlaatuista ihmisen ääntä, jokainen kantaa mukanaan sävyn, rytmin ja tunteen, jotka edustavat viestinnän todellista olemusta.

Tietokantasi sisältää yli miljoona ihmisen ääntä. Mitkä haasteet kohtasit tietokannan kuratoinnissa ja merkinnöissä?

Et voi luottaa jokaiseen tietopistettä yhtä paljon. Jotkut käyttäjät arvioivat tarkkaan, toiset vain klikkaavat läpi. Meidän piti suunnitella järjestelmä, joka erottaa ajattelevan palautteen melusta. Ajan myötä opimme antamaan enemmän painoa käyttäjille, joilla on johdonmukainen osallistuminen ja luotettava arvostelukyky, ja suodattamaan pois satunnaisen syötteen.

Haasteellisin osa oli operatiivinen, joka liittyi arvostelujärjestelmän rakentamiseen, joka palkitsee laadun määrän sijaan. Siinä yhteisömme tuli arvokkaaksi. Nämä eivät ole satunnaisia internetin käyttäjiä, vaan ihmisiä, jotka pyrkivät parantamaan viestintätaitojaan ja auttamaan muita tekemään samoin. Kaikki arvostelut ovat anonyymejä, mikä auttaa pitämään palautteen puolueettomana ja aidona.

Yhteisölähtöinen ”Tinder-tyylinen” arviointimekanismi on mielenkiintoinen — miten tämä palautekierto muotoilee tekoälysi jatkuvaan oppimiseen?

Jokainen arvostelu, kullakin kielellä, muodostaa pienen älykkyyden palasen, joka hienontaa malliamme. Se on elävä palautekierto. Mitä enemmän ihmiset harjoittelevat ja arvioivat, sitä älykkäämmäksi järjestelmästä tulee tunnistamaan puheen ja tunteen nuansseja, oppimaan, miten ihmiset todella havaitsevat luottamusta, lämpimyyttä tai auktoriteettia kulttuurien yli.

Mitkä olivat tärkeimmät oppitunnit kehittäessäsi tekoälymallia, joka keskittyy viestintätaitoihin eikä teknisiin taitoihin?

Päähaasteena oli mittaus. Ei ole yleispätevää mittaria ”luotettavuudelle” tai ”karismaattisuudelle”. Meidän piti luoda oma.

Tässä suuret lukujen laki tuli mukaan. Jos 100 000 ihmistä pitää tietyn äänen luotettavana tai empaattisena, voit alkaa luottaa siihen yhteiseen havaintoon. Ajan myötä opetimme tekoälymme ennustamaan subjektiivisia laatuja, asioita, joita ei voi arvioida yksinkertaisesti oikein tai väärin. Se oli läpimurto: opimme mittaamaan sitä, mitä oli aina pidetty abstraktina.

Vuoden 14 miljoonan dollarin vuosittaisen toistuvan liikevaihdon ja tuoreen $3,6 miljoonan siemenvaiheen jälkeen, mitkä ovat tärkeimmät tavoitteesi seuraavassa kasvuvaiheessa — onko kyse tekoälymallin kehittämisestä, käyttäjäkunnan laajentamisesta tai yhteisökokemuksen syventämisestä?

Meidän tehtävämme on aina ollut ihmiskeskeinen. Autamme ihmisiä viestimään luottamuksella ja aidosti.

Seuraava vaihe on skaalata tämä vaikutus maailmanlaajuisesti. Laajennamme uusiin kieliversioihin ja maantieteellisiin alueisiin ja kehitämme uusia viestintätaitoja, kuten neuvottelua, aktiivista kuuntelua ja sujuvaa puhumista.

Monet käyttäjät sanovat, että tekoälyvalmentajat tuntuvat robottimaisilta tai epähenkilökohtaisilta. Miten varmistat, että Vocal Image toimittaa tunteellisesti resonoivaa ja kontekstia tietoista palautetta?

Keskitymme hyperhenkilökohtaisuuteen. Ensimmäisestä interaktiosta alkaen opimme, kuka sinä olet, mukaan lukien aksenttisi, ikäsi, ammatillinen kontekstisi ja puhetapasi. Ajan myötä meillä on muisti, joka muistaa, miten olet parantunut, missä kamppailet ja minkälaista palautetta vastaa sinuun eniten.

Se mahdollistaa tekoälymme dynaamisen mukautumisen. Kokemus tuntuu henkilökohtaiselta, koska se on henkilökohtaista. Se on muotoiltu kokonaan sinun tietojen ja sinun matkasi mukaan, ei johonkin yleiseen käsikirjoitukseen.

Miten näet tekoälypohjaisten viestintätaitojen valmennuksen kehittyvän, kun generatiivinen ja emotionaalinen tekoäly jatkaa kypsyämistään?

Ihmisen kehitys on aina ollut sekoitus luonnon ja kasvatuksen vaikutusta. Tiede kertoo meille, että johtajuus on noin puoliksi luonnollista, puoliksi opittua. Opittu puoli on aina ollut varattu johtajille, jotka voivat maksaa kalliita valmentajia. Pitkään yritykset ovat joutuneet maksamaan 7 000 ja 25 000 dollaria vuodessa yhden johtajan valmennuksesta. Tekoäly muuttaa tämän.

Lisäksi ihmisten kouluttaminen edellyttäisi useiden eri valmentajien palkkaamista, kun taas tekoälyvalmentaja voi korvata kaikki heidät.

Tällä hetkellä käytämme useita eri malleja eri viestinnän osa-alueiden analysointiin, mutta tulevaisuus on yhtenäinen järjestelmä, joka arvioi ja opastaa kokonaisvaltaisesti. Tämä teknologia demokratisoi kasvun. Et tarvitse olla karismaattinen taiolla suuren yrityksen budjettia hallitaksesi viestintää. Sinun tarvitsee vain olla utelias ja pääsy, ja ympäristön luominen, jossa se voi kukoistaa, on se, mikä ajaa minua joka päivä.

Kiitos haastattelusta, lukijat, jotka haluavat oppia lisää, kannattaa vierailla Vocal Imagessa.

Unite.AI

Nick Lahoika, Vocal Image -yhtiön perustaja ja toimitusjohtaja – Haastattelusarja

You may like