Интервью
Ник Лахойка, сооснователь и CEO Vocal Image – Интервью

Ник Лахойка является сооснователем и CEO Vocal Image, стартапа по коучингу, который помогает людям развивать мягкие навыки. Как серийный предприниматель с более чем 10-летним опытом в сфере IT и бизнес-развития, Ник успешно вышел из двух проектов до создания Vocal Image. Путь Ника глубоко личный; он был задираем в школе за нечеткую дикцию, что вдохновило его на миссию помочь людям лучше общаться.
После того, как ему было вынуждено бежать из своей родной страны после революции 2020 года, Ник прибыл в Эстонию с минимальным знанием английского языка и использовал свое собственное приложение, чтобы тренировать свой голос, обеспечив первый раунд финансирования всего за шесть месяцев. Победитель конкурса AWS AI Challenge и программы Meta x Hugging Face European AI Startup, Vocal Image недавно привлекла 3,6 миллиона долларов в рамках раунда финансирования, возглавляемого Educapital (Франция), и масштабировалась до более 14 миллионов долларов годового рекуррентного дохода.
Вы основали Vocal Image в 2021 году. Что вдохновило вас создать коуч по мягким навыкам на основе ИИ, и какую проблему вы пытались решить в самом начале?
Тревога за речь была частью моей жизни в течение долгого времени. Меня задирали в школе за нечеткую дикцию, и этот опыт действительно остался со мной. Позже, как студент-стажер в сфере IT, мне пришлось представлять высокому уровню клиентов, и та же самая страх вернулся.
Затем в 2021 году, после неудавшейся революции в Беларуси, мне пришлось переехать в Европу за одну ночь. Внезапно я начал представлять инвесторам на английском языке, который я几乎 не знал. Это было ужасно, но не было выбора. Я проводил часы каждый день, тренируя свою произношение, используя очень раннюю версию того, что позже стало Vocal Image. Это даже заняло у меня недели, чтобы научиться правильно произносить звук “В”, чтобы я мог произнести название своей собственной компании.
Мы начали с приложения, которое было по сути как YouTube, но с встроенным голосовым рекордером и функцией комментариев. Пользователи могли смотреть видео, практиковать повторение строк и затем слушать свои собственные записи. Наблюдая, как люди используют его, мы быстро поняли, что им отчаянно нужна обратная связь. Наши ранние пользователи показали нам, что просто потребление контента было недостаточно, чтобы получить реальные результаты; им нужна была немедленная обратная связь. Мы попробовали доставлять обратную связь через человеческих тренеров, но этот подход не был масштабируемым, и это привело нас к использованию ИИ.
Это было моим личным прозрением, что было легче для меня практиковать свои первые презентации с нашей платформой, а не с человеком. Не было давления, не было суда. Эта свобода все изменила для меня. Как только я решил свою собственную проблему, я понял, сколько людей сталкиваются с той же проблемой. Более 200 миллионов человек страдают от тревоги за речь.
До Vocal Image вы управляли танцевальной студией. Как ваш опыт в движении и выражении повлиял на ваш подход к коммуникации и уверенности в голосе?
Я не был танцором; я фактически построил бизнес, ориентированный на самовыражение и людей. Это было через эту работу, что я понял, что можно многое рассказать о внутренней уверенности человека, просто наблюдая, как он танцует.
Движение также играет огромную роль в том, как вы выражаете себя. То, как вы двигаетесь, ваша осанка, ваше дыхание, все это часть коммуникации. Именно здесь коучинг на основе ИИ становится мощным, поскольку он может помочь людям тренироваться во всех этих областях в одном месте.
Раньше компании должны были нанимать нескольких разных тренеров. Одного для публичных выступлений, одного для языка тела, одного для уверенности. Теперь, с ИИ, все это связано. Вы можете построить полную картину коммуникации, а не только одну часть ее.
В отличие от большинства инструментов коммуникации на основе ИИ, вы решили не использовать ChatGPT в качестве основы для вашего тренера. Что привело к этому решению?
Гип вокруг ChatGPT фактически стал огромным поворотным моментом для нас. Когда он стал мейнстримом, он создал огромный скачок доверия к ИИ, и мы смогли использовать это, чтобы люди поверили в нашу собственную технологию.
Но вот в чем дело: мы определенно не хотели использовать его в качестве основы. Наша цель с самого начала была использовать нашу уникальную модель для оценки голоса и речевых паттернов людей. Мы используем большие языковые модели, такие как Gemini, Claude и ChatGPT, а также знания, советы и трюки из литературы по коммуникации в наших текущих моделях, но они не являются ядром нашей обратной связи. Реальная основа нашей обратной связи – это человеческий ввод.
Страх того, что коучинг на основе ИИ будет казаться роботизированным, реален. Чтобы противостоять этому, мы создали сообщество внутри Vocal Image, где пользователи могут мгновенно соединиться, поделиться общей целью улучшения своей коммуникации и поддержать друг друга в их пути. И это сообщество постоянно растет и улучшает наш ИИ.
Можете ли вы подробнее рассказать о том, как тренировка вашего ИИ исключительно на человеческих голосах отличается от традиционных подходов на основе Больших Языковых Моделей в плане результатов и аутентичности?
Мы используем большие языковые модели как часть процесса для оценки и контекста, но реальная основа нашей системы – это данные, лежащие в ее основе. Наша основная модель была обучена на нашем собственном сообществе, состоящем из людей, которые объединились специально для улучшения своих коммуникационных навыков.
ИИ так хорош, как хороши люди, от которых он учится. Наш проприетарный набор данных теперь включает более одного миллиона уникальных человеческих голосов, каждый из которых несет тон, ритм и эмоцию, все из которых представляют реальную суть коммуникации.
Ваш набор данных включает более одного миллиона человеческих голосов. Какие проблемы вы столкнулись при курировании и маркировке такого уникального корпуса?
Вы не можете полагаться одинаково на каждую точку данных. Некоторые пользователи оценивают тщательно, другие просто кликают через. Нам пришлось разработать систему, которая различает вдумчивую обратную связь и шум. Со временем мы научились придавать больше веса пользователям с последовательным участием и надежной оценкой, фильтруя случайный ввод.
Самой трудной частью было операционное, которое включало построение экосистемы оценки, которая вознаграждает качество над количеством. Именно здесь наше сообщество стало бесценным. Это не случайные пользователи интернета, это люди, которые искренне пытаются улучшить свои мягкие навыки и помочь другим сделать то же самое. Все рейтинги анонимны, что помогает сохранять обратную связь беспристрастной и аутентичной.
Механизм оценки “Тиндер-подобного” сообщества fascinates – как эта обратная связь влияет на непрерывное обучение вашего ИИ?
Каждая оценка, на каждом языке, становится маленьким кусочком интеллекта, который совершенствует нашу модель. Это живой цикл обратной связи. Чем больше людей тренируются и оценивают, тем умнее система становится в распознавании нюансов речи и эмоций, обучаясь тому, как люди на самом деле воспринимают уверенность, тепло или авторитетность в разных культурах.
Какие были ключевые уроки, извлеченные во время разработки модели ИИ, ориентированной на мягкие навыки, а не на технические компетенции?
Основной проблемой была измеримость. Нет универсальной метрики для “достоверного” или “харизматичного”. Нам пришлось создать свою собственную.
Именно здесь Закон больших чисел сыграл свою роль. Если 100 000 человек согласны с тем, что определенный голос звучит уверенно или эмпатично, вы можете начать доверять этому коллективному восприятию. Со временем мы научили наш ИИ предсказывать субъективные качества, вещи, которые не могут быть оценены простым правильным или неправильным. Это был прорыв: научиться количественно оценивать то, что всегда считалось неосязаемым.
С 14 миллионами долларов годового рекуррентного дохода и свежим раундом финансирования в размере $3,6 миллиона, какие ваши основные приоритеты на этом этапе роста – будь то совершенствование модели ИИ, расширение базы пользователей или углубление опыта сообщества?
Наша миссия всегда была ориентирована на человека. Мы помогаем людям общаться с большей уверенностью и аутентичностью.
Следующая фаза – это масштабирование этого воздействия глобально. Мы расширяемся на новые языки и географии и разрабатываем новые модули мягких навыков, такие как переговоры, активное слушание и элоquence.
Многие пользователи говорят, что тренеры ИИ кажутся роботизированными или безличными. Как вы обеспечиваете, чтобы Vocal Image доставлял эмоционально резонансную и контекстно-осведомленную обратную связь?
Мы фокусируемся на гиперперсонализации. С первого взаимодействия мы узнаем, кто вы, включая ваш акцент, возраст, профессиональный контекст и речевые паттерны. Со временем у нас есть память, вспоминая, как вы улучшили, где вы боретесь и какая обратная связь резонирует больше всего.
Это позволяет ИИ адаптироваться динамически. Опыт кажется личным, потому что он действительно личный. Он формируется полностью вашими данными и вашим путем, а не каким-то общим сценарием.
Оглядываясь вперед, как вы видите эволюцию коучинга мягких навыков на основе ИИ, когда генеративный и эмоциональный ИИ продолжают созревать?
Развитие человека всегда было смесью природы и воспитания. Наука говорит нам, что лидерство примерно наполовину врожденное, наполовину приобретенное. Приобретенная часть раньше была зарезервирована для руководителей, которые могли позволить себе дорогих тренеров. В течение долгого времени компании должны были тратить между 7 000 и 25 000 долларов в год на коучинг одного лидера. ИИ меняет это.
Кроме того, взаимодействие с человеческими тренерами потребовало бы найма нескольких отдельных тренеров, тогда как тренер ИИ может заменить всех их.
Сейчас мы используем конвейер разных моделей для анализа разных аспектов коммуникации, но будущее – это единая, объединенная система, которая оценивает и руководит вами целостно. Эта технология демократизирует рост. Вам не нужно быть рожденным харизматичным или иметь большой корпоративный бюджет, чтобы овладеть коммуникацией. Вам просто нужно любопытство и доступ, и создание среды для этого – это то, что движет мной каждый день.
Спасибо за отличное интервью, читателям, которые хотят узнать больше, следует посетить Vocal Image.












