인터뷰

Voicemod CEO Jaime Bosch – 인터뷰 시리즈

게재

3 년 전

2021 년 9 월 10 일

앙투안 타르디프

제이미 보쉬 CEO 보이스 모드 게이머, 콘텐츠 제작자 및 vtubers를 위한 무료 음성 변경 소프트웨어입니다.

Voicemod의 기원 이야기를 공유해 주시겠습니까?

저는 8남매 중 10남매로 어릴 때부터 기업가 정신을 마음껏 펼칠 수 있는 환경에서 자랐습니다. 항상 비슷한 생각을 가진 형제들이 있었기 때문입니다.

따라서 우리 모두가 기술과 음악에 대한 깊은 사랑을 공유하는 두 형제와 제가 우리의 관심사를 혼합하는 앱을 만드는 아이디어를 가지고 장난을 치는 것은 시간 문제였습니다. 그래서 2009년에 우리는 그렇게 했고 우리가 본업으로 운영하고 있던 스튜디오 사업의 부업으로 B2C 음악 앱을 만들었습니다.

사이드 프로젝트였기 때문에 우리는 음성 변조와 같은 것을 많이 실험했고, 이는 완전히 새롭고 참신한 것을 만들도록 영감을 주었습니다. 그 결과 "Voicemod Experience"라고 부르는 자신의 목소리를 경험할 수 있는 완전히 새로운 방법이 탄생했으며 이것이 앱 진화의 원동력이 되었습니다. 누가 우리 소프트웨어를 사용해 보았는지에 관계없이 우리는 앱을 경험한 사람들로부터 동일한 종류의 반응에 직면했습니다. 완전히 다른 방식으로 자신의 말을 듣는 것에 대한 웃음과 놀라움.

이를 통해 우리는 제품에 대한 비전을 소리라는 매체를 통해 인간의 연결을 궁극적으로 발전시킬 수 있는 것으로 재구성하게 되었습니다. 그래서 우리는 경험을 모바일에서 PC로 가져와 폭발적인 게임 및 스트리밍 장면에서 즉시 채택했으며 나머지는 "역사"입니다.

Voicemod는 처음에 사이드 프로젝트였습니다. 언제 올인하고 싶다는 생각을 하셨습니까?

처음에는 형제들과 함께 2taptap이라는 스튜디오를 운영했습니다. Voicemod를 만들기 위한 아이디어를 생각해냈을 때 처음에는 그저 재미있는 부차적인 프로젝트였지만 시간이 지남에 따라 사람들이 Voicemod와 상호 작용하는 방식과 기술이 가진 일종의 잠재력을 보았습니다. 그 시점까지 대부분의 음성 변경 기술은 비동기식이었기 때문에 실시간 환경에서 다른 사람이 되는 것을 경험할 수 있다는 것은 많은 사람들에게 생소했습니다. 그러나 우리에게 결정적인 순간은 사람들이 우리의 기술을 단지 재미를 위해 사용하는 것이 아니라 온라인에서 자신을 표현하는 전체 방식을 형성하기 위해 사용하고 있다는 사실을 깨닫는 것이었습니다. 이것은 우리가 단지 엔터테인먼트에 관한 것이 아니라 아마도 소셜 오디오 경험의 미래의 다음 단계를 구축하고 있다는 것을 깨달았을 때입니다.

음성 인식 기술에 대해 말씀해 주시겠습니까?

당사 카탈로그에 있는 다양한 보이스 체인저에는 일반적인 사람의 목소리를 새로운 것으로 변환하기 위해 거쳐야 하는 프로세스가 있습니다. 물론 나이, 성별, 감정, 말하는 방식의 단순한 차이와 같이 설명해야 하는 목소리에도 측면이 있습니다.

이러한 변화는 누군가가 소리를 낼 수 있는 방식에 영향을 미치고 적용되는 변경 사항에 영향을 미칩니다. 최첨단 음성 인식 기술의 요소를 활용하여 가능한 한 정확하게 음성 변환 및 변형을 촉진하고 이 프로세스를 지속적으로 개선하고 있습니다. 우리는 사람들에게 자신이 인식되는 방식을 구조화하고 원하는 방식으로 소리를 내며 청중에게 훌륭한 청취 경험을 제공할 수 있는 기회를 제공하고자 합니다.

사람들이 소리를 통해 자신을 표현하도록 돕는 것이 왜 중요한가요?

우리가 태어나는 순간부터 아기가 처음으로 비명을 지르는 순간부터 소리는 우리가 자신을 표현하는 법을 배우는 자연스러운 방법입니다. 나이가 들어감에 따라 소리를 언어로 만들고 목소리를 사용하여 우리가 말하는 단어에 감정과 뉘앙스를 넣는 방법을 배우면서 오디오 커뮤니케이션의 중요성이 계속 커집니다. 목소리의 높낮이를 높임으로써 우리는 흥분을 알릴 수 있습니다. 또는 한숨이나 신음과 같은 음향 효과를 사용하여 우리가 말하고자 하는 요점을 특별히 강조할 수 있습니다.

진정으로 재능 있는 일부 사람들에게 음성은 무제한의 음향 효과나 음성을 생성할 수 있기 때문에 무제한의 표현을 위한 도구입니다. 그러나 우리 대부분은 운이 좋지 않으며 실제로 우리의 목소리에 불편함을 느낍니다(특히 녹음된 목소리를 들을 때). 일부 사용자는 낯선 사람 앞에서 말할 때 긴장하고 자신이 원하는 방식으로 자신을 제대로 표현하지 못하는 것에 좌절감을 느낀다고 말합니다.

이것은 우리가 사람들을 도울 수 있는 엄청난 기회를 보는 곳입니다. 우리의 음성 ID를 통해 사용자는 자신의 목소리를 편안하게 느끼도록 만들거나 특정 상황에 대해 다른 목소리로 전환할 수도 있습니다. 또한 음향 효과, 음악 클립 또는 오디오 이모지를 사용하여 분위기를 조성하고 맥락을 전달하거나 코미디 효과를 구현할 수 있도록 하고 싶습니다. 그래픽 이모지가 텍스트 커뮤니케이션을 형성하는 데 도움이 된 방식과 유사합니다.

Voicemod가 소리를 통한 인간 관계의 진화라고 설명하셨습니다. 이에 대해 자세히 설명해 주시겠습니까?

화자를 자유롭게 하고 사람들이 말하는 것을 막는 특정 정신적 장애물을 제거하는 것 외에도 우리는 이 연결을 더 깊게 만들기 위해 노력하고 있습니다. 예를 들어, 우리의 사운드보드는 커뮤니케이션을 한 단계 더 끌어올립니다. "오디오 이모지"라고 생각하면 됩니다. 35세 미만의 사람들이 이모티콘을 사용하지 않고 채팅하는 것을 상상할 수 있습니까? 이 기술은 오랜 세월 동안 존재해 왔지만 실제로는 약 2010년부터 우리의 커뮤니케이션에 깊숙이 자리 잡았습니다. 우리는 메시징 플랫폼의 스티커, 음성 메시징 및 음성 메모의 증가, 그리고 이제 새로운 용도로 사용되는 유사한 추세를 보았습니다. GIF 및 Giphy의. 전 세계적으로 오디오 통신이 확장됨에 따라 소리를 사용하는 방법의 중요성이 커지고 있습니다. 친구의 농담에 오디오 반응을 보내면 단순히 문장을 입력하는 것보다 당신의 생생한 반응에 대해 더 많은 것을 알 수 있습니다. 귀뚜라미 소리를 듣는 것과 귀뚜라미 소리를 듣는 것의 차이를 상상해 보십시오. 바 덤 쯧쯧! 그들은 클릭 한 번으로 쉽게 소통할 수 있는 매우 다른 의미와 감정을 가지고 있습니다.

우리는 사용자가 음성, 음성 효과 및 오디오 이모티콘을 최대한 쉽게 활용하여 친구, 가족 또는 낯선 사람과 보다 매력적인 오디오 대화를 할 수 있기를 바랍니다.

사용자가 더 나은 소리를 내고 실제 음성을 중심으로 음성을 맞춤 설정할 수 있도록 하는 것을 포함하여 Voicemod 앱 뒤에 있는 기계 학습 기술에는 어떤 것이 있습니까?

기계 학습은 대부분의 새로운 Voicemod 기능의 핵심입니다.

창의적인 측면과 관련하여 Voicemod의 Voicelab은 시장에서 최초로 실시간 음성 변환 기술을 개발했습니다. 이 기술을 통해 사용자는 자신만의 음향 정체성을 선택하여 각 개인의 목소리를 만들 수 있습니다.

곧 출시될 새로운 고급 기술로 사용자의 개인 정보와 보안을 보호하는 동시에 사운드를 통해 원하는 개성을 만들 수 있는 고유한 특성을 가진 이전에 들어본 적이 없는 음성을 생성합니다.

또한 최근 몇 년 동안 데이터 기반 딥 러닝 방법론이 등장하는 것을 관찰했습니다. 이를 통해 음운론, 내용, 정체성, 의도 및 기분과 같은 음성의 지각적 특성과 관련된 음성 신호 내에서 추상적이고 숨겨진 구조를 학습할 수 있습니다. 이러한 기술을 활용하여 신호의 지각적 측면을 제어하고 수정할 수 있습니다. 이를 통해 이전에는 불가능했던 방식으로 인식된 음성 ID를 사용자가 더 많이 제어할 수 있는 기술을 설계할 수 있습니다.

Voicemod 앱의 사용 사례는 무엇입니까?

Voicemod의 가장 큰 장점은 도구가 다양한 요구와 시나리오를 지원한다는 것입니다. 보다 일반적인 상황은 콘텐츠 제작, 친구와의 게임, 가족 또는 친구와의 채팅, 몰입형 롤플레잉 환경 조성 또는 사용자가 주로 소음 제거 및 오디오 향상 도구를 사용하는 업무 및 비즈니스를 위한 것입니다.

형제자매와 함께 스타트업을 시작하는 것의 어려움과 이점에 대해 이야기해 주시겠습니까?

솔직히 저는 그렇게 하고 싶습니다. 물론 모든 사람이 어떤 면에서 어려움에 직면한다는 것을 알고 있지만 실제로 우리의 경우에는 많은 것을 기억할 수 없습니다. 그 이유는 우리가 매우 대가족 출신이기 때문입니다. 어린 시절 프로젝트부터 음악 연주와 창작에 이르기까지 우리는 항상 무언가를 함께 하고 있었습니다. 같이 일하게 된 건 당연했다. 언급했듯이 저와 함께 Voicemod를 공동 창립한 제 형제인 Fernando와 Juan은 이미 여러 회사를 함께 운영하고 있었기 때문에 관련 경험이 많았습니다. 나는 2010년에 그들의 회사인 2taptap에 다시 합류했기 때문에 그것에 대한 느낌도 받았습니다. 이것은 우리가 Voicemod를 만들 때 우리가 달성하고자 하는 것과 더 중요하게는 그것을 달성하고자 하는 방법에 완전히 일치했다는 것을 의미합니다. 따라서 그것은 우리의 성공의 진정한 열쇠였던 Voicemod에 일치된 가치의 매우 강력한 문화를 가져오는 데 정말 도움이 되었습니다.

Voicemod에 대해 공유하고 싶은 다른 사항이 있습니까?

무대 뒤에서 많은 일이 벌어지고 있지만, 사람, 우리는 현재 기술을 훨씬 더 쉽게 접근할 수 있도록 하기 위해 노력하고 있습니다. 모든 개발자가 제품에 당사 기술을 사용할 수 있는 방법

우리는 사람들이 깨어 있는 시간의 대부분을 온라인에서 보내고 다양한 플랫폼과 애플리케이션에서 자신을 표현한다는 것을 알고 있습니다. 온라인 환경에서 귀하의 '아바타'는 귀하의 전체 자기 표현입니다. 그리고 정말로, 목소리가 없는 그 사람은 누구인가?

실시간 음성 변경 기술을 구축하고 완벽하게 사용자 정의할 수 있는 음향 표현 시스템을 개발하는 것은 많은 작업입니다. 우리 팀은 개발자가 어디에서나 쉽게 통합할 수 있는 전체 키트를 설계하여 공식에서 한 걸음 더 나아갔습니다. 우리는 소셜 오디오 경험의 미래를 계속해서 구축하면서 전 세계의 개발자와 사용자가 우리의 기술에 접근할 수 있게 되어 매우 기쁩니다!

훌륭한 인터뷰 감사합니다. 자세한 내용을 알고 싶은 독자는 방문하세요. 보이스 모드.