saplama Jaime Bosch, CEO, Voicemod - Röportaj Serisi - Unite.AI
Bizimle iletişime geçin

Röportajlar

Jaime Bosch, CEO, Voicemod – Röportaj Serisi

mm

Yayınlanan

 on

Jaime Bosch CEO'su Sesli mesaj oyuncular, içerik oluşturucular ve vtuber'lar için ücretsiz bir ses değiştirme yazılımı.

Voicemod'un yaratılış hikayesini bizimle paylaşır mısınız?

8 çocuğun 10'i olarak, çok küçük yaşlardan itibaren girişimci ruhumu tam olarak ortaya çıkarabileceğim bir ortamda büyüdüm, çünkü benzer düşünen kardeşlerin her zaman desteği vardı.

Bu nedenle, teknoloji ve müziğe karşı derin bir sevgiyi paylaşan iki erkek kardeşim ve benim, ilgi alanlarımızı harmanlayan bir uygulama oluşturma fikriyle oynamamız an meselesiydi. Böylece 2009'da tam da bunu yaptık ve ana mesleğimiz olarak yürüttüğümüz stüdyo işine ek olarak bir B2C müzik uygulaması oluşturduk.

Bu bir yan proje olduğundan, Ses modülasyonu gibi şeylerle çok şey denedik, bu da bize tamamen yeni ve alışılmışın dışında bir şey yaratma konusunda ilham verdi. Bunun sonucu, uygulamanın gelişiminin itici gücü haline gelen, kendi sesinizi deneyimlemenin tamamen yeni bir yolu olan “Voicemod Deneyimi” adını verdiğimiz şey oldu. Yazılımımızı kim denemiş olursa olsun, uygulamayı deneyimleyen insanlardan aynı tür tepkilerle karşılaşmaya devam ettik: kahkahalar ve kendinizi tamamen farklı bir şekilde duymanın şaşkınlığı.

Bu, ürünle ilgili vizyonumuzu yeniden şekillendirmemize, nihayetinde insan bağlantısını ses aracılığıyla geliştirebilecek bir şeye yönlendirmemize yol açtı. Bu nedenle, deneyimi mobilden PC'ye taşıdık ve burada patlayan oyun ve akış sahnesi tarafından anında yakalandı - ve gerisi, birinin dediği gibi, "tarih".

Voicemod başlangıçta bir yan projeydi - her şeyi bir arada yapmak istediğinizi ne zaman anladınız?

Başlangıçta kardeşlerimle birlikte 2taptap adında bir stüdyomuz vardı. Voicemod'u yaratma fikrini bulduğumuzda, başlangıçta sadece eğlenceli bir yan projeydi, ancak zaman geçtikçe insanların onunla nasıl etkileşime girdiğini ve teknolojinin sahip olduğu türden potansiyeli gördük. O noktaya kadar, Ses değiştirme teknolojisinin çoğu eşzamansızdı, bu nedenle gerçek zamanlı bir ortamda başka biri olmayı deneyimleyebilmek birçok insan için yeniydi. Ancak bizim için belirleyici an, insanların teknolojimizi yalnızca eğlenmek için değil, aynı zamanda kendilerini çevrimiçi ifade etme biçimlerinin tamamını şekillendirmek için kullandıklarının farkına varmamızdı. Bu, sadece eğlence ile ilgili olmayan, muhtemelen sosyal ses deneyimlerinin geleceğinde bir sonraki adım olan bir şey inşa ettiğimizi fark ettiğimiz zamandı.

Ses tanıma teknolojilerinden bazılarını tartışabilir misiniz?

Kataloğumuzdaki ses değiştirici çeşitleri ile normal bir insan sesini alıp yeni bir şeye dönüştürmek için uygulanan işlemler vardır. Tabii ki, kişinin sesinde yaş, cinsiyet, duygu ve konuşma tarzındaki basit farklılıklar gibi hesaba katılması gereken yönler de vardır.

Bu varyasyonlar, birinin nasıl ses çıkarabileceğine katkıda bulunur ve uygulanan değişiklikleri etkiler. Ses dönüştürmeyi ve dönüştürmeyi olabildiğince doğru bir şekilde kolaylaştırmak için en son teknoloji ses tanıma teknolojisinin unsurlarından yararlanıyoruz ve bu süreci sürekli olarak geliştiriyoruz. İnsanlara nasıl algılandıklarını yapılandırma, duyulmak istedikleri gibi ses çıkarma ve izleyicilerine harika bir dinleme deneyimi yaşatma fırsatı vermek istiyoruz.

İnsanların kendilerini sesle ifade etmelerine yardımcı olmak neden önemlidir?

Doğduğumuz andan ve bir bebeğin ilk çığlığından itibaren ses, kendimizi ifade etmeyi öğrendiğimiz doğal yoldur. Yaşlandıkça, sesi dile dönüştürmeyi ve konuştuğumuz kelimelere duygu ve nüans katmak için sesimizi kullanmayı öğrendikçe, sesli iletişimin önemi artmaya devam ediyor. Sesimizin perdesini yükselterek, heyecanımızı işaret edebiliriz veya yapmak istediğimiz noktalara özel bir vurgu yapmak için iç çekme veya inleme gibi ses efektleri kullanabiliriz.

Gerçekten yetenekli bazı insanlar için ses, sınırsız miktarda ses efekti veya ses yaratabildikleri için sınırsız ifade aracıdır. Ancak çoğumuz o kadar şanslı değiliz ve aslında seslerimizden rahatsızlık duyuyoruz (özellikle de kaydedildiğini duyduğumuzda). Kullanıcılarımızdan bazıları, yabancıların önünde konuşurken gergin hissettiklerinden bahsediyor ve kendilerini istedikleri şekilde düzgün bir şekilde ifade edemedikleri için hüsrana uğruyorlar.

İnsanlara yardım etmek için büyük bir fırsat gördüğümüz yer burasıdır. Ses kimliklerimizle, kullanıcılar seslerini rahat hissettikleri bir şey olacak şekilde şekillendirebilir veya hatta belirli durumlar için farklı seslere geçebilirler. Ayrıca, grafik emojilerin metin iletişimini şekillendirmeye nasıl yardımcı olduğuna benzer şekilde, ambiyans yaratmak, bağlamı iletmek veya komik efektler uygulamak için ses efektleri, müzik klipleri veya sesli emojiler kullanmalarını sağlamak istiyoruz.

Voicemod'u ses yoluyla gelişen insan bağlantısı olarak tanımladınız, bunu biraz açabilir misiniz?

Konuşanı özgürleştirmenin ve insanların konuşmasını engelleyen belirli bir zihinsel engeli ortadan kaldırmanın yanı sıra, bu bağlantıyı derinleştirmek için de çalışıyoruz. Örneğin ses yansıtıcımız iletişimi alır ve bir sonraki seviyeye yükseltir — bunu bir "ses emojisi" olarak düşünün. 35 yaşın altındaki insanların emoji kullanmadan sohbet ettiğini hayal edebiliyor musunuz? Bu teknoloji, sanki asırlardır varmış gibi hissettiren bir süredir var olsa da, aslında ancak yaklaşık 2010'dan beri iletişimimizin derinlerine yerleşmiş durumda. Mesajlaşma platformlarındaki çıkartmalarda, sesli mesajların ve sesli notların yükselişinde ve şimdi ortaya çıkan kullanımda benzer bir trend gördük. GIF'ler ve Giphy. Dünya çapında sesli iletişimin ölçeklenmesiyle, sesi nasıl kullandığımızın önemi artıyor. Arkadaşınızın şakasına sesli bir tepki göndermek, yalnızca bir cümle yazmaktan çok ham, dürüst tepkiniz hakkında çok daha fazlasını söyleyebilir. Cırcır böceklerinin sesini duymak ile cırcır böceklerinin sesini duymak arasındaki farkı hayal edin. ba dum TSS! Hepsi, sadece bir tıklamayla kolayca iletişim kurabileceğiniz çok farklı anlamlar ve duygular taşır.

Kullanıcıların arkadaşları, aileleri veya yabancılarla daha ilgi çekici sesli sohbetler yapmak için sesleri, ses efektlerini ve sesli emojileri kullanmasını mümkün olduğunca kolaylaştırmak istiyoruz.

Voicemod uygulamasının arkasında, kullanıcıların daha iyi ses çıkarmasına ve seslerini gerçek seslerine göre özelleştirmesine olanak tanıyan makine öğrenimi teknolojilerinden bazıları nelerdir?

Makine öğrenimi, yeni Voicemod özelliklerinin çoğunun merkezinde yer alır.

Yaratıcı tarafla ilgili olarak, Voicemod'un Voicelab'i, kullanıcıların her biri için kişisel sesler yaratarak kendi sonik kimliklerini seçmelerine olanak tanıyan, piyasadaki ilk gerçek zamanlı ses dönüştürme teknolojisini yarattı.

Yakında piyasaya sürülecek yeni, ileri teknolojimizle, kullanıcıların gizliliğini ve güvenliğini korumaya yardımcı olurken aynı zamanda sesle arzu ettikleri kişiliği yaratmalarına olanak tanıyan benzersiz özelliklere sahip daha önce hiç duyulmamış sesler oluşturuyoruz.

Son yıllarda veriye dayalı derin öğrenme metodolojilerinin ortaya çıktığını da gözlemledik. Bunlar, fonoloji, içerik, kimlik, niyet ve ruh hali gibi sesin algısal özelliklerine ilişkin konuşma sinyalleri içindeki soyut gizli yapıları öğrenmemizi sağlar. Bu teknolojilerden yararlanarak, sinyalin algısal yönlerini kontrol edebilir ve değiştirebiliriz. Bu, kullanıcılara algılanan ses kimlikleri üzerinde daha önce mümkün olmayan bir şekilde daha fazla kontrol sağlayan teknolojiler tasarlamamıza olanak tanır.

Voicemod uygulamasının bazı kullanım durumları nelerdir?

Voicemod ile ilgili harika olan şey, araçlarının çok çeşitli ihtiyaçlara ve senaryolara hizmet etmesidir. daha yaygın durumlar, içerik oluşturma, arkadaşlarla oyun oynama, aile veya arkadaşlarla sohbet etme, sürükleyici rol oynama ortamları oluşturma ve hatta kullanıcıların çoğunlukla gürültü önleme ve ses geliştirme araçlarımızı kullandığı iş ve iş için olabilir.

Kardeşlerle bir girişim başlatmanın bazı zorluklarını ve faydalarını tartışabilir misiniz?

Dürüst olmak gerekirse, çok isterdim ve elbette herkesin bazı açılardan zorluklarla karşılaştığını biliyorum, ama aslında bizim durumumuzda pek çoğunu hatırlayamıyorum. Nedeni ise çok büyük bir aileden gelmemiz. Çocukluk projelerinden müzik çalmaya ve yaratmaya kadar her zaman birlikte bir şeyler yapıyorduk. Sonunda birlikte çalışmamız doğaldı. Bahsettiğim gibi Voicemod'u benimle birlikte kuran kardeşlerim Fernando ve Juan'ın zaten birlikte birkaç şirketi vardı, dolayısıyla bu konuda çok fazla deneyimleri vardı. Onlara 2010 yılında 2taptap olan şirketlerinde katıldım, bu yüzden ben de hissettim. Bu, Voicemod'u oluşturduğumuzda, neyi başarmak istediğimiz ve daha da önemlisi bunu nasıl başarmak istediğimiz konusunda tamamen uyumlu hale geldiğimiz anlamına gelir. Bu nedenle, başarımızın gerçek anahtarı olan Voicemod'a çok güçlü bir uyumlu değerler kültürü getirmeye gerçekten yardımcı oldu.

Voicemod ile ilgili paylaşmak istediğiniz başka bir şey var mı?

Perde arkasında çok şey oluyor, ancak bizim için sesi geliştirmek istememiz doğrultusunda herkes, şu anda teknolojimizi daha da erişilebilir hale getirmek için bir şey üzerinde çalışıyoruz. Herhangi bir geliştiricinin teknolojimizi ürünlerinde kullanmasının bir yolu

İnsanların uyanık oldukları zamanın çoğunu çevrimiçi, fişe takılı ve çeşitli platform ve uygulamalarda kendilerini ifade ederek geçirdiklerini biliyoruz. Çevrimiçi ortamlarda, 'avatarınız' tüm benliğinizin temsilidir. Ve gerçekten, o sesi olmayan kişi kim?

Gerçek zamanlı ses değiştirme teknolojisi oluşturmak ve tamamen özelleştirilebilir ses ifadelerinden oluşan bir sistem geliştirmek çok iş gerektirir. Ekibimiz, geliştiriciler tarafından herhangi bir yere kolayca entegre edilebilecek eksiksiz bir kit tasarlayarak denklemden bu adımı attı. Sosyal ses deneyimlerinin geleceğini inşa etmeye devam ederken, teknolojimizi tüm dünyadaki geliştiriciler ve kullanıcılar için erişilebilir kılmaktan büyük heyecan duyuyoruz!

Harika röportaj için teşekkürler, daha fazla bilgi edinmek isteyen okuyucular ziyaret etmelidir. Sesli mesaj

Unite.AI'nin kurucu ortağı ve Forbes Teknoloji Konseyi, Antoine bir fütürist Yapay zeka ve robot biliminin geleceği konusunda tutkulu olan.

Aynı zamanda Kurucusu menkul kıymetler.io, çığır açan teknolojilere yatırım yapmaya odaklanan bir web sitesi.