Bizimle iletişime geçin

Röportajlar

Jaime Bosch, CEO, Voicemod – Röportaj Serisi

mm

Jaime Bosch CEO'su Sesli mesaj oyuncular, içerik oluşturucular ve vtuber'lar için ücretsiz bir ses değiştirme yazılımı.

Voicemod'un yaratılış hikayesini bizimle paylaşır mısınız?

8 çocuğun 10'i olarak, çok küçük yaşlardan itibaren girişimci ruhumu tam olarak ortaya çıkarabileceğim bir ortamda büyüdüm, çünkü benzer düşünen kardeşlerin her zaman desteği vardı.

Bu nedenle, teknoloji ve müziğe karşı derin bir sevgiyi paylaşan iki erkek kardeşim ve benim, ilgi alanlarımızı harmanlayan bir uygulama oluşturma fikriyle oynamamız an meselesiydi. Böylece 2009'da tam da bunu yaptık ve ana mesleğimiz olarak yürüttüğümüz stüdyo işine ek olarak bir B2C müzik uygulaması oluşturduk.

Yan bir proje olduğu için, Ses modülasyonu gibi birçok şey denedik ve bu da bizi tamamen yeni ve özgün bir şey yaratmaya teşvik etti. Bunun sonucu, kendi sesinizi deneyimlemenin tamamen yeni bir yolu olan "Voicemod Deneyimi" adını verdiğimiz şey oldu ve bu, uygulamanın evriminin itici gücü haline geldi. Yazılımımızı kim denerse denesin, uygulamayı deneyimleyenlerden hep aynı tepkileri aldık: kahkaha ve kendinizi tamamen farklı bir şekilde duymanın verdiği şaşkınlık.

Bu, ürünle ilgili vizyonumuzu yeniden şekillendirmemize, nihayetinde insan bağlantısını ses aracılığıyla geliştirebilecek bir şeye yönlendirmemize yol açtı. Bu nedenle, deneyimi mobilden PC'ye taşıdık ve burada patlayan oyun ve akış sahnesi tarafından anında yakalandı - ve gerisi, birinin dediği gibi, "tarih".

Voicemod başlangıçta bir yan projeydi - her şeyi bir arada yapmak istediğinizi ne zaman anladınız?

Başlangıçta kardeşlerimle birlikte 2taptap adında bir stüdyomuz vardı. Voicemod'u yaratma fikri ortaya çıktığında, başlangıçta sadece eğlenceli bir yan projeydi, ancak zamanla insanların onunla nasıl etkileşim kurduğunu ve teknolojinin sahip olduğu potansiyeli gördük. O zamana kadar, çoğu Voice değiştiren teknoloji eşzamansızdı, bu nedenle gerçek zamanlı bir ortamda başka biri olmayı deneyimlemek birçok kişi için yeni bir şeydi. Ancak bizim için belirleyici an, insanların teknolojimizi sadece eğlenmek için değil, aynı zamanda çevrimiçi olarak kendilerini ifade etme biçimlerini şekillendirmek için kullandıklarını fark etmemizdi. İşte o zaman, sadece eğlenceyle ilgili olmayan, aynı zamanda sosyal ses deneyimlerinin geleceğinde bir sonraki adım olabilecek bir şey inşa ettiğimizi fark ettik.

Ses tanıma teknolojilerinden bazılarını tartışabilir misiniz?

Kataloğumuzdaki ses değiştiricilerin çeşitliliği sayesinde, sıradan bir insan sesini alıp yeni bir şeye dönüştürmek için uygulanan işlemler mevcuttur. Elbette, kişinin sesinde yaş, cinsiyet, duygu ve konuşma tarzındaki basit farklılıklar gibi dikkate alınması gereken unsurlar da vardır.

Bu varyasyonlar, birinin nasıl ses çıkarabileceğine katkıda bulunur ve uygulanan değişiklikleri etkiler. Ses dönüştürmeyi ve dönüştürmeyi olabildiğince doğru bir şekilde kolaylaştırmak için en son teknoloji ses tanıma teknolojisinin unsurlarından yararlanıyoruz ve bu süreci sürekli olarak geliştiriyoruz. İnsanlara nasıl algılandıklarını yapılandırma, duyulmak istedikleri gibi ses çıkarma ve izleyicilerine harika bir dinleme deneyimi yaşatma fırsatı vermek istiyoruz.

İnsanların kendilerini sesle ifade etmelerine yardımcı olmak neden önemlidir?

Doğduğumuz andan ve bir bebeğin ilk çığlığından itibaren ses, kendimizi ifade etmeyi öğrendiğimiz doğal yoldur. Yaşlandıkça, sesi dile dönüştürmeyi ve konuştuğumuz kelimelere duygu ve nüans katmak için sesimizi kullanmayı öğrendikçe, sesli iletişimin önemi artmaya devam ediyor. Sesimizin perdesini yükselterek, heyecanımızı işaret edebiliriz veya yapmak istediğimiz noktalara özel bir vurgu yapmak için iç çekme veya inleme gibi ses efektleri kullanabiliriz.

Gerçekten yetenekli bazı insanlar için ses, sınırsız miktarda ses efekti veya ses yaratabildikleri için sınırsız ifade aracıdır. Ancak çoğumuz o kadar şanslı değiliz ve aslında seslerimizden rahatsızlık duyuyoruz (özellikle de kaydedildiğini duyduğumuzda). Kullanıcılarımızdan bazıları, yabancıların önünde konuşurken gergin hissettiklerinden bahsediyor ve kendilerini istedikleri şekilde düzgün bir şekilde ifade edemedikleri için hüsrana uğruyorlar.

İnsanlara yardım etmek için büyük bir fırsat gördüğümüz yer burasıdır. Ses kimliklerimizle, kullanıcılar seslerini rahat hissettikleri bir şey olacak şekilde şekillendirebilir veya hatta belirli durumlar için farklı seslere geçebilirler. Ayrıca, grafik emojilerin metin iletişimini şekillendirmeye nasıl yardımcı olduğuna benzer şekilde, ambiyans yaratmak, bağlamı iletmek veya komik efektler uygulamak için ses efektleri, müzik klipleri veya sesli emojiler kullanmalarını sağlamak istiyoruz.

Voicemod'u ses yoluyla gelişen insan bağlantısı olarak tanımladınız, bunu biraz açabilir misiniz?

Konuşmacıyı özgürleştirmenin ve insanların konuşmasını engelleyen belirli bir zihinsel engeli kaldırmanın yanı sıra, bu bağlantıyı daha da derinleştirmek için de çalışıyoruz. Örneğin, ses tahtamız iletişimi bir üst seviyeye taşıyor; bunu bir "ses emojisi" olarak düşünün. 35 yaşın altındaki insanların emoji kullanmadan sohbet ettiğini hayal edebiliyor musunuz? Bu teknoloji sanki asırlar önce varmış gibi hissettirse de, iletişimimize ancak 2010'dan beri derinlemesine yerleşti. Mesajlaşma platformlarındaki çıkartmalarda, sesli mesajlaşmanın ve sesli notların yükselişinde ve şimdi de GIF'lerin ve Giphy'nin artan kullanımında benzer bir eğilim gördük. Dünya çapında sesli iletişimin ölçeklenmesiyle, sesi nasıl kullandığımızın önemi artıyor. Arkadaşınızın şakasına sesli bir tepki göndermek, sadece bir cümle yazmaktan çok daha fazlasını, ham ve dürüst tepkiniz hakkında anlatabilir. Cırcır böceklerinin sesini duymakla... ba dum TSS! Hepsi, sadece bir tıklamayla kolayca iletişim kurabileceğiniz çok farklı anlamlar ve duygular taşır.

Kullanıcıların arkadaşları, aileleri veya yabancılarla daha ilgi çekici sesli sohbetler yapmak için sesleri, ses efektlerini ve sesli emojileri kullanmasını mümkün olduğunca kolaylaştırmak istiyoruz.

Voicemod uygulamasının arkasında, kullanıcıların daha iyi ses çıkarmasına ve seslerini gerçek seslerine göre özelleştirmesine olanak tanıyan makine öğrenimi teknolojilerinden bazıları nelerdir?

Makine öğrenimi, yeni Voicemod özelliklerinin çoğunun merkezinde yer alır.

Yaratıcı tarafa gelince, Voicemod'un Voicelab'ı, kullanıcıların kendi ses kimliklerini seçmelerine ve her biri için kişisel sesler oluşturmalarına olanak tanıyan piyasadaki ilk gerçek zamanlı ses dönüştürme teknolojisini yarattı.

Yakında piyasaya sunacağımız yeni, gelişmiş teknolojimizle, kullanıcıların gizliliğini ve güvenliğini korumaya yardımcı olacak, aynı zamanda ses yoluyla istedikleri kişiliği yaratmalarına olanak sağlayacak, daha önce hiç duyulmamış, benzersiz özelliklere sahip sesler yaratıyoruz.

Son yıllarda veri odaklı derin öğrenme metodolojilerinin de ortaya çıktığını gözlemledik. Bu metodolojiler, sesin fonolojisi, içerik, kimlik, niyet ve ruh hali gibi algısal özelliklerine ilişkin konuşma sinyallerindeki soyut gizli yapıları öğrenmemizi sağlıyor. Bu teknolojilerden yararlanarak, sinyalin algısal yönlerini kontrol edebiliyor ve değiştirebiliyoruz. Bu da, kullanıcılara algılanan ses kimlikleri üzerinde daha önce mümkün olmayan bir şekilde daha fazla kontrol sağlayan teknolojiler tasarlamamızı sağlıyor.

Voicemod uygulamasının bazı kullanım durumları nelerdir?

Voicemod ile ilgili harika olan şey, araçlarının çok çeşitli ihtiyaçlara ve senaryolara hizmet etmesidir. daha yaygın durumlar, içerik oluşturma, arkadaşlarla oyun oynama, aile veya arkadaşlarla sohbet etme, sürükleyici rol oynama ortamları oluşturma ve hatta kullanıcıların çoğunlukla gürültü önleme ve ses geliştirme araçlarımızı kullandığı iş ve iş için olabilir.

Kardeşlerle bir girişim başlatmanın bazı zorluklarını ve faydalarını tartışabilir misiniz?

Dürüst olmak gerekirse bunu çok isterdim ve elbette herkesin bir şekilde zorluklarla karşılaştığını biliyorum, ancak bizim durumumuzda pek fazla zorluk hatırlayamıyorum. Sebebi, çok büyük bir aileden gelmemiz. Çocukluk projelerinden müzik yapmaya ve yaratmaya kadar her zaman birlikte bir şeyler yapıyorduk. Birlikte çalışmamız çok doğaldı. Kardeşlerim Fernando ve Juan - daha önce de bahsettiğim gibi benimle birlikte Voicemod'u kuran kişiler - zaten birkaç şirkette birlikteydiler, bu yüzden bu konuda oldukça deneyimlilerdi. 2010 yılında 2taptap adlı şirketlerine katıldım, böylece ben de bir şeyler hissettim. Bu, Voicemod'u kurarken neyi başarmak istediğimiz ve daha da önemlisi bunu nasıl başarmak istediğimiz konusunda tamamen uyumlu olduğumuz anlamına geliyor. Bu, Voicemod'a gerçekten güçlü bir uyumlu değerler kültürü getirmeye yardımcı oldu ve bu da başarımızın gerçek anahtarı oldu.

Voicemod ile ilgili paylaşmak istediğiniz başka bir şey var mı?

Sahne arkasında çok şey oluyor, ancak sesi geliştirmek istememizle uyumlu olarak herkesŞu anda teknolojimizi daha da erişilebilir hale getirmek için bir şeyler üzerinde çalışıyoruz. Herhangi bir geliştiricinin, teknolojimizi kendi ürünlerinde kullanabilmesi için bir yol.

İnsanların uyanık oldukları zamanın çoğunu internette, internete bağlı olarak, çeşitli platform ve uygulamalarda kendilerini ifade ederek geçirdiklerini biliyoruz. Çevrimiçi ortamlarda, "avatarınız" tüm benlik temsilinizdir. Peki, sesi olmayan o kişi kimdir?

Gerçek zamanlı ses değiştirme teknolojisi geliştirmek ve tamamen özelleştirilebilir bir ses ifadeleri sistemi geliştirmek çok fazla iş gerektiriyor. Ekibimiz, dünyanın her yerindeki geliştiricilerin kolayca entegre edebileceği eksiksiz bir kit tasarlayarak bu adımı denklemden çıkardı. Sosyal ses deneyimlerinin geleceğini inşa etmeye devam ederken, teknolojimizi dünyanın dört bir yanındaki geliştiriciler ve kullanıcılar için erişilebilir kılmaktan büyük heyecan duyuyoruz!

Harika röportaj için teşekkürler, daha fazla bilgi edinmek isteyen okuyucular ziyaret etmelidir. Sesli mesaj

Antoine, yapay zeka ve robotiğin geleceğini şekillendirme ve tanıtma konusunda sarsılmaz bir tutkuyla hareket eden vizyon sahibi bir lider ve Unite.AI'nin kurucu ortağıdır. Bir seri girişimci olan Antoine, yapay zekanın toplum için elektrik kadar yıkıcı olacağına inanır ve sıklıkla yıkıcı teknolojilerin ve AGI'nin potansiyeli hakkında övgüler yağdırırken yakalanır.

Olarak fütürist, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adamıştır. Ayrıca, kurucusudur menkul kıymetler.ioGeleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren son teknolojiye yatırım yapmaya odaklanan bir platform.