Röportajlar
Johan Wadenholt Vrethem, Voxo’nun CEO’su ile Röportaj Serisi

Johan Wadenholt Vrethem, teknoloji ve işin kesişme noktasında iki thập kỷdan fazla deneyim getiriyor ve organizasyonların nasıl çalıştığını ve müşterileriyle nasıl etkileşim kurduğunu değiştirmek için AI’yi kullanmaya odaklanıyor. CGI’de bankacılık ve finans sektörlerinde büyük dijital girişimlerin ve müşteri programlarının liderliğini yaptı, ardından Voxo’yu kurarak konuşma analitiği ve etkinlik teknolojisi alanındaki yenilikleri teşvik etti.
Voxo AI’da Johan, gerçek zamanlı, AI destekli zekayı canlı tartışmalardan ve etkinliklerden teslim ediyor ve ekiplere veri ile hız ve doğrulukla hareket etmelerini sağlıyor. Hem ticari etki hem de sosyal iyilik için taahhüt edilen, ayrıca online çocuk istismarını önleme amaçlı CSR girişimlerini de yönetti.
Voxo AI, konferanslardan, panellerden ve oturumlardan canlı konuşmaları yapay zeka kullanarak yakalayan ve yapılandırılmış, kullanılabilir bilgiler haline dönüştüren bir etkinlik zekası platformudur. Gerçek zamanlı ses analizi yaparak anlık özetler, ana noktalar ve etkinlik sonrası içerik gibi raporlar ve markalı varlıklar oluşturur, böylece organizatörler, katılımcılar, sponsorlar ve konuşmacılar el yazısı olmadan veya takip çalışması olmadan tartışmalardan kalıcı değer elde edebilirler.
Voxo’yu kurmadan önce, CGI’de bankacılık ve finans hizmetlerinde karmaşık dijital ve AI destekli girişimlerin liderliğini yaptınız. O deneyimden hangi spesifik frustrasyonlar veya boşluklar, kendi şirketinizi konuşma zekasına odaklanmanız için size ilham verdi?
CGI’deki zamanım gerçekten şekillendiriciydi. Büyük bir organizasyon, yüzlerce IP varlığı ve danışmanlık hizmeti sunuyor ve büyük ölçekli teslimat ortamları, yönetim ve kurumsal dönüşüm hakkında ön sıradaki bir koltuk elde ettim. Aynı zamanda parçalı, birçok teknoloji, paydaş ve rekabetçi önceliklere dağılmıştı.
İşletme Analistinden Direktöre sadece iki yılda geçtim ve o noktada odaklanmaya hazır hissettim. Kurucu ortaklarımla tanıştığımda, en iyi teknolojiyi kullanarak çok spesifik, yüksek değerli bir problemi çözebileceğimiz konusunda anlaştık.很多 insan bilmediği gibi, finansal danışmanlık belgelerine odaklanan bir fintech şirketi olarak başladık. Oradan konuşma analitiğine ve nihayetinde yaklaşık bir decade öğrenerek insan konuşmasından gerçek anlam çıkarmayı öğrenerek etkinlik zekasına geçtik.
İlk başlarda, gerçek konuşmaları kontrol edilen, senaryolu girdilerden ziyade güvenilir bir şekilde anlamak için AI oluştururken en zor teknik veya ticari zorluklar nelerdi?
İlk fintech ürünlerimizde teknoloji, hırsımızı sınırladı. Otomatik konuşma tanıma, ilk odaklandığımız İskandinav dilleri için, kelime hata oranları %70-80 aralığında idi. Bu seviyede, insan belgelerini değiştirebilecek bir ürün oluşturamazsınız.
Aynı zamanda, modern büyük dil modeli yetenekleri henüz mevcut değildi, bu nedenle güvenilir özetler üretmek neredeyse imkansızdı. Daha sonra etkinlik hizmetimizi başlattığımızda, manzara değişmişti. Yıllarca süren derin bilgi birikimine sahiptik ve finally doğru AI yapı taşlarına sahiptik, ana konuşmaları, tartışmaları ve yuvarlak masa toplantılarını ölçeklenebilir bir şekilde anlamak için.
Voxo, konuşma analitiği ile başladı ve daha sonra büyük ölçekli etkinlik zekasına genişledi. Canlı etkinliklerin konuşma AI’sinin bir sonraki büyük cephesi olduğuna dair size hangi sinyaller vardı?
İlginç bir şekilde, ilk olarak C düzeyindeki yöneticilere daha hızlı ulaşmak ve konuşma zekasının ne kadar güçlü olabileceğini göstermek için etkinliklerle çalışmaya başladık. Ancak İsveç’in en büyük teknoloji etkinliği olan Techarenan’da, 10.000’den fazla katılımcı ile birlikte çalıştığımızda, büyük bir değişim gördük.
Gelen talep anında ve çok nettı. İnsanlar sadece etkilenmedi, etkinlik hizmetini bir ürün olarak satın almak istediler. Bu, sinyaldi. Zamanı, odaklanmayı ve kaynakları teslim etmek için gerekli yatırımı yapmaya karar verdik ve bunu en yüksek kaliteli seviyede yapmak istedik.
Sistem perspektifinden bakıldığında, tek bir toplantının transkriptini oluşturmaktan, çok günlük bir etkinlikte yüzlerce eş zamanlı oturumu işleme nasıl geçersiniz?
Karmaşıklık hızlı bir şekilde artar. Sadece her bir oturumun stabilitesini ve kalitesini korumakla kalmazsınız, aynı zamanda gerçek dünya kaosuyla da başa çıkmanız gerekir. Son dakika program değişiklikleri, konuşmacı değişiklikleri ve program güncellemeleri büyük etkinliklerde normaldir.
Etkinlik ekiplerine ek yük bindirmemek için katı ve esnek süreçlere ihtiyacınız vardır. Ayrıca analiz için kanıtlanmış bir metodolojiye ihtiyacınız vardır. Yüzlerce saatlik sesi bir modele atıp ilginç bir rapor isteyemezsiniz. Yüksek kaliteli çıktılar üretmek için birden fazla modeli, boru hatlarını ve yapıların katmanlarını birleştirmeniz gerekir.
Çok sayıda AI aracı, her şeyin üzerinde otomasyonu vurguluyor. Voxo platformunun çekirdeği olarak insan-çevrimiçi incelemeyi neden dahil ettiniz?
Guven, özellikle HubSpot, GitHub ve Intuit gibi kurumsal müşteriler için hala en büyük engel. Yanlış bir şey yayınlama korkusu çok gerçek. Bu nedenle, stable süreçler, AI incelemesi ve insan kalite güvencesi kombinasyonu, birçok müşterimiz için hala bir gereksinimdir.
Müşterilere kontrol sağlıyoruz. Özetleri dağıtmadan önce inceleyip onaylayabilirler ve bu iş akışını verimli hale getiriyoruz. Teknoloji ve güvenceler olgunlaştıkça, insan incelemesine duyulan ihtiyacın azalacağına inanıyorum. O zamana kadar, hiçbir şey, markalarını temsil eden içerikle güven kazanmaktan daha önemli değildir.
Gerçek zamanlı transkript ve özetleme, etkinlik ekiplerinin içerik zaman çizelgesi ve etkinlik sonrası değer hakkında düşünme şeklini nasıl değiştirdi?
Temel olarak zaman çizelgesini sıfırlar. İçerik, haftalar sonra yayımlanacak bir şey olmaktan, etkinlik sırasında ve her oturumun sonunda kullanılabilecek bir şey haline gelir.
Gördüğümüz şey, müşterilerin anında materyal elde etmesi ve bu materyalin aylarca süren etkileşimi canlı tutmasıdır. Katılımcılar ve konuşmacılar da, içerik kolay ve hoş görünüyorsa, bir oturumun hemen ardından paylaşmaya daha eğilimlidir. Aynı içerik bir ay sonra gelirse, genellikle anlamlı bir dağıtım için çok geç olur, özellikle sosyal medyada. Gerçek zamanlı, içeriği canlı deneyimlerin bir uzantısı haline getirir, sadece bir etkinlik sonrası arşivi değil.
Etkinlikler, organizatörler, konuşmacılar, sponsorlar ve katılımcılar gibi çok sayıda paydaşı içerir. Voxo, tümünü hizmet eden çıktılar tasarımı nasıl yapar?
Paydaşlardan başlayarak, ancak aynı temel gerçekliği koruyoruz. Herkes, yakalanan içeriğin aynı kaynağından yararlanıyor, ardından çıktıları paydaşın hedeflerine göre uyarlıyoruz.
Katılımcılar, anlık ve paylaşılan oturum özetleri ve kaçırdıkları oturumlara yeniden erişme yeteneği elde ediyor. Pazarlama ekipleri, dağıtım için tasarlanmış ve ölçülebilir etkiye sahip sponsor markalı varlıklar elde ediyor. Organizatörler, daha yüksek katılımcı değeri, daha uzun süreli etkinlik momentumu ve yeni gelir seçenekleri elde ediyor. Konuşmacılar, bir tıkla yayınlanabilen bir özet elde ediyor ve organizatörler bu ağ etkisinden yararlanıyor.
Anahtar, kaliteyi sulandırmıyor olmamızdır. Bir tane güçlü içerik motoru oluşturuyoruz, ardından her paydaş için gerçek değer yaratmak için farklı şekilde paketliyoruz.
Voxo kullanan etkinlikler, daha hızlı içerik teslimi ve daha yüksek sponsor katılımı rapor ediyor. Bu etkiyi elde etmede, hız, yapı veya içerik kalitesi hangi faktörün daha önemli olduğunu düşünüyorsunuz?
Bunun bir kombinasyonu. Hız, içerik yapısı ve kalitesi olmadan önemli değil. Aynı zamanda, en iyi içeriğin bile çok geç gelmesi durumunda değeri azalır.
Gerçek avantaj, hepsini bir arada teslim etmektir. Yüksek kaliteli bilgiler, net bir yapıda, hala ilgili hissedebileceğiniz hızda teslim edilir. Bu, içeriğin faydalı, paylaşılan ve ticari olarak etkili olmasını sağlar.
AI destekli içerik platformları için “gerçek zamanlı” kavramı, önümüzdeki birkaç yıl içinde ne anlama geliyor ve bu gerçekliğe bugün ne kadar yakınız?
Bazı durumlarda, gerçek zamanlı zaten burada. Örneğin NHS ile Manchester’da birlikte First Sight Media ve Lineup Ninja ile gerçek zamanlı yorumlar teslim ettik. Ayrıca 2023’te Techarenan’da Al Gore ve Steve Wozniak gibi konuşmacılarla gerçek zamanlı deneyimler sunduk.
Ancak, gerçek zamanlı ve gần gerçek zamanlı arasında bir yer için hala alan var. Önemli olan, değer yaratmak için niyetli olmaktır. Bir konuşmacının arkasında gerçek zamanlı güncellenen bir kelime bulutu, yardımcı olmaktan çok dikkat dağıtıcı olabilir. Gerçek zamanlı, katılımcı deneyimini geliştirmelidir, onunla rekabet etmemelidir.
Son olarak, AI tarafından oluşturulan özetler veya transkriptler hakkında kurumsal müşterilerle konuştuğunuzda düzenli olarak düzeltmeniz gereken bir ortak yanlış anlama var mı?
En büyük yanlış anlama, güvenilir, tutarlı, yüksek kaliteli özetleri elde etmek için bir ses dosyasını transkribe edip ChatGPT’ye yapıştırmanın yeterli olmasıdır. İnsanlar ayrıca, bu işlemin zaman alıcı ve tutarlı olması gerektiğini, özellikle birçok oturum olduğunda nhanh chóng anlarlar. Ve hatta o zaman, transkript ve özetleme, teslim ettiğimiz şeyin sadece küçük bir kısmıdır. Bu, belki %5’i kadardır. Gerçek iş, hız, yapı, bağlam, marka hazır paketleme, kalite güvencesi ve dağıtım formatlarıdır ve bu, içeriği kurumsal ölçekte kullanılabilir ve değerli hale getirir.
Harika röportaj için teşekkür ederiz, daha fazla bilgi öğrenmek isteyen okuyucular Voxo AI‘yi ziyaret edebilir.












