Connect with us

Wawancara

Johan Wadenholt Vrethem, CEO di Voxo – Seri Wawancara

mm

Johan Wadenholt Vrethem membawa lebih dari dua dekade pengalaman di persimpangan teknologi dan bisnis, dengan fokus pada pemanfaatan AI untuk mengubah cara organisasi beroperasi dan berinteraksi dengan pelanggan mereka. Ia memimpin inisiatif digital dan program klien besar di sektor perbankan dan keuangan di CGI, sebelum menjadi co-pendiri Voxo untuk mengemudi inovasi di bidang analitik percakapan dan teknologi acara.

Di Voxo AI, Johan memimpin pengiriman intelijen berbasis AI secara real-time dari diskusi langsung di acara dan konferensi, memungkinkan tim untuk bergerak dari data ke tindakan dengan kecepatan dan presisi. Berkomitmen pada dampak komersial dan kebaikan sosial, ia juga memimpin inisiatif CSR yang bertujuan mencegah eksploitasi anak secara online.

Voxo AI adalah platform intelijen acara yang menggunakan kecerdasan buatan untuk menangkap dan mengubah percakapan lisan langsung dari konferensi, panel, dan sesi menjadi wawasan yang terstruktur dan dapat digunakan. Dengan menganalisis audio secara real-time, ia menghasilkan ringkasan instan, poin penting, dan konten pasca-acara seperti laporan dan aset merek, memungkinkan penyelenggara, peserta, sponsor, dan pembicara untuk mengekstrak nilai yang langgeng dari diskusi tanpa perlu catatan manual atau pekerjaan tindak lanjut.

Sebelum mendirikan Voxo, Anda menghabiskan tahun-tahun memimpin inisiatif digital dan AI yang kompleks di perbankan dan jasa keuangan di CGI. Apa frustrasi atau celah spesifik dari pengalaman itu yang membuat Anda yakin untuk membangun perusahaan sendiri yang fokus pada kecerdasan percakapan?

Waktu saya di CGI sangat membentuk. Ini adalah organisasi besar dengan ratusan aset IP selain konsultasi, dan saya mendapatkan tempat duduk di lingkungan pengiriman yang kompleks, tata kelola, dan transformasi perusahaan skala besar.

Saya pindah dari Analis Bisnis ke Direktur dalam waktu dua tahun, dan pada titik itu saya merasa siap untuk fokus. Ketika saya bertemu dengan co-pendiri saya, itu terjadi bahwa kita bisa membangun sesuatu yang lebih tajam, satu trek yang menggunakan teknologi terbaik yang tersedia untuk memecahkan masalah spesifik yang sangat berharga. Apa yang banyak orang tidak tahu adalah bahwa kita memulai sebagai perusahaan fintech yang fokus pada dokumentasi di bidang konsultasi keuangan. Dari sana kita berkembang menjadi analitik percakapan, dan akhirnya memperluas ke intelijen acara setelah hampir satu dekade belajar bagaimana mengekstrak makna yang sebenarnya dari percakapan manusia.

Apa tantangan teknis atau komersial yang paling sulit di awal membangun AI yang dapat memahami percakapan nyata daripada input yang terkendali dan ter skrip?

Di produk fintech awal kita, teknologi membatasi ambisi. Pengenalan ucapan otomatis untuk bahasa Nordik, yang merupakan fokus awal kita, memiliki tingkat kesalahan kata sekitar 70 hingga 80 persen. Pada tingkat itu, Anda tidak bisa membangun produk yang menggantikan dokumentasi manusia.

Pada saat yang sama, kemampuan model bahasa besar modern belum ada saat itu, sehingga menghasilkan ringkasan yang dapat diandalkan hampir mustahil. Ketika kita kemudian meluncurkan layanan acara kita, lanskap telah berubah. Kita telah membangun pengetahuan yang mendalam selama bertahun-tahun, dan kita akhirnya memiliki blok bangunan AI yang tepat untuk memahami keynote, debat, dan sesi roundtable dengan cara yang dapat diskalakan.

Voxo memulai dengan analitik percakapan dan kemudian memperluas ke intelijen acara skala besar. Apa sinyal yang membuat Anda yakin bahwa acara langsung adalah frontier besar berikutnya untuk AI suara?

Menariknya, kita pertama kali bekerja dengan acara sebagai cara untuk mencapai eksekutif tingkat C lebih cepat dan menunjukkan seberapa kuat kecerdasan percakapan bisa menjadi. Tapi sekali kita mengirimkan di acara teknologi terbesar Swedia, Techarenan, dengan lebih dari 10.000 peserta, kita melihat pergeseran besar.

Permintaan masuk langsung dan sangat jelas. Orang tidak hanya terkesan, mereka ingin membeli layanan acara sebagai produk. Itu adalah sinyal. Kita memutuskan untuk menginvestasikan waktu, fokus, dan sumber daya yang diperlukan untuk mengirimkannya secara global, dan untuk melakukannya dengan kualitas tertinggi.

Dari perspektif sistem, apa yang secara mendasar berubah ketika Anda berpindah dari menyalin satu pertemuan ke pengolahan ratusan sesi bersamaan di seluruh acara multi-hari?

Keseluruhan kompleksitas berkompoun sangat cepat. Anda tidak hanya mempertahankan stabilitas dan kualitas di seluruh setiap sesi individu, Anda juga berhadapan dengan kekacauan dunia nyata. Perubahan jadwal terakhir, pertukaran pembicara, dan pembaruan program adalah hal biasa di acara besar.

Untuk mengirimkan tanpa memberikan beban ekstra pada tim acara yang sudah terjulur, Anda memerlukan proses yang ketat dan masih fleksibel. Anda juga memerlukan metodologi analisis yang terbukti. Anda tidak bisa hanya melemparkan ratusan jam audio ke dalam model dan meminta laporan yang menarik. Untuk menghasilkan output berkualitas tinggi dalam hitungan menit, Anda harus menggabungkan beberapa model, pipa, dan lapisan struktur.

Banyak alat AI menekankan otomatisasi di atas segalanya. Mengapa Anda memutuskan untuk memasukkan tinjauan manusia sebagai bagian inti dari platform Voxo?

Kepercayaan masih merupakan penghalang terbesar, terutama untuk pelanggan perusahaan seperti HubSpot, GitHub, dan Intuit. Ketakutan menerbitkan sesuatu yang tidak akurat sangat nyata. Itulah mengapa proses yang stabil, plus kombinasi tinjauan AI dan jaminan kualitas manusia, tetap menjadi persyaratan untuk banyak pelanggan hari ini.

Kita juga memberikan pelanggan kontrol. Mereka dapat meninjau dan menyetujui ringkasan sebelum apa pun didistribusikan, dan kita membuat alur kerja itu efisien. Dalam waktu, saya percaya kebutuhan akan tinjauan manusia akan berkurang seiring teknologi dan pengaman berkembang. Sampai saat itu, tidak ada yang lebih penting daripada mendapatkan hak untuk dipercaya dengan konten yang mewakili merek mereka.

Bagaimana transkripsi dan ringkasan hampir waktu nyata telah mengubah cara tim acara memikirkan garis waktu konten dan nilai pasca-acara?

Itu secara mendasar mereset garis waktu. Alih-alih konten menjadi sesuatu yang Anda terbitkan minggu kemudian, itu menjadi sesuatu yang dapat Anda gunakan saat acara masih berlangsung dan segera setelah setiap sesi berakhir.

Apa yang kita lihat adalah bahwa pelanggan tiba-tiba memiliki materi yang menjaga keterlibatan hidup selama berbulan-bulan. Peserta dan pembicara juga lebih mungkin untuk berbagi konten segera setelah sesi, selama itu mudah dan terlihat rapi. Jika konten yang sama tiba sebulan kemudian, itu biasanya terlambat untuk mengarahkan distribusi yang berarti, terutama di media sosial. Waktu nyata mengubah konten menjadi perpanjangan dari pengalaman langsung, bukan hanya arsip pasca-acara.

Acara melibatkan banyak pemangku kepentingan, penyelenggara, pembicara, sponsor, dan peserta. Bagaimana Voxo merancang output yang melayani semua mereka tanpa melemahkan wawasan atau kualitas?

Kita merancang dari pemangku kepentingan ke luar, tetapi kita tetap mempertahankan sumber kebenaran yang sama. Semua orang mendapat manfaat dari konten yang ditangkap yang sama, kemudian kita menyesuaikan output untuk mencocokkan tujuan pemangku kepentingan.

Peserta mendapatkan ringkasan sesi instan yang dapat dibagikan dan kemampuan untuk mengunjungi kembali sesi yang mereka lewatkan. Tim pemasaran mendapatkan aset merek sponsor yang dibangun untuk distribusi dan dampak yang dapat diukur. Penyelenggara mendapatkan nilai peserta yang lebih tinggi, momentum acara yang lebih lama, dan opsi pendapatan baru. Pembicara mendapatkan cara satu-klik untuk berbagi ringkasan yang rapi, dan penyelenggara mendapat manfaat dari efek jaringan itu.

Kunci adalah bahwa kita tidak melemahkan kualitas. Kita membangun satu mesin konten yang kuat, kemudian mengemasnya secara berbeda untuk setiap pemangku kepentingan berdasarkan apa yang menciptakan nilai nyata.

Acara yang menggunakan Voxo melaporkan pengiriman konten yang lebih cepat dan keterlibatan sponsor yang lebih tinggi. Apa yang Anda pikir lebih penting dalam mencapai dampak itu, kecepatan, struktur, atau kualitas wawasan?

Itu adalah kombinasi. Kecepatan tidak penting jika konten kekurangan struktur dan kualitas. Pada saat yang sama, bahkan konten terbaik menjadi kurang berharga jika tiba terlambat.

Keuntungan sebenarnya adalah mengirimkan ketiganya bersama-sama. Wawasan berkualitas tinggi, dikemas dalam struktur yang jelas, dikirimkan dengan cukup cepat untuk tetap relevan. Itulah yang membuat konten berguna, dapat dibagikan, dan berdampak komersial.

Apa yang dimaksud dengan “waktu nyata” bagi platform konten yang didorong AI dalam beberapa tahun ke depan, dan seberapa dekat kita dengan kenyataan itu hari ini?

Dalam beberapa kasus, waktu nyata yang sebenarnya sudah ada. Kita telah mengirimkan komentari waktu nyata di seluruh siaran langsung, misalnya dengan NHS di Manchester musim panas lalu bersama First Sight Media dan Lineup Ninja. Kita juga memperkenalkan pengalaman waktu nyata sejak 2023 di Techarenan dengan pembicara seperti Al Gore dan Steve Wozniak.

Namun, ada ruang untuk waktu nyata yang sebenarnya dan hampir waktu nyata di acara. Bagian penting adalah menjadi sengaja tentang apa yang menciptakan nilai. Sebuah awan kata waktu nyata yang diperbarui di belakang pembicara mungkin lebih mengganggu daripada membantu.

Akhirnya, apa kesalahpahaman umum tentang ringkasan atau transkrip yang dihasilkan AI yang Anda harus koreksi secara teratur ketika berbicara dengan pelanggan perusahaan?

Kesalahpahaman terbesar adalah bahwa Anda dapat mendapatkan ringkasan yang dapat diandalkan dan konsisten dengan kualitas tinggi hanya dengan menyalin file audio dan menempelkannya ke ChatGPT. Orang juga menyadari dengan cepat bahwa itu memakan waktu dan sulit untuk mempertahankan konsistensi, terutama ketika Anda memiliki sejumlah besar sesi. Dan bahkan kemudian, transkripsi dan ringkasan hanya sebagian kecil dari apa yang kita kirimkan. Mungkin sekitar 5 persen. Pekerjaan yang sebenarnya adalah kecepatan, struktur, konteks, kemasan siap merek, jaminan kualitas, dan format distribusi yang membuat konten dapat digunakan dan berharga pada skala perusahaan.

Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi Voxo AI.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.