Wawancara

Sharone Ben-Levi, Wakil Presiden Penjualan dan Pengembangan Bisnis Global, Contact Center, AudioCodes – Seri Wawancara

mm

Sharone Ben-Levi, Wakil Presiden Penjualan dan Pengembangan Bisnis Global, Contact Center, AudioCodes, adalah seorang eksekutif teknologi komunikasi berpengalaman dengan lebih dari 25 tahun pengalaman yang meliputi penjualan, pemasaran, pengembangan bisnis, dan inovasi contact center. Selama karirnya yang telah mencakup lebih dari dua dekade di AudioCodes, ia telah memegang serangkaian posisi kepemimpinan senior yang fokus pada mengarahkan pertumbuhan di seluruh komunikasi perusahaan, solusi pengalaman pelanggan, dan teknologi contact center yang ditenagai AI. Sebelum bergabung dengan AudioCodes, ia bekerja di NICE Systems, di mana ia memperoleh pengalaman berharga dalam keterlibatan pelanggan dan perangkat lunak perusahaan. Sepanjang karirnya, Ben-Levi telah fokus pada membantu organisasi memodernisasi interaksi pelanggan melalui komunikasi awan, otomatisasi, dan AI konversasional, membuatnya menjadi suara yang diakui dalam evolusi teknologi contact center.

AudioCodes adalah perusahaan teknologi komunikasi yang mengkhususkan diri dalam suara perusahaan, contact center, dan solusi pengalaman pelanggan yang ditenagai AI. Didirikan pada tahun 1993, perusahaan ini telah berkembang dari penyedia infrastruktur jaringan suara dan VoIP menjadi pemimpin dalam komunikasi suara pintar, membantu organisasi memodernisasi interaksi pelanggan dan karyawan di seluruh awan, hybrid, dan lingkungan on-premises. Portofolionya mencakup platform AI suara, solusi AI konversasional, kontroler perbatasan sesi, integrasi suara Microsoft Teams, penawaran CPaaS, dan alat modernisasi contact center. Melalui platform seperti VoiceAI Connect dan Live Hub, AudioCodes memungkinkan perusahaan untuk mengirimkan bot suara, agen AI, kemampuan asisten agen, solusi IVR konversasional, dan layanan komunikasi waktu nyata sambil mengintegrasikan dengan infrastruktur teleponi dan contact center yang ada. Teknologinya digunakan oleh perusahaan dan penyedia layanan di seluruh dunia untuk meningkatkan pengalaman pelanggan, mengotomatisasi alur kerja, dan mendukung inisiatif transformasi digital.

Anda telah menghabiskan lebih dari dua dekade di AudioCodes, berkembang dari rekayasa sistem tertanam hingga mengarahkan aplikasi produktivitas. Bagaimana perjalanan itu membentuk perspektif Anda tentang apa yang diperlukan untuk membuat AI suara dapat diandalkan di lingkungan perusahaan?

Saya telah melihat komunikasi perusahaan dari berbagai perspektif, dan perjalanan itu telah memperkuat satu pelajaran inti: keandalan harus dibangun ke dalam setiap lapisan sistem dari awal.

Bekerja pada sistem tertanam mengajarkan saya bahwa setan ada di detail, keputusan teknis kecil memiliki dampak yang besar dalam lingkungan produksi. Latensi, kualitas audio, akurasi transkripsi, pergantian alami, dan setiap elemen lainnya harus direkayasa dengan keandalan dalam pikiran, karena jika salah satunya gagal, seluruh sistem gagal. Anda tidak bisa mengklaim bahwa sistem AI suara bekerja jika hanya bekerja dalam kondisi ideal.

Bergeser ke kepemimpinan membuat itu semakin jelas. Perusahaan mendukung ribuan pengguna di seluruh infrastruktur yang kompleks dengan persyaratan waktu aktif yang ketat. Sistem yang berperforma baik dalam pilot tetapi menurun di bawah beban dunia nyata belum memecahkan masalah.

Itulah yang pada akhirnya saya pelajari dari karir saya: batang untuk AI suara di perusahaan adalah kepercayaan. Dan kepercayaan hanya dibangun ketika organisasi dapat mengandalkan sistem untuk berperforma dengan andal sehingga menjadi bagian dari proses bisnis kritis mereka.

Banyak organisasi telah bereksperimen dengan chatbot, tetapi suara memperkenalkan lapisan kompleksitas yang berbeda. Apa tantangan teknis terbesar dalam beralih dari sistem AI berbasis teks ke sistem suara konversasional yang sepenuhnya?

Tantangan terbesar adalah kompleksitas lingkungan suara perusahaan, yang sering terfragmentasi menjadi “pulau” terpisah yang memerlukan mediasi antara protokol teleponi SIP dan API AI berbasis HTTP/SSE. Ini bahkan turun ke orang. Sangat sedikit insinyur yang mengetahui baik SIP dan HTTP/SSE. Selain itu, tidak seperti sistem berbasis teks, suara memerlukan pemrosesan waktu nyata dan orkestrasi, termasuk mengubah antara protokol yang berbeda sehingga sistem ini dapat berkomunikasi dengan lancar. Urgensi dan interoperabilitas yang ditambahkan membuat menghadirkan pengalaman konversasional yang halus secara signifikan lebih menantang dari sudut pandang teknologi. Latensi, kebisingan latar, aksen, dan crosstalk sekarang dilemparkan ke dalam campuran. Variabel-variabel ini tidak ada dengan teks-saja.

AudioCodes fokus pada menghubungkan sistem teleponi tradisional dengan platform AI modern. Bagaimana solusi seperti VoiceAI Connect mengintegrasikan infrastruktur warisan dengan model AI canggih?

VoiceAI Connect adalah jembatan yang menghubungkan titik kontak pelanggan tradisional (nomor telepon, trunk SIP, dan teleponi contact center) langsung ke platform AI konversasional pihak ketiga seperti Google CX Agent Studio, Amazon Lex, Microsoft Copilot, dan lebih dari 30 lainnya. Ini menangani orkestrasi suara waktu nyata yang kompleks, termasuk speech-to-text dan text-to-speech dan pengaturan rute bot, memungkinkan perusahaan untuk mencampur dan mencocokkan serta dengan mudah mengaktifkan suara bot AI mereka tanpa meninggalkan pengaturan teleponi warisan mereka. Platform warisan biasanya tidak memiliki integrasi API dari server media mereka ke penawaran AI Voice baru. Kami melewatinya dengan menghubungkannya melalui antarmuka teleponi SIP mereka dan menghubungkannya ke antarmuka AI modern.

Perusahaan sering mengalami kesulitan untuk melampaui proyek pilot. Apa hambatan arsitektur atau operasional utama yang mencegah AI suara dari skala di seluruh organisasi?

AI suara masih berubah. Ketika sebuah perusahaan memiloti satu teknologi AI, yang baru dan lebih baik datang segera setelah itu. Karena AudioCodes terus mengintegrasikan ke solusi AI suara terbaru, ini memungkinkan perusahaan untuk mencampur dan mencocokkan serta memastikan lingkungan mereka tahan masa depan. Orkestrasi AudioCodes memungkinkan mereka untuk mencoba bot yang berbeda untuk tujuan yang berbeda, mempertimbangkan kinerja, biaya, bahasa, dan kepatuhan. Ini meningkatkan kemungkinan transisi yang sukses ke produksi.

Hambatan orkestrasi produksi lainnya terkait dengan skalabilitas, kontinuitas bisnis, dan koneksi ke beberapa lingkungan contact center di seluruh dunia.

Dalam penerapan dunia nyata, apa yang terlihat seperti pengalaman panggilan AI yang sukses dari perspektif pengguna akhir, dan seberapa dekat kita untuk mencapai interaksi yang menyerupai manusia pada skala besar?

Kami memiliki beberapa pelanggan besar yang memulai dengan kami sekitar 2020 dan 2021. Mereka membuktikan bahwa interaksi yang menyerupai manusia pada skala besar sudah bekerja dengan baik. Kasus penggunaan nyata termasuk tugas yang menghadap pelanggan seperti pengalihan panggilan, penjadwalan janji, dan transfer uang, serta alat yang menghadap agen seperti ringkasan panggilan AI, bimbingan pengetahuan waktu nyata, dan terjemahan suara langsung.

Bagi pengguna akhir, pengalaman panggilan AI yang ditenagai terasa tanpa gesekan. Alih-alih menavigasi pohon menu yang kaku (tekan 1 untuk ini, tekan 2 untuk itu), penelepon dapat berbicara secara alami dengan kata-kata mereka sendiri melalui sistem IVR (Respon Suara Interaktif) konversasional yang memahami niat dan merespons secara tepat. Ini menciptakan interaksi yang lebih intuitif dan efisien dari titik kontak pertama.

Walaupun industri belum mencapai interaksi kompleks yang menyerupai manusia pada skala besar, kemampuan ini membawa perusahaan secara signifikan lebih dekat. Dengan menggabungkan AI dan otomatisasi dengan dukungan manusia, perusahaan dapat menyampaikan pengalaman yang lebih akurat dan lebih personal.

AI Suara bergantung pada pengenalan suara, pemahaman bahasa alami, dan pemrosesan waktu nyata. Di mana Anda melihat hambatan terbesar saat ini, dan bagaimana mereka sedang ditangani?

Hambatan besar bagi perusahaan dalam mengadopsi AI Suara kembali ke integrasi. Menurut laporan terbaru oleh Opus Research hanya 38% perusahaan mengatakan bahwa biaya adalah hambatan untuk mengadopsi AI suara. Namun, 65% mengatakan integrasi dalam sistem yang ada dan 60% mengatakan kompleksitas integrasi.

Penyedia CCaaS semakin meningkatkan hambatan untuk model bawa-bawa-bot dengan memblokir integrasi atau membuatnya tidak layak secara finansial. Sistem yang lebih lama biasanya tidak memiliki integrasi API yang diperbarui. Solusi seperti AudioCodes’ Voice AI Connect terhubung ke lingkungan contact center yang ada melalui SIP standar dan memiliki integrasi AIP ke lebih dari 30 kerangka bot AI suara dan lebih dari 20 mesin STT dan TTS, menghilangkan kebutuhan untuk menulis API ini secara manual.

Laporan yang sama menyoroti kualitas kinerja secara keseluruhan (kualitas suara, aliran percakapan, dll.) sebagai alasan terbesar (72%) yang memperlambat adopsi. Apa yang diizinkan oleh Voice AI Connect adalah mencampur dan mencocokkan kerangka bot, STT, dan TTS untuk mengoptimalkan implementasi karena tidak semua AI sesuai dengan setiap kasus penggunaan dan variasi juga diperlukan untuk jargon dan bahasa. Selain itu, industri AI berkembang pesat, memerlukan peralihan yang mudah ke penyedia AI baru karena teknologi yang ditingkatkan.

Integrasi harus rendah-latensi, terjangkau, dan mudah diterapkan. Ini juga harus meningkatkan keamanan dan debugging, memastikan kontinuitas bisnis, dan menawarkan opsi on-premises.

AudioCodes mempromosikan pendekatan yang fleksibel yang menghubungkan beberapa penyedia AI dan suara. Seberapa penting fleksibilitas vendor ketika membangun sistem AI suara yang tangguh dan tahan masa depan?

Fleksibilitas vendor sangat penting karena perusahaan jarang beroperasi dalam lingkungan vendor tunggal, dan ada banyak solusi AI, suara, teleponi, dan komunikasi yang berbeda di pasar. Untuk menciptakan strategi AI suara yang benar-benar terintegrasi, organisasi perlu dapat menggabungkan solusi yang berbeda ini dan memastikan interoperabilitas di seluruhnya sambil mengoptimalkan biaya, latensi, kinerja kasus penggunaan, dukungan bahasa, dan jargon.

Pendekatan yang fleksibel memungkinkan perusahaan untuk mengintegrasikan dengan beberapa penyedia, memilih teknologi yang tepat untuk kasus penggunaan yang berbeda, dan beradaptasi karena pasar berkembang.

Dalam industri yang diatur seperti keuangan atau perawatan kesehatan, bagaimana mengumpulkan dan menganalisis data interaksi suara berbeda dari alur kerja AI berbasis awan yang biasa?

Pengolahan data suara diatur oleh persyaratan privasi dan kepatuhan yang ketat yang secara signifikan membatasi penggunaan alat AI berbasis awan. Untuk mengelola ini, banyak organisasi yang diatur mengadopsi penerapan on-premises untuk memastikan data sensitif tetap dalam lingkungan yang dikendalikan dan tidak pernah meninggalkan infrastruktur mereka.

Standar kepatuhan juga mengharuskan interaksi suara direkam dan disimpan dalam format tertentu selama bertahun-tahun, dengan transkrip yang sangat akurat dan terstruktur untuk auditabilitas. Misalnya, dalam keuangan, sebuah firma perdagangan harus menyimpan setiap panggilan yang direkam dan transkrip persis seperti yang diucapkan untuk audit regulator—data tidak dapat diubah atau diringkas. Dalam perawatan kesehatan, penyedia yang menangani panggilan pasien harus menjaga rekaman dan transkrip sepenuhnya aman dan sesuai dengan HIPAA. Di seluruh papan, data sering perlu diproses on-premises untuk mencegah informasi yang dilindungi terpapar ke layanan awan eksternal.

Seiring perusahaan mulai mengirimkan agen AI yang dapat mengambil tindakan daripada hanya merespons, bagaimana perubahan itu mempengaruhi peran antarmuka suara dalam layanan pelanggan dan operasi internal?

Antarmuka suara berkembang dari alat pasif menjadi sistem pintar dan proaktif yang dapat menganalisis dan bertindak dalam waktu nyata. Alih-alih hanya merekam atau mengarahkan percakapan, sistem AI yang ditenagai suara sekarang dapat memahami niat dan mengambil tindakan segera, seperti menyelesaikan masalah pelanggan, memicu proses backend, atau membantu seorang karyawan menyelesaikan masalah IT. Perubahan ini sangat kuat karena suara sering menjadi titik kontak pertama dan paling alami.

Agen AI sekarang dapat proaktif menghubungi seorang pengawas manusia—misalnya, untuk menyetujui diskon untuk pelanggan. Mereka juga dapat mengambil tindakan langsung, seperti menambahkan item ke keranjang web pelanggan. Dan mereka dapat berkolaborasi dengan bot lain yang memiliki keterampilan khusus, seperti menganalisis foto yang dibagikan oleh pelanggan untuk lebih memahami konteks. Setiap contoh ini mewakili tingkat kesophistikasian yang tidak pernah ada sebelumnya. 

Menghadap ke depan, apakah Anda melihat suara menjadi antarmuka utama untuk sistem AI perusahaan, atau akan tetap menjadi bagian dari pengalaman multimodal yang lebih luas?

Izinkan saya menggunakan contoh pribadi untuk memperkuat poin saya. Saya memiliki dua anak remaja. Mereka lebih suka tidak berinteraksi dengan perwakilan layanan pelanggan manusia jika memungkinkan. Namun, mereka lebih suka berbicara dengan bot daripada berteks dengan itu. Suara telah menjadi sarana komunikasi alami bagi manusia selama jutaan tahun. Ini lebih disukai daripada keyboard atau mouse, setidaknya sampai pembacaan pikiran menjadi kenyataan.

Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi AudioCodes.

Antoine adalah pemimpin visioner dan rekan pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Sebagai seorang wirausaha serial, ia percaya bahwa AI akan menjadi sesuatu yang sangat mengganggu masyarakat seperti listrik, dan sering tertangkap basah membicarakan potensi teknologi disruptif dan AGI.

Sebagai seorang futuris, ia didedikasikan untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan ulang masa depan dan mengubah seluruh sektor.