Connect with us

Wawancara

Isaiah N. Granet, Co-Founder dan CEO Bland – Seri Wawancara

mm

Isaiah N. Granet, Co-Founder dan CEO Bland, adalah pendiri startup dan insinyur yang latar belakangnya mencakup eksekusi teknis dengan pengalaman kewirausahaan awal dan dampak sosial jangka panjang. Sebelum meluncurkan ventura saat ini, ia berpartisipasi dalam Z Fellows dan Y Combinator, membangun pengalaman teknik di Lantern, dan mendirikan San Diego Chill, sebuah organisasi nirlaba yang mengumpulkan lebih dari $2,5 juta untuk membantu anak-anak dengan disabilitas perkembangan mengakses olahraga, mendapatkan pengakuan nasional dan terus berlanjut hingga saat ini dengan keterlibatannya di tingkat dewan.

Bland berfokus pada membangun infrastruktur untuk panggilan suara yang ditenagai AI, memungkinkan bisnis untuk mengirim agen suara yang dapat menangani dukungan pelanggan, penjualan, dan alur kerja operasional dalam skala besar. Platform ini dirancang untuk menggantikan atau melengkapi pusat panggilan tradisional dengan menawarkan interaksi suara yang dapat diprogram, responsif waktu nyata, dan integrasi dalam dengan sistem bisnis, memposisikan diri sebagai lapisan inti dalam cara perusahaan mengotomatisasi komunikasi dengan pelanggan.

Anda mendirikan San Diego Chill sebagai seorang remaja untuk menciptakan akses inklusif ke olahraga untuk anak-anak dengan disabilitas perkembangan, jauh sebelum memasuki Y Combinator atau meluncurkan Bland. Bagaimana pengalaman awal Anda membangun organisasi dunia nyata mempengaruhi cara Anda mendekati pendirian perusahaan AI suara yang sekarang berada di antara perusahaan dan pelanggan mereka?

Banyak kehidupan dan pekerjaan saya telah berfokus pada membangun. Sejak usia muda, saya memiliki keinginan konstan untuk menghidupkan hal-hal. Sekali sebuah ide atau keyakinan tentang dunia muncul di kepala saya, itu menjadi tidak mungkin untuk diabaikan. Membangun San Diego Chill tidak hanya mengajarkan saya cara menciptakan dan menjalankan sebuah organisasi, tetapi juga mengajarkan saya tentang dampak tindakan kita terhadap orang lain. Untuk dapat memberi kembali dengan menciptakan organisasi yang tidak akan pernah ada sebelumnya adalah sesuatu yang sangat memuaskan. Pelajaran dan nilai yang saya pelajari dari Chill tetap bersama saya setiap hari.

Setelah melewati YC pada 2023, apa yang membuat Anda yakin bahwa infrastruktur suara perusahaan masih secara fundamental rusak sehingga membenarkan pembangunan sistem ujung-ke-ujung daripada melapisinya dengan LLM di atas alat IVR warisan?

Pikirkan tentang terakhir kali Anda menggunakan chatbot bank. Anda mungkin menunggu lebih lama dari yang seharusnya, mendapatkan jawaban yang tidak menjawab apa yang Anda tanyakan, dan akhirnya menelepon lagi. Kemudian suara robot membawa Anda melalui menu opsi yang tidak Anda inginkan, dan menekan 0 tidak melakukan apa-apa yang berguna.

Banks telah menghabiskan miliaran untuk membuat pengalaman itu memungkinkan, dan chatbot masih menduduki peringkat terbawah dalam kepuasan pelanggan sebesar 29%. Lebih rendah dari email. Lebih rendah dari pusat panggilan, yang sudah semua orang keluhkan.

Itu telah menjadi dinamika selama dua dekade. Bisnis mencoba menjauhkan pelanggan dari staf mereka. Pelanggan terus mencoba untuk mencapai seseorang. Tidak ada pihak yang menang.

Masalahnya bukanlah bahwa perusahaan tidak ingin memperbaikinya. Mereka hanya tidak bisa mempekerjakan cara mereka untuk pengalaman yang baik dalam skala. Pusat panggilan yang menangani sejuta panggilan per bulan adalah operasi yang mahal dan sulit, dan kualitasnya tidak konsisten hampir oleh definisi.

Apa yang berubah adalah bahwa AI akhirnya membuatnya memungkinkan untuk menyelesaikan panggilan bukan hanya mengarahkan atau mengalihkannya. Tidak pohon telepon. Tidak musik menunggu. Seorang agen yang memahami apa yang pelanggan tanyakan dan menanganinya.

Tapi itu hanya berhasil jika sistem dibangun untuk suara waktu nyata dari awal. Ketika Anda melapisinya dengan LLM di atas alat IVR warisan atau menjahit layanan pihak ketiga, latensi merayap dan keandalan turun. Percakapan rusak.

Itulah mengapa kami fokus pada membangun infrastruktur ujung-ke-ujung. Suara hanya bekerja jika terasa segera dan alami. Jika tidak, pelanggan akan menutup.

Bland telah mengambil langkah yang tidak biasa dengan membangun dan menghosting TTS, inferensi, dan tumpukan transkripsi internalnya sendiri. Apa pertukaran yang Anda lihat dalam mengandalkan API pihak ketiga yang akhirnya mendorong Anda untuk memiliki lapisan infrastruktur suara penuh?

Setiap lapisan yang Anda outsource menambahkan latensi dan menambahkan risiko.

Sebagian besar platform suara AI adalah penjual kembali. Mereka mengambil transkripsi pihak ketiga, menambahkan model pihak ketiga, mengarahkannya melalui TTS pihak ketiga, dan menyerahkan hasilnya kepada Anda. Itu bisa berhasil dalam demo yang dikendalikan. Itu jarang bertahan ketika volume panggilan meningkat atau sesuatu dalam rantai salah.

Ada juga masalah data. Penyedia model dasar, OpenAI adalah contoh yang jelas, telah menggunakan data pelanggan untuk melatih model. Mereka mengatakan lisensi perusahaan berbeda. Mungkin mereka benar. Tapi ketidakpastian itu sudah cukup untuk membuat banyak tim keamanan dan kepatuhan merasa tidak nyaman.

Ketika Anda menghosting seluruh tumpukan — transkripsi, inferensi, TTS, orkestrasi — Anda mengontrol setiap milidetik dan setiap pembaruan model. Data pelanggan tetap di dalam ekosistem pelanggan. Itu tidak menyentuh pipa pelatihan pihak ketiga, tidak melewati infrastruktur yang tidak dapat Anda audit, dan tidak bergerak kecuali pelanggan memutuskan itu harus.

Anda dapat memberikan infrastruktur khusus kepada setiap pelanggan perusahaan sehingga lonjakan dari perusahaan lain tidak pernah menyentuh kinerja mereka. Dan ketika sesuatu rusak, Anda dapat memperbaikinya daripada menunggu vendor yang menunggu.

Untuk industri yang diatur, beberapa pelanggan memerlukan tumpukan penuh di VPC mereka sendiri atau di tempat. Itu hanya memungkinkan jika vendor benar-benar memiliki apa yang mereka tanamkan.

Automatisasi pusat kontak tradisional telah berfokus berat pada mengalihkan panggilan dukungan sederhana. Mengapa Anda memutuskan untuk memprioritaskan interaksi pelanggan yang kompleks dan panjang ekor daripada mengoptimalkan untuk otomatisasi berbasis volume terlebih dahulu?

Automatisasi pusat kontak tradisional telah berfokus pada mengalihkan panggilan dukungan sederhana. Mengapa Anda memprioritaskan interaksi yang kompleks dan panjang ekor daripada memulai dengan kasus penggunaan volume tinggi?

Kami mengambil pendekatan yang berlawanan. Jika kami dapat menangani panggilan yang paling kompleks dan sensitif dengan andal, semuanya menjadi sederhana. Tujuan kami bukanlah membangun demo, tetapi untuk mengirimkan resolusi panggilan penuh pada skala. Itu memerlukan sistem rendah-latensi, keandalan tinggi yang dapat mengelola kasus tepi yang sebenarnya mendefinisikan percakapan pelanggan nyata.

Agen Anda semakin terintegrasi ke dalam CRM dan database operasional untuk menyelesaikan panggilan dari ujung ke ujung. Bagaimana otomatisasi asli suara mengubah arsitektur alur kerja perusahaan dibandingkan dengan kopilot berbasis obrolan?

Sistem warisan sering tidak berbicara satu sama lain. CRM, alat penjadwalan, dan platform penagihan adalah silo. Tanpa akses ke sistem tersebut, agen suara hanya dapat menjawab pertanyaan umum dan tidak banyak lagi.

Itu tidak bisa melihat akun, memperbarui catatan, atau memesan janji temu. Itu mengumpulkan informasi dan menyerahkannya. Sementara itu, perwakilan manusia menghabiskan waktu pada pekerjaan yang tidak seharusnya disentuh oleh orang: mencatat catatan panggilan, menjadwalkan janji temu secara manual, menarik laporan untuk mengetahui siapa yang memerlukan tindak lanjut.

Integrasi dalam adalah apa yang membuat resolusi ujung-ke-ujung memungkinkan. Tanpa itu, Anda telah mengotomatisasi sambutan, bukan panggilan.

Demo klone suara Soulja Boy baru-baru ini menyoroti bagaimana agen percakapan dapat meluas di luar operasi internal ke pengalaman yang menghadap merek. Apakah Anda melihat agen suara perusahaan berkembang menjadi perwakilan digital yang menghadap pelanggan yang beroperasi terus-menerus di seluruh saluran penjualan, dukungan, dan pemasaran?

Tentu. Kami melihat dunia di mana setiap pelanggan memiliki hubungan pribadi dengan bisnis favorit dan penting mereka. Yang penting adalah bahwa AI tidak hanya “menyenangkan” tetapi mampu benar-benar menyelesaikan masalah kompleks Anda.

Suara waktu nyata memperkenalkan latensi, halusinasi, dan tantangan identitas yang tidak ada dalam penerapan AI berbasis teks. Apa yang menjadi kendala teknis terberat yang Anda temui saat membangun agen yang perlu merespons dalam waktu kurang dari satu detik sambil mempertahankan akurasi percakapan?

Latensi. Itulah tempat sebagian besar demo mati.

Jika chatbot membutuhkan tiga detik untuk merespons, pengguna menunggu. Jika agen suara berhenti secara tidak nyaman setelah Anda selesai berbicara, percakapan sudah rusak. Respon perlu kembali dalam waktu kurang dari 400 milidetik. Sebagian besar platform tidak bisa mencapai itu karena mereka menjahit beberapa layanan pihak ketiga, masing-masing menambahkan keterlambatan mereka sendiri.

Tapi latensi hanya sebagian dari itu. Panggilan pelanggan nyata kacau dengan cara yang tidak pernah ditangkap oleh demo. Orang menginterupsi di tengah kalimat. Kebisingan latar belakang memotong. Penelepon beralih bahasa. Permintaan tidak jelas. AI suara yang bertahan dalam produksi menangani interupsi tanpa kehilangan konteks, beradaptasi ketika percakapan keluar dari skrip, dan melakukannya tanpa terdengar seperti sedang menunggu.

Pelanggan tidak membandingkan AI suara dengan bot lain. Mereka membandingkannya dengan berbicara dengan orang. Itulah standar.

Ada peningkatan pengawasan tentang bagaimana sistem AI yang terdengar seperti manusia merepresentasikan diri mereka selama interaksi. Bagaimana perusahaan harus memikirkan transparansi ketika mengirimkan agen percakapan yang mungkin tidak dapat dibedakan dari staf manusia?

Kami percaya kuat pada kejujuran dan transparansi bagi pengguna akhir. Meskipun beberapa regulasi membebani dan menghambat, tidak ada bentuk penipuan yang dapat diterima. Kami bekerja dengan perusahaan untuk mengembangkan pengalaman yang mulus yang didasarkan pada kepercayaan dengan pelanggan.

Ketika agen AI mulai menangani jutaan interaksi pelanggan secara bersamaan, apa tantangan operasional yang cenderung muncul pertama kali ketika perusahaan beralih dari penggunaan pilot ke penggunaan skala produksi?

Beberapa hal yang penting dalam prakteknya. Yang pertama adalah arsitektur prompt modular. Prompt monolitik hampir tidak mungkin didebug. Ketika panggilan salah, Anda perlu mengisolasi tepat di mana dan mengapa itu terjadi, bukan menatap dinding instruksi mencoba mengetahui mana baris yang menyebabkan masalah.

Kemampuan observasi penuh juga sangat penting. Ringkasan panggilan tidak cukup. Anda perlu visibilitas waktu nyata tentang apa yang dilakukan agen pada setiap titik dalam setiap interaksi.

Perlindungan juga sangat penting, terutama di industri yang diatur. Agen harus tetap berada dalam kebijakan. Itu tidak opsional. Dan jika tidak, harus ada fallback yang anggun.

Akhirnya, ada manajemen pengetahuan. Agen perlu mengakses data khusus seperti produk, kebijakan, dan prosedur. Platform juga harus menampilkan celah pengetahuan secara otomatis sebagaimana mereka muncul dalam panggilan nyata, bukan minggu kemudian setelah pelanggan mengeluh.

Menghadap ke depan, apakah Anda percaya bahwa agen suara perusahaan akan tetap menjadi alat khusus tugas, atau akan berkembang menjadi agen AI yang lebih umum yang mampu mengelola proses bisnis secara otonom yang diinisiasi melalui percakapan?

Jika saja saya memiliki jawabannya! Saya pikir bahwa agen suara akan berkembang di seluruh tumpukan bisnis, tetapi tidak mungkin melihat bisnis lengkap dijalankan oleh agen suara. Yang penting adalah bahwa AI tidak hanya “menyenangkan” tetapi mampu benar-benar menyelesaikan masalah kompleks Anda. Saya percaya bahwa manusia akan dapat mendapatkan layanan yang instan, akurat, dan lebih komprehensif dari agen AI daripada yang mereka dapatkan hari ini. Bahkan, kami percaya bahwa lebih banyak panggilan akan terjadi ketika ini terjadi. Bukan lebih sedikit.

Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi Bland.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.