Wawancara
Tomer Aharoni, CEO dan Co-Founder Nagish – Seri Wawancara

Tomer Aharoni, CEO dan Co-Founder Nagish, menggabungkan fondasi teknis yang kuat dari pengalaman kerjanya sebagai insinyur perangkat lunak di Bloomberg, penelitian di NLP dan IoT di Columbia University, dan pengalaman sebelumnya dalam peran intelijen teknologi di Israel Defense Forces, semua didorong oleh passionnya untuk aksesibilitas dan persimpangan teknologi dan komunikasi.
Nagish adalah platform komunikasi yang ditenagai AI yang dirancang untuk membuat panggilan telepon sepenuhnya dapat diakses untuk orang yang tuli atau memiliki gangguan pendengaran. Aplikasi ini menyediakan pengetikan waktu nyata dan kemampuan teks-ke-ucapan sambil memungkinkan pengguna untuk menjaga nomor telepon mereka, mempertahankan privasi sepenuhnya, dan mengelola percakapan melalui fitur seperti kamus pribadi, transkrip yang disimpan, dan integrasi perangkat yang mulus.
Apa momen atau wawasan yang membuat Anda mengarahkan pengalaman itu untuk menciptakan Nagish?
Selama studi sarjana saya di Columbia, saya duduk di kelas satu hari ketika saya menerima panggilan telepon. Saya tidak bisa menjawabnya karena itu akan mengganggu seluruh kelas, dan itu membuat saya berpikir tentang bagaimana Anda bisa melakukan panggilan telepon jika Anda tidak bisa mendengar atau berbicara? Ini mengarah ke pertanyaan yang lebih besar: bagaimana orang tuli dan orang dengan gangguan pendengaran berkomunikasi di telepon?
Itu tahun 2019, dan kami (Alon Ezer, co-founder saya, dan saya) menemukan bahwa komunitas tuli sangat bergantung pada juru bahasa dan asisten pengetikan. Kami pikir itu gila, jadi kami mulai menghubungi orang-orang dari komunitas tuli setempat, dan apa yang kami dengar sangat mengejutkan bagi kami. “Saya hanya menutup ketika seseorang menelepon saya,” “Saya tidak menggunakan telepon,” atau “Saya meminta saudara laki-laki saya untuk menelepon untuk saya,” hanya beberapa jawaban yang kami terima ketika kami bertanya kepada orang-orang tentang bagaimana mereka menggunakan telepon.
Kemudian musim panas itu, saya magang sebagai insinyur perangkat lunak di Bloomberg. Di tim saya, kami memiliki magang lain yang tuli. Setiap kali saya ingin bertemu dengannya, saya harus menyelaraskan jadwal dengan dia dan dua juru bahasa. “Mari kita lakukan panggilan cepat untuk memahami ini” tidak mungkin. Setelah berbicara dengan HR tentang hal itu, saya belajar bahwa menemukan dua juru bahasa yang familiar dengan jargon teknis hampir mustahil dan bahwa kami menggunakan mereka setiap kali mereka tersedia, tetapi mereka tidak tersedia sepenuhnya.
Semakin banyak yang kami pelajari, semakin jelas bahwa ini bukanlah ketidaknyamanan yang terisolasi tetapi bagian dari pola yang jauh lebih besar. Bahkan hari ini, dengan kemajuan yang telah memperbaiki aksesibilitas, masih banyak tantangan dan area yang perlu diatasi. Di Nagish kami baru-baru ini melakukan survei dan merilis laporan, Dampak Teknologi Komunikasi dalam Memberdayakan Orang Tuli dan Orang dengan Gangguan Pendengaran, yang menemukan bahwa 65% responden tuli mengatakan mereka membutuhkan bantuan dari orang yang mendengar setidaknya sekali seminggu untuk berkomunikasi secara efektif. Ketergantungan itu menciptakan hambatan nyata di lingkungan profesional, yang tercermin dalam kenyataan bahwa 62% responden tuli mengatakan tantangan komunikasi membentuk keputusan karir mereka dan membatasi kemampuan mereka untuk mengejar atau maju dalam peran tertentu.
Pengalaman ini, dan koneksi saya yang semakin besar dengan individu tuli, membuat saya membangun iterasi pertama Nagish. Kami memiliki satu keyakinan yang tidak berubah – komunikasi harus dapat diakses dan pribadi.
Alon dan saya membangun prototipe, dan responsnya luar biasa. Kami menyadari betapa berubahnya Nagish bisa menjadi. Lalu COVID datang, dan kebutuhan meledak karena dunia menjadi remote, dan kurangnya aksesibilitas dalam cara orang berkomunikasi benar-benar menjadi jelas.
Bagaimana Anda menjelaskan hari-hari awal Nagish, dan apa tantangan yang Anda hadapi dalam menggabungkan tujuan aksesibilitas dengan teknologi AI canggih?
Hari-hari awal Nagish adalah selama pandemi, jadi tidak banyak yang terjadi dalam hidup kami di luar pekerjaan. Alon dan saya tinggal di sekitar blok yang sama dan memiliki banyak waktu untuk berdiskusi, membuat prototipe, dan menerapkan teknologi terbaru. Kami bekerja dari apartemen kami selama 12+ jam sehari selama berbulan-bulan.
Memiliki waktu sebanyak itu di tangan kami memungkinkan kami untuk menghabiskan banyak waktu berbicara dengan pengguna kami dan memahami kebutuhan mereka. Kami tidak ingin membuat asumsi. Pada titik ini, kami masih belum memiliki niat untuk membuatnya menjadi perusahaan. Apa yang memberi kami dorongan adalah mendengar dari pengguna tentang perjuangan mereka dan mengetahui bahwa kami memiliki kesempatan untuk memecahkan masalah mereka dengan teknologi.
Bagaimana teknologi AI Nagish memfasilitasi komunikasi antara individu tuli atau orang dengan gangguan pendengaran dan dunia yang mendengar dengan cara yang tidak dapat dilakukan oleh alat yang ada?
Nagish menggunakan AI untuk memfasilitasi komunikasi. Mesin kami mengubah ucapan menjadi teks, teks kembali menjadi ucapan, dan bahasa isyarat menjadi teks (dan sebaliknya) secara waktu nyata. Artinya, orang tuli atau orang dengan gangguan pendengaran dapat melihat apa yang dikatakan dalam panggilan dan membalas dengan mengetik atau berbicara, sementara orang yang mendengar di ujung lainnya hanya mengalami panggilan telepon standar. Sebelum AI jenis ini ada, orang harus bergantung pada layanan relay yang dioperasikan manusia di mana orang ketiga duduk di garis dan melakukan semua pengetikan.
Dengan Nagish, tidak ada operator relay, tidak ada juru bahasa untuk dijadwalkan, dan tidak ada menunggu seseorang lain tersedia. Aplikasi ini memasukkan seketika, privasi, dan kemandirian kembali ke dalam panggilan telepon, sesuatu yang layanan relay tradisional tidak bisa tawarkan.
Sejak Nagish ditenagai AI, itu dapat diskalakan ke setiap jenis panggilan: pertemuan kerja, periksaan keluarga, keadaan darurat, dan panggilan layanan pelanggan. Aplikasi ini dirancang untuk dengan mudah terintegrasi ke dalam kehidupan sehari-hari: pengguna dapat menjaga nomor mereka sendiri, mendapatkan pengetikan waktu nyata, dan menggunakan aplikasi yang sama di seluruh panggilan telepon dan percakapan tatap muka. Pengalaman keseluruhan dirancang untuk mengurangi friksi dan membuat komunikasi terasa sebagai alami dan mulus mungkin.
Bagaimana platform Anda melampaui transkripsi atau pengetikan standar untuk membuat interaksi lebih alami dan inklusif?
Kami tahu bahwa bahasa tidak hanya kata-kata, tetapi juga budaya, identitas, dan nuansa. Itu terutama benar untuk bahasa isyarat, yang bergantung pada ekspresi wajah, emosi, dan variasi regional. Untuk membuat interaksi terasa alami dan tidak mekanis, kami berkolaborasi langsung dengan ahli bahasa isyarat dan ahli linguistik tuli. Mereka membantu membentuk bagaimana AI kami belajar dan berperilaku, sehingga teknologi ini dibangun dengan komunitas, bukan hanya dilatih pada data mereka.
Alat transkripsi standar sering berhenti pada “ini adalah kata-kata yang dikatakan.” Tujuan kami adalah untuk mendukung percakapan yang sebenarnya. Kami menerapkan Agen AI yang dapat menyediakan konteks dan mengelola aliran panggilan di luar hanya menyediakan pengetikan atau membaca teks ke ucapan. Selain itu, Nagish menawarkan pengetikan waktu nyata yang dioptimalkan untuk aliran percakapan, dengan fitur seperti font yang dapat disesuaikan, filter spam, transkripsi voicemail, dan kemampuan untuk menyimpan dan meninjau transkrip di perangkat Anda ketika Anda memilih untuk. Semua itu menciptakan pengalaman yang setara dengan yang dialami oleh orang yang mendengar dalam panggilan telepon.
Apa peran pemrosesan bahasa alami dalam memastikan platform Anda menangkap tidak hanya kata-kata tetapi juga niat dan nada?
Pemrosesan bahasa alami dan pemahaman bahasa alami ada di inti bagaimana Nagish menangkap tidak hanya apa yang dikatakan seseorang, tetapi apa yang mereka maksudkan. Ucapan penuh dengan petunjuk yang menambahkan konteks, seperti nada, penekanan, dan lebih, dan model NLP kami dirancang untuk menangkap lapisan-lapisan itu sehingga pengguna mendapatkan lebih dari sekedar transkrip dasar. Tujuan kami adalah membuat pengetikan terasa sebagai dekat dengan percakapan alami sebagai mungkin.
Karena Nagish dibangun untuk situasi dunia nyata, seperti panggilan medis, pertemuan kerja, dan bahkan keadaan darurat, model kami dilatih untuk menangani ucapan cepat, suara yang tumpang tindih, dan nuansa emosional. Kesadaran konteks adalah alasan besar mengapa kami sering outperform baik transkriber manusia dan alat AI lainnya. Sistem tidak hanya menebak kata-kata; itu menggunakan aliran percakapan untuk memahami niat.
Bagaimana Nagish membantu perusahaan membangun tempat kerja yang lebih inklusif sambil mengatasi hambatan keuangan dan logistik yang telah lama membatasi aksesibilitas?
Di Nagish, kami membantu perusahaan membangun tempat kerja yang lebih inklusif dengan menghilangkan hambatan keuangan dan logistik yang telah membuat aksesibilitas sulit untuk diskalakan. Secara tradisional, menciptakan tempat kerja yang dapat diakses berarti bergantung pada juru bahasa yang dijadwalkan, yang penting tetapi tidak selalu praktis untuk komunikasi sehari-hari, seperti panggilan cepat, pertemuan yang tidak terjadwalkan, atau tugas yang sensitif waktu. Batasan ini menciptakan keterlambatan, menambah biaya, dan dapat tidak sengaja mengecualikan karyawan tuli dan orang dengan gangguan pendengaran dari aliran kerja.
Nagish berusaha untuk mengubah dinamika itu, memberi karyawan kemampuan untuk berkomunikasi secara mandiri dan sesuai permintaan. Ketika perusahaan menghilangkan hambatan tersebut, orang dapat berpartisipasi sepenuhnya, mengarah ke tim yang lebih kuat, retensi yang lebih baik, dan tempat kerja yang lebih adil.
Menurut survei yang kami lakukan baru-baru ini, lebih dari 60% responden tuli dan orang dengan gangguan pendengaran mengatakan bahwa hambatan komunikasi telah mempengaruhi keputusan karir mereka dan pertumbuhan profesional. Ini adalah tantangan serius yang, bahkan dengan semua kemajuan yang telah dibuat dalam beberapa tahun terakhir, menunjukkan bahwa masih banyak pekerjaan yang harus dilakukan.
Kami memungkinkan perusahaan untuk beralih dari akomodasi reaktif ke inklusi proaktif, menciptakan tempat kerja di mana setiap karyawan dapat berkontribusi secara mandiri dan dengan percaya diri.
Jenis umpan balik apa yang Anda terima dari pengguna tuli dan orang dengan gangguan pendengaran, dan bagaimana itu mempengaruhi evolusi produk?
Kami membangun Nagish dengan komunitas tuli dari hari pertama, dan sejak itu, kami telah menerima campuran antusiasme, ketertarikan, dan dalam beberapa kasus, beberapa keraguan, yang tepat seperti yang seharusnya. Komunitas tuli sangat sadar dan ingin tahu tentang teknologi baru, dan dengan alasan yang baik. Mereka telah mendengar banyak janji yang berlebihan di masa lalu, dan kami berusaha untuk menghindari itu. Kami memprioritaskan kemajuan daripada kesempurnaan, yang membutuhkan waktu – tetapi tujuan akhir kami adalah kesempurnaan.
Pandangan komunitas ini diperkuat oleh apa yang kami pelajari dalam laporan kami baru-baru ini. Setelah mengadopsi teknologi bantu, pengguna menunjukkan peningkatan besar dalam kemandirian sehari-hari: jumlah orang yang dapat berkomunikasi secara mandiri meningkat dari 37% menjadi 60% untuk pengguna tuli, dan dari 32,9% menjadi 63% untuk pengguna dengan gangguan pendengaran. Perubahan itu mencerminkan umpan balik yang kami terima setiap hari: orang ingin alat yang membuat komunikasi lebih mudah, lebih konsisten, dan tersedia dalam situasi di mana juru bahasa tidak tersedia atau ketika mereka lebih memilih privasi.
Ketika datang ke penelitian kami tentang menciptakan teknologi interpretasi bahasa isyarat yang lebih baik, tujuan kami bukan untuk menggantikan juru bahasa manusia atau metode komunikasi yang ada, tetapi untuk menambahkan pilihan lain, alat yang membuat aksesibilitas lebih konsisten dan tersedia di mana saja, kapan saja. Umpan balik dari pengguna telah memperkuat betapa pentingnya “pilihan tambahan” itu, terutama dalam situasi di mana juru bahasa tidak tersedia atau ketika seseorang hanya ingin privasi dan kemandirian. Untuk banyak orang, itu menciptakan situasi di mana komunikasi akan terasa tidak nyaman, tertunda, atau tidak terjangkau.
Kami mengambil pendekatan komunitas-terlebih-dahulu untuk memastikan teknologi ini terasa autentik, akurat, dan hormat. Selama kami terus membangun dengan pengguna bahasa isyarat, kami yakin ini akan diterima sebagai langkah maju yang membebaskan.
Privasi adalah kekhawatiran utama dalam teknologi aksesibilitas — bagaimana Nagish menangani percakapan sensitif dan mempertahankan kepercayaan pengguna?
Privasi sangat penting untuk misi Nagish untuk memberdayakan pengguna tuli dan orang dengan gangguan pendengaran. Hal pertama yang perlu disebutkan adalah bahwa dengan Nagish, Anda sudah dapat menghilangkan kebutuhan akan pengetik yang hidup, sehingga ada perasaan privasi yang tidak mungkin sebelumnya.
Dari sisi teknis, Nagish dirancang untuk privasi. Kami tidak merekam panggilan dan tidak pernah menyimpan transkrip panggilan di server kami setelah panggilan selesai. Kami juga tidak menggunakan data panggilan untuk tujuan pelatihan. Ketika pengguna memilih untuk menyimpan transkrip, mereka disimpan secara lokal di perangkat mereka bukan di cloud yang dibagikan. Fitur seperti pengetikan yang aman dari ujung ke ujung dan penyimpanan lokal transkrip ada untuk melindungi percakapan yang sangat sensitif – apakah itu tentang kesehatan, pekerjaan, atau hubungan pribadi.
Bagaimana Anda melihat AI mengubah aksesibilitas dalam dekade mendatang, dan apa celah yang masih ada untuk teknologi untuk diisi?
Salah satu masalah terbesar dengan aksesibilitas digital adalah kurangnya pendidikan dan keterlihatan: Insinyur tidak menerapkan alt-teks, desainer memilih warna yang tidak dapat diakses karena terlihat baik, dan manajer produk membuat keputusan produk untuk KPI.
Seiring AI semakin terlibat dalam setiap aspek pengembangan produk, dari teknik hingga desain hingga penulisan, kami melihat pendekatan proaktif terhadap aksesibilitas. AI bisa mengubah aksesibilitas dari sesuatu yang reaktif dan “diperbaiki” menjadi sesuatu yang proaktif dan ambient. Kami juga akan melihat gelombang baru alat yang akan melengkapi komunikasi dalam berbagai pengaturan – tidak hanya panggilan, tetapi tempat kerja, kelas, transportasi, dan layanan publik – sehingga orang dengan disabilitas, dan orang tuli dan orang dengan gangguan pendengaran khususnya, tidak perlu terus-menerus meminta akomodasi; mereka hanya akan ada secara default.
Bagaimana Anda membayangkan kolaborasi antara juru bahasa manusia dan AI berkembang — apakah satu akan menggantikan yang lain, atau apakah mereka saling memperkuat?
Juru bahasa bahasa isyarat melakukan pekerjaan yang luar biasa. Mereka penting untuk komunitas, aksesibilitas, dan komunikasi. Tapi kenyataannya adalah, tidak ada cukup banyak dari mereka. Di AS, misalnya, ada lebih dari 500.000 orang yang menggunakan Bahasa Isyarat Amerika sebagai bahasa utama mereka, dan hanya sekitar 10.000 juru bahasa yang bersertifikat. Itu berarti sejumlah besar situasi – dari kunjungan dokter, pertemuan orang tua dan guru, wawancara kerja, dan lain-lain – sering kekurangan komunikasi yang dapat diakses.
Even ketika juru bahasa tersedia, ada tantangan sekitar penjadwalan, biaya, dan geografi. Seseorang yang tinggal di daerah pedesaan akan memiliki kesulitan lebih besar untuk mendapatkan juru bahasa, dan keterlambatan itu dapat memiliki konsekuensi nyata, terutama dalam pengaturan kesehatan atau darurat.
AI dapat membantu memfasilitasi kesenjangan itu. Apa yang kami bangun tidak dimaksudkan untuk menggantikan juru bahasa, tetapi untuk melengkapi pekerjaan mereka dan membuat aksesibilitas lebih dapat diskalakan. Bayangkan itu sebagai alat yang mengambil alih ketika juru bahasa manusia tidak tersedia.
Google Translate tidak menggantikan penerjemah profesional, tetapi membuatnya memungkinkan untuk memfasilitasi kesenjangan komunikasi sehari-hari.
Dengan kemajuan dalam penglihatan komputer dan pemrosesan bahasa alami, AI memegang janji untuk mulai menafsirkan bahasa isyarat secara waktu nyata. Ini berarti lebih banyak orang dapat berkomunikasi secara instan, apakah itu melalui panggilan video, kios publik, atau layanan darurat.
Terima kasih atas wawancara yang luar biasa, pembaca yang ingin mempelajari lebih lanjut harus mengunjungi Nagish.












