Pemimpin pemikiran

Bagaimana Menggunakan Suara AI Generatif Secara Etis Untuk Bisnis di 2023

Published January 31, 2023

Updated April 28, 2026

Anna Bulakh

Akhir tahun 2022 datang di tengah-tengah teknologi AI mengalami adopsi yang meluas karena popularitas luar biasa dari OpenAI dan ChatGPT. Untuk pertama kalinya, AI mencapai daya tarik pasar massal dengan membuktikan utilitas dan nilai dalam menciptakan hasil bisnis yang sukses.

Banyak teknologi AI yang tampak seperti revolusi bagi orang-orang sehari-hari di 2023 sebenarnya telah digunakan secara aktif oleh bisnis besar dan media selama beberapa tahun. Bergabunglah dengan saya saat saya mengambil pandangan lebih dekat pada teknologi yang memungkinkan solusi ini, khususnya sistem AI generatif untuk pengkloning suara, manfaat bisnisnya, dan pendekatan etis untuk menggunakan AI.

Bagaimana pengkloning suara bekerja?

Secara singkat, pengkloning suara memungkinkan satu orang untuk berbicara menggunakan suara orang lain.

Ini menggunakan teknologi AI generatif untuk membuat rekaman suara seseorang dan menggunakannya untuk menghasilkan konten audio baru dengan suara yang sama. Ini pada dasarnya memungkinkan orang untuk mendengar apa yang akan dikatakan seseorang, bahkan jika mereka tidak mengatakannya sendiri.

Di sisi teknis, hal-hal tidak tampak terlalu rumit. Tapi jika Anda menyelami sedikit lebih dalam, ada beberapa persyaratan minimum untuk memulai:

Anda memerlukan setidaknya 5 menit rekaman audio berkualitas tinggi dari suara sumber untuk mengkloningnya. Rekaman ini harus jernih dan bebas dari noise latar atau distorsi lainnya, karena setiap kekurangan dapat mempengaruhi akurasi output model.
Setelah itu, umpan rekaman ini ke dalam model AI generatif untuk membuat “avatar suara.”
Kemudian, latih model untuk mereproduksi pola ucapan dengan akurasi dalam nada dan waktu.
Setelah selesai, model yang dilatih ini dapat menghasilkan konten tak terbatas menggunakan suara sumber dari orang lain, menjadi alat yang efektif untuk menciptakan suara replika yang realistis.

Ini adalah titik di mana banyak orang mengangkat kekhawatiran etis. Apa yang terjadi ketika kita dapat memasukkan teks apa pun ke dalam mulut orang lain dan mustahil untuk mengetahui apakah kata-kata tersebut asli atau palsu?

Ya, kemungkinan ini telah lama menjadi kenyataan. Seperti halnya OpenAI dan ChatGPT, kita saat ini menghadapi sejumlah masalah etis yang tidak dapat diabaikan.

Standar etis dalam AI

Seperti banyak teknologi baru lainnya di tahap awal adopsinya, ancaman utama adalah menciptakan stigma negatif around teknologi tersebut daripada mengakui ancaman sebagai sumber untuk diskusi dan pengetahuan yang berharga. Yang penting adalah mengungkap metode yang digunakan oleh aktor jahat untuk menyalahgunakan teknologi dan produknya, menerapkan alat mitigasi, dan terus belajar.

Hari ini kita memiliki tiga lapis kerangka untuk standar etis yang terkait dengan penggunaan AI generatif. Lapisan regulasi nasional dan supranasional masih dalam tahap awal pengembangan. Dunia kebijakan mungkin tidak dapat mengikuti kecepatan pengembangan teknologi yang muncul, tapi kita sudah dapat melihat Uni Eropa memimpin dengan Usulan Regulasi AI Uni Eropa dan Kode Praktik 2022 tentang Disinformasi yang menguraikan harapan untuk perusahaan besar teknologi untuk menangani penyebaran konten AI yang dimanipulasi. Pada tingkat nasional, kita melihat langkah-langkah regulasi pertama oleh AS dan Inggris dalam menangani masalah dengan National Deepfake dan Digital Provenance Task Force dan Online Safety Bill.

Lapisan industri teknologi bergerak lebih cepat karena perusahaan dan teknolog bergerak lebih cepat dalam menerima kenyataan baru ini sehubungan dengan teknologi yang muncul dan dampaknya pada keamanan dan privasi sosial. Dialog tentang etika AI generatif sangat hidup dan telah memimpin jalan menuju pengembangan inisiatif industri untuk Kode Etik sekitar penggunaan AI generatif (misalnya Kode Etik Media Sintetis Partnership on AI) dan pernyataan etis yang dikeluarkan oleh perusahaan yang berbeda. Pertanyaannya, bagaimana membuat konduksi praktis? Dan, apakah mereka dapat mempengaruhi produk, fitur khusus, dan prosedur tim?

Setelah bekerja pada masalah ini dengan sejumlah komunitas media dan hiburan, keamanan siber, dan etika AI, saya telah merumuskan beberapa prinsip praktis untuk menangani konten AI dan suara khususnya:

Pemilik IP dan perusahaan yang menggunakan suara yang dikloning dapat menghindari banyak komplikasi potensial yang terkait dengan menggunakan suara asli dengan menandatangani perjanjian hukum.
Pemilik proyek harus mengungkapkan secara terbuka penggunaan suara yang dikloning sehingga pendengar tidak akan tertipu.
Perusahaan yang bekerja pada teknologi AI untuk suara harus mengalokasikan sebagian sumber daya untuk mengembangkan teknologi yang dapat mendeteksi dan mengidentifikasi konten yang dihasilkan AI.
Mengidentifikasi konten yang dihasilkan AI dengan tanda air memungkinkan autentikasi suara.
Setiap penyedia layanan AI harus meninjau setiap proyek dari dampaknya (tingkat sosial, bisnis, dan privasi) sebelum menyetujui untuk bekerja pada proyek tersebut.

Tentu saja, prinsip-prinsip etika dalam AI tidak akan mempengaruhi penyebaran deep fake buatan sendiri secara online. Namun, mereka akan mendorong proyek-proyek abu-abu keluar dari jangkauan pasar publik.

Pada 2021-22, suara AI digunakan dalam berbagai proyek arus utama yang memperkenalkan implikasi etis dan sosial yang besar. Ini termasuk mengkloning suara Luke Skywalker muda untuk serial Mandalorian, suara AI untuk God of War 2, dan suara Richard Nixon untuk pidato ‘In Event of Moon Disaster’.

Kepercayaan pada teknologi tumbuh di luar media dan hiburan. Bisnis tradisional di berbagai industri menggunakan suara yang dikloning dalam proyek mereka. Berikut beberapa contoh penggunaan paling menonjol.

Studi kasus industri

Pada 2023, pengkloning suara akan terus meningkat bersama dengan berbagai bisnis yang siap memanfaatkan manfaatnya. Dari kesehatan dan pemasaran hingga layanan pelanggan dan industri periklanan, pengkloning suara merevolusi cara organisasi membangun hubungan dengan klien dan memperlancar alur kerja mereka.

Pengkloning suara memberikan manfaat bagi para profesional kesehatan dan pekerja sosial yang bekerja dalam lingkungan online. Avatar digital yang menampilkan suara yang sama dengan para profesional kesehatan memupuk ikatan yang lebih kuat antara mereka dan pasien, meningkatkan kepercayaan dan mempertahankan klien.

Aplikasi potensial dari pengkloning suara dalam industri film dan hiburan sangat luas. Mendubbing konten ke dalam beberapa bahasa, penggantian dialog tambahan untuk anak-anak dan dewasa, dan berbagai pilihan kustomisasi yang hampir tak terbatas semuanya dimungkinkan oleh teknologi ini.

Demikian pula, di sektor operasional, pengkloning suara yang didorong AI dapat menghasilkan hasil yang sangat baik untuk merek yang membutuhkan solusi yang efisien biaya untuk sistem respons suara interaktif atau video pelatihan perusahaan. Dengan teknologi sintesis suara, aktor dapat memperluas jangkauan mereka sambil meningkatkan kemampuan mereka untuk mendapatkan royalti dari rekaman.

Akhirnya, di studio produksi iklan, munculnya pengkloning suara telah membantu mengurangi biaya dan jumlah jam yang terkait dengan produksi iklan. Selama ada rekaman berkualitas tinggi yang tersedia untuk dikloning (bahkan dari aktor yang tidak tersedia), iklan dapat diproduksi dengan cepat dan lebih kreatif daripada sebelumnya.

Menariknya, perusahaan dan UKM dapat memanfaatkan pengkloning suara untuk menciptakan sesuatu yang unik untuk merek mereka. Proyek besar dapat mewujudkan rencana ambisius mereka, sementara bisnis kecil dapat mengakses model skala yang sebelumnya tidak terjangkau. Itulah yang dimaksud dengan demokratisasi yang sebenarnya.

Mengakhiri

Pengkloning suara AI menawarkan manfaat yang mengubah permainan bagi bisnis seperti menciptakan pengalaman pelanggan yang unik, mengintegrasikan kemampuan pemrosesan bahasa alami ke dalam produk dan layanan mereka, dan menghasilkan tiruan suara yang sangat akurat yang terdengar sangat nyata.

Bisnis yang ingin mempertahankan keunggulan kompetitif mereka pada 2023 harus melihat ke dalam pengkloning suara AI. Perusahaan dapat menggunakan teknologi ini untuk membuka berbagai kemungkinan baru untuk memenangkan pangsa pasar dan mempertahankan klien sambil melakukan itu dengan cara yang etis dan bertanggung jawab.

Anna Bulakh

Anna adalah Kepala Etika dan Kemitraan di Respeecher, teknologi pengkloning suara yang telah memenangkan Emmy dan berbasis di Ukraina. Anna adalah mantan Penasihat Kebijakan di Reface, aplikasi media sintetis yang ditenagai AI dan co-pendiri teknis alat kontra disinformasi Cappture yang didanai oleh program akselerator Startup Wise Guys. Anna memiliki 11 tahun pengalaman dalam kebijakan keamanan dan pertahanan, teknologi, dan pembangunan ketahanan. Ia adalah mantan Fellow Penelitian di Pusat Internasional untuk Pertahanan dan Keamanan di Tallinn dan Institut Studi Keamanan Praha. Ia juga telah memberikan saran kepada perusahaan Ukraina besar tentang pembangunan ketahanan sebagai bagian dari Hybrid warfare Task Force di Kyiv School of Economics.

Unite.AI

Bagaimana Menggunakan Suara AI Generatif Secara Etis Untuk Bisnis di 2023

Bagaimana pengkloning suara bekerja?

Standar etis dalam AI

Studi kasus industri

Mengakhiri

You may like