Kecerdasan buatan

Pengembang Game Menggunakan Voice AI untuk Membuka Peluang Kreatif Baru

Published September 16, 2020

Updated April 28, 2026

Daniel Nelson

Teknologi sintesis suara, terutama sintesis ucapan, telah menjadi lebih canggih dalam beberapa tahun terakhir. Sementara teknologi text-to-speech telah ada selama beberapa dekade, teknologi ini telah menjadi lebih alami dalam suaranya. Algoritma terbaru dapat mengambil hanya beberapa jam audio dan mensintesis sampel audio yang sangat realistis. Ketika teknologi ini berkembang, lebih banyak aplikasi terbuka, termasuk kemungkinan dalam media kreatif. Baru-baru ini, seperti yang dilaporkan oleh VentureBeat, perusahaan game telah mulai menyelidiki penggunaan generasi suara AI untuk menghasilkan dialog untuk game video.

Salah satu perusahaan, Leviathan Games, telah memulai implementasi voice AI dalam game yang mereka kembangkan saat ini. Wyeth Ridgway, pemilik Leviathan Games, menjelaskan bahwa voice AI dapat mengubah desain game dengan cara yang dramatis. Ridgway menjelaskan bahwa penggunaan voice AI dalam desain game adalah tren yang muncul, dan membandingkannya dengan bagaimana perangkat lunak animasi 3D telah bergeser selama beberapa dekade terakhir, dengan perusahaan seperti Pixar menciptakan perangkat lunak proprietary yang dimaksudkan untuk memfasilitasi animasi dan modeling.

Metode tradisional untuk menghasilkan ucapan beroperasi dengan menggabungkan file suara yang telah direkam sebelumnya bersama-sama, menjahit kalimat bersama dari kata dan frasa yang telah ada sebelumnya. Metode ini memerlukan perekaman ratusan jam worth dialog dan pelabelan manual klip suara. Ini juga terdengar sedikit tidak alami karena intonasi dan penekanan cenderung bergeser di seluruh kata. Dibandingkan dengan itu, voice AI yang canggih terdengar jauh lebih alami dan beroperasi dengan cara yang berbeda.

Voice AI didasarkan pada jaringan neural dalam. WaveNet adalah salah satu AI pertama yang dapat menghasilkan sampel audio yang meyakinkan dan terdengar alami. Karena sampel suara dihasilkan dari awal, tidak ada kebutuhan untuk merekam ratusan jam dialog, selama data pelatihan yang cukup tersedia. GAN dan model LSTM yang dioptimalkan dapat menghasilkan audio setelah dilatih pada beberapa jam audio yang dilabeli. Hasilnya dapat sangat meyakinkan, seperti ketika eksperimen Google Duplex menelepon salon rambut untuk membuat janji.

Ketika teknologi ini menjadi lebih kuat, standar, dan mudah diakses melalui komputasi awan, kemungkinan besar lebih banyak pengembang game akan menggunakan voice AI untuk mengurangi waktu dan biaya produksi. Beberapa perusahaan sudah menciptakan model yang dapat digunakan oleh pengembang game. Replica Studios mengkhususkan diri dalam teknologi suara AI, dan beberapa sampel audio yang dihasilkan oleh teknologi mereka dapat didengar di tautan di sini dan di sini.

Tidak mungkin bahwa pengembang game akan memilih untuk meninggalkan penggunaan aktor suara atas AI. Faktanya, voice AI dapat membuka lebih banyak peluang bagi aktor suara. Saat ini, banyak perusahaan pengembangan game sering melewatkan memiliki dialog yang diucapkan karena investasi waktu dan biaya yang terkait dengan penciptaan dialog yang diucapkan. Aktor suara sering perlu dibawa kembali untuk sesi perekaman lebih lanjut jika ada perubahan pada skrip atau jika direktur game ingin kinerja yang berbeda. Voice AI dapat digunakan untuk bereksperimen dengan/membuat prototipe dialog, mendapatkan perasaan untuk apa jenis perubahan skrip dan revisi yang perlu dibuat sebelum memanggil aktor suara profesional untuk merekam skrip. Ini dapat menyebabkan lebih banyak perusahaan memiliki sumber daya untuk berinvestasi dalam penciptaan dialog yang diucapkan.

Model suara AI bahkan dapat dilatih pada suara aktor suara tertentu, dan AI digunakan untuk menghasilkan klip dialog yang sepele, selama aktor dibayar untuk penggunaan suaranya. Seperti yang dilaporkan oleh VentureBeat, aktor suara seperti Simon J. Smith, optimis tentang penggunaan model suara AI yang meningkat dan potensinya untuk membuka peluang akting suara baru.

Selain penggunaan voice AI untuk membuat prototipe skrip atau menciptakan baris yang diucapkan untuk karakter minor, pengembang game juga dapat menggunakan voice AI untuk memberi pemain lebih banyak pilihan kustomisasi untuk game peran. Saat ini, bahkan game yang memungkinkan pemain memilih suara untuk avatar mereka biasanya hanya memiliki beberapa pilihan. Dengan menggunakan voice AI, pilihan dapat secara fungsional tidak terbatas.

Related Topics:audio sound Speech speech generation voice AI

Daniel Nelson

Blogger dan programmer dengan spesialisasi di Machine Learning dan Deep Learning topik. Daniel berharap untuk membantu orang lain menggunakan kekuatan AI untuk kebaikan sosial.

Unite.AI

Pengembang Game Menggunakan Voice AI untuk Membuka Peluang Kreatif Baru

You may like