Connect with us

Pemimpin pemikiran

Masa Depan Podcasting adalah AI

mm

Secara kasar, sekitar 22.000 podcast baru diluncurkan dalam sebulan. Ada sekitar 2,5 juta (lebih dari 71 juta episode) di direktori Apple Podcasts saat ini, menurut Podcast Industry Insights. Dan itu hanya podcast yang kita ketahui.

“Banyak podcaster tidak lagi menggunakan platform besar sekarang. Mereka langsung ke pendengar, menjual konten premium dan memiliki kesuksesan besar,” kata Andy Taylor, mantan BBC Radio dan pendiri konsultan R&D Bwlb yang berbasis di Cardiff.

Dan itu belum termasuk volume konten podcast-like yang terus tumbuh, baik yang dibuat oleh merek untuk promosi atau produser acara yang ingin, misalnya, membuat pembicaraan tersedia secara on-demand. Setiap konten perlu diproduksi dan didistribusikan, baik oleh profesional audio atau orang-orang yang belajar kerajinan. Oleh karena itu, semakin banyak mereka dapat mengotomatisasi produksi, semakin mereka dapat fokus pada konten.

“Tempat-tempat audio diterbitkan telah meledak,” jelas Jonathan Wyner, kepala insinyur di M Works Mastering dan profesor di Berklee College of Music di Boston. “Dengan semua konteks, ada motivasi dan keharusan nyata bagi kreator untuk lebih serba guna.”

Tidak untuk menyebutkan, lebih produktif dan efisien.

Munculnya AI

Kecerdasan buatan (AI) — perangkat lunak yang dapat mengotomatisasi tugas-tugas yang sebelumnya dilakukan oleh manusia — memegang kunci untuk menangani tsunami konten podcast. Tidak hanya AI dapat mempercepat produksi, tetapi juga dapat membuat podcast terdengar lebih baik dan mempersiapkan panggung untuk pengalaman audio masa depan.

“AI secara dasar membantu mengurus tugas-tugas berulang untuk mempercepat alur kerja podcaster,” jelas Manos Chourdakis, insinyur peneliti di Nomono, yang mengembangkan alat podcasting berbasis AI. “Misalnya, dengan AI, Anda tidak perlu mendengarkan podcast secara keseluruhan untuk menemukan di mana seseorang mengatakan sesuatu yang salah, lalu menggantinya atau menghapusnya. Anda dapat melakukannya sendiri, tetapi AI melakukannya lebih cepat.”

Kemudian ada tugas-tugas yang hanya dapat diselesaikan dengan AI — setidaknya dalam skala, seperti menghapus kebisingan atau meningkatkan dialog. “Peningkatan dialog berkualitas baik tidak mungkin tanpa AI,” kata Chourdakis. “Setidaknya tidak mungkin dalam waktu yang wajar menggunakan alat tradisional.”

Perfect untuk Tugas-Tugas Menial

Aplikasi AI dalam podcasting bervariasi seperti tugas-tugas produksi. Beberapa dibangun langsung ke dalam platform podcast. Ketika kreator mengunggah podcast mereka ke platform hosting Podcast.co, sistem secara otomatis “mendengarkan” file audio dan menormalkan tingkat suara.

“Setiap alat yang dapat membantu mengurangi tugas-tugas yang membosankan adalah hal yang baik,” kata Mike Cunsolo, co-founder platform. Cunsolo juga menjalankan Cue, perusahaan produksi podcast yang bekerja dengan merek korporat, dan Matchmaker.fm, yang menghubungkan produser podcast dengan tamu. “Anda akan selalu membutuhkan elemen keahlian manusia, tetapi segera mesin dapat belajar untuk memahami apa yang membuat podcast menarik dan mengurangi waktu tugas.”

Penyedia solusi Descript menerapkan AI pada banyak aspek rekayasa podcast, termasuk penghapusan kebisingan dan kontrol gema. Salah satu tugas yang lebih “membosankan” yang dapat ditangani Descript adalah nada ruangan.

“Terkadang produser perlu memasukkan keheningan digital ke dalam podcast. Mungkin antara edit atau untuk menarik jarak antara kalimat,” kata Jay LeBoeuf, kepala bisnis dan pengembangan korporat di Descript. “Tapi itu terdengar sangat tidak alami.”

Jika produser tidak merekam nada ruangan saat podcast direkam, mereka mungkin perlu kembali dan mendapatkannya. Atau mereka dapat mendengarkannya dalam rekaman, menyalin dan menempelkan di mana diperlukan, lalu mengedit hasilnya untuk membuatnya terdengar alami.

Atau komputer dapat menanganinya. Generator nada ruangan berbasis AI Descript menganalisis rekaman, mengidentifikasi nada ruangan, dan secara otomatis mensintesisnya di mana diperlukan. Teknologi seperti ini tidak hanya menghilangkan tugas-tugas menial, tetapi juga memungkinkan fleksibilitas produksi yang lebih besar.

“AI akan memungkinkan kita untuk menggunakan perangkat keras yang lebih murah, ruangan yang terdengar lebih buruk, dan lokasi yang lebih berisik dan masih mendapatkan hasil yang baik,” kata Chourdakis dari Nomono.

Kemampuan Berbasis AI Baru

AI juga membuka pintu untuk inovasi dalam podcasting — menciptakan solusi baru yang meningkatkan standar untuk podcaster dan pendengar. Misalnya, alat Epidemic Audio Reference (EAR) membantu podcaster menemukan musik bebas hak cipta berdasarkan lagu yang mereka sukai.

“Katakanlah Anda mencari musik intro atau outro, dan Anda berpikir tentang lagu tertentu, tetapi itu dilindungi oleh hak cipta,” kata Chourdakis. “Sistem menggunakan AI di balik layar untuk membantu Anda menemukan sesuatu yang serupa.”

Di Bwlb, tim Taylor mengembangkan Accordion, solusi berbasis AI yang dapat mengambil podcast dan mereproduksinya dalam berbagai panjang.

“Setiap bagian lain dari kehidupan kita menjadi lebih pintar — rumah pintar, kulkas pintar,” kata Taylor. “Orang ingin lebih banyak kontrol dan kenyamanan dari pengalaman podcast mereka juga.”

Ketika Taylor bekerja pada dokumenter untuk BBC, dia akan diminta untuk membuat versi yang lebih pendek untuk dijalankan di platform yang berbeda. Prosesnya selalu manual. Accordion menerapkan algoritma perangkat lunak pada konten podcast untuk menciptakan versi dengan panjang yang berbeda secara cerdas. “Itu tidak mempercepat apa pun,” kata Taylor, “tetapi itu memberikan pengguna kontrol atas durasi konten tanpa kehilangan struktur nada atau keterdengaran.”

Mengarahkan Fokus pada Cerita Imersif

Semakin banyak podcaster menggunakan alat AI, semakin baik mereka menjadi. Dengan kata lain, semakin banyak data yang mereka konsumsi, semakin banyak mereka belajar.

Algoritma peningkatan dialog Nomono didasarkan pada dataset besar rekaman suara — beberapa bersih dan dapat dipahami, beberapa kurang — yang mengajarkan alat AI cara menghasilkan suara yang lebih baik. “Podcaster tidak perlu memiliki pengetahuan audio lanjutan untuk menghasilkan audio berkualitas tinggi,” kata Chourdakis. “Dengan mengotomatisasi beberapa tugas ini, mereka dapat menghabiskan lebih banyak waktu untuk fokus pada cerita yang hebat, dan kurang waktu pada tugas-tugas pembersihan yang membosankan.”

Dan di masa depan, mereka dapat berkembang lebih mudah untuk menciptakan genre podcast imersif dan spasial baru. Misalnya, teknologi Nomono memungkinkan produksi audio berbasis objek, yang memungkinkan produser untuk “meletakkan” suara di dalam lanskap suara 3D atau menciptakan versi dinamis yang dapat disesuaikan dengan pendengar.

“Produksi media sekarang memasuki fase di mana jika Anda dapat membayangkannya, itu dapat terjadi,” kata LeBoeuf dari Descript. “Dan Anda tidak perlu memiliki studio yang mahal atau pelatihan selama beberapa dekade untuk mencapai tujuan Anda.”

Brad Grimes adalah seorang jurnalis teknologi yang berpengalaman dan mantan direktur komunikasi Asosiasi Pengalaman Audiovisual dan Terintegrasi.