Connect with us

Tương lai của Podcasting là Trí tuệ nhân tạo

Lãnh đạo tư tưởng

Tương lai của Podcasting là Trí tuệ nhân tạo

mm

Nói một cách粗略, khoảng 22.000 podcast mới được ra mắt trong một tháng. Hiện tại, có gần 2,5 triệu (hơn 71 triệu tập) trong thư mục Apple Podcasts, theo Podcast Industry Insights. Và những điều đó chỉ là những gì chúng ta biết.

“Nhiều podcaster khôngeven đi qua các nền tảng lớn nữa. Họ đang đi trực tiếp đến người nghe của họ, bán nội dung cao cấp và có thành công lớn,” nói Andy Taylor, trước đây của BBC Radio và người sáng lập công ty tư vấn R&D Bwlb có trụ sở tại Cardiff.

Và đó là chưa kể đến khối lượng ngày càng tăng của nội dung giống podcast, cho dù được tạo bởi các thương hiệu để quảng bá hay các nhà sản xuất sự kiện muốn, ví dụ, làm cho các buổi nói chuyện có sẵn theo yêu cầu. Mỗi mảnh nội dung cần được sản xuất và phân phối, cho dù bởi các chuyên gia âm thanh hay những người học nghề. Do đó, càng nhiều họ có thể tự động hóa các phần lớn của sản xuất, họ càng có thể tập trung vào nội dung.

“Các nơi khác nhau mà âm thanh được xuất bản đã bùng nổ,” giải thích Jonathan Wyner, kỹ sư trưởng tại M Works Mastering và là giáo sư tại Berklee College of Music ở Boston. “Với tất cả các ngữ cảnh đó, có một động lực và yêu cầu thực sự để các nhà sáng tạo trở nên đa năng hơn.”

Không kể đến, nhiều hơn và hiệu quả hơn.

Sự trỗi dậy của Trí tuệ nhân tạo

Trí tuệ nhân tạo (AI) — phần mềm có thể tự động hóa các nhiệm vụ trước đây được thực hiện bởi con người — nắm giữ chìa khóa để xử lý sóng thần của nội dung podcast. Không chỉ AI có thể tăng tốc sản xuất, nó còn có thể làm cho podcast nghe tốt hơn và đặt nền móng cho các trải nghiệm âm thanh của ngày mai.

“AI cơ bản giúp chăm sóc các nhiệm vụ lặp đi lặp lại để đẩy nhanh quy trình làm việc của podcaster,” giải thích Manos Chourdakis, kỹ sư nghiên cứu tại Nomono, công ty phát triển các công cụ podcasting dựa trên AI. “Ví dụ, với AI, bạn không cần phải nghe toàn bộ podcast để tìm nơi ai đó nói sai, sau đó thay thế hoặc xóa nó. Bạn có thể làm điều đó mình, nhưng AI làm điều đó nhanh hơn.”

Sau đó có các nhiệm vụ chỉ có thể được thực hiện với AI — ít nhất là ở quy mô, chẳng hạn như loại bỏ tiếng ồn hoặc tăng cường đối thoại. “Tăng cường đối thoại chất lượng tốt sẽ là không thể nếu không có AI,” Chourdakis nói. “Ít nhất là không thể trong một khoảng thời gian hợp lý sử dụng các công cụ truyền thống.”

Hoàn hảo cho các nhiệm vụ nhàm chán

Các ứng dụng của AI trong podcasting đa dạng như các nhiệm vụ sản xuất. Một số được tích hợp trực tiếp vào các nền tảng podcast. Khi các nhà sáng tạo tải podcast của họ lên nền tảng lưu trữ Podcast.co, hệ thống sẽ tự động “nghe” các tệp âm thanh và chuẩn hóa mức âm lượng.

“Bất kỳ công cụ nào có thể giúp giảm các phần nhàm chán của công việc là một điều tốt,” nói Mike Cunsolo, đồng sáng lập nền tảng. Cunsolo cũng điều hành Cue, một công ty sản xuất podcast làm việc với các thương hiệu doanh nghiệp, và Matchmaker.fm, kết nối các nhà sản xuất podcast với khách mời. “Bạn sẽ luôn cần yếu tố chuyên môn của con người, nhưng sớm máy móc có thể học cách hiểu những gì làm cho một podcast thú vị và giảm thời gian trên nhiệm vụ.”

Nhà cung cấp giải pháp Descript áp dụng AI vào nhiều khía cạnh của kỹ thuật podcast, bao gồm loại bỏ tiếng ồn và kiểm soát tiếng vang. Một trong những nhiệm vụ “nhàm chán” hơn mà Descript có thể xử lý là âm thanh phòng.

“Đôi khi các nhà sản xuất cần chèn im lặng kỹ thuật số vào một podcast. Có thể giữa các bản chỉnh sửa hoặc để kéo dài khoảng cách giữa các câu,” nói Jay LeBoeuf, người đứng đầu kinh doanh và phát triển doanh nghiệp tại Descript. “Nhưng điều đó nghe có vẻ không tự nhiên.”

Nếu các nhà sản xuất không thu được âm thanh phòng khi một podcast được ghi, họ có thể phải quay lại và lấy nó. Hoặc họ có thể nghe nó trong bản ghi, sao chép và dán nơi cần, sau đó chỉnh sửa kết quả để làm cho nó hòa trộn tự nhiên.

Hoặc máy tính có thể xử lý nó. Trình tạo âm thanh phòng dựa trên AI của Descript phân tích bản ghi, xác định âm thanh phòng và tự động tổng hợp nó nơi cần. Công nghệ như vậy không chỉ loại bỏ các nhiệm vụ nhàm chán, mà còn cho phép linh hoạt hơn trong sản xuất.

“AI sẽ cho phép chúng tôi sử dụng phần cứng ít tốn kém hơn, phòng có âm thanh kém hơn và vị trí ồn ào hơn và vẫn có được kết quả tốt,” nói Chourdakis của Nomono.

Các khả năng mới dựa trên AI

AI cũng mở ra cánh cửa cho sự đổi mới trong podcasting — tạo ra các giải pháp mới nâng cao tiêu chuẩn cho các podcaster và người nghe. Ví dụ, công cụ Tham chiếu âm thanh Dịch (EAR) giúp các podcaster tìm nhạc không có bản quyền dựa trên các bài hát họ thích.

“Giả sử bạn đang tìm kiếm nhạc cho phần giới thiệu hoặc kết thúc, và bạn đang nghĩ về một bài hát cụ thể, nhưng nó được bảo vệ bởi bản quyền,” nói Chourdakis. “Hệ thống sử dụng AI để giúp bạn tìm thứ gì đó tương tự.”

Tại Bwlb, nhóm của Taylor đã phát triển Accordion, một giải pháp dựa trên AI có thể lấy một podcast và tái tạo nó ở các độ dài khác nhau.

“Mỗi phần khác của cuộc sống chúng ta đang trở nên thông minh hơn — nhà thông minh, tủ lạnh thông minh,” Taylor nói. “Người dân muốn có nhiều kiểm soát và tiện lợi hơn từ trải nghiệm podcast của họ.”

Khi Taylor làm việc trên các tài liệu cho BBC, anh sẽ được yêu cầu tạo các phiên bản ngắn hơn để chạy trên các nền tảng khác nhau. Quá trình luôn được thực hiện thủ công. Accordion áp dụng các thuật toán phần mềm vào nội dung podcast để thông minh tạo ra các phiên bản có độ dài khác nhau. “Nó không tăng tốc bất cứ điều gì,” Taylor nói, “nhưng nó cho người dùng kiểm soát thời lượng nội dung mà không mất đi cấu trúc hoặc khả năng nghe.”

Đặt trọng tâm vào việc kể chuyện lôi cuốn

Càng nhiều podcaster sử dụng các công cụ AI, họ càng trở nên tốt hơn. Nói cách khác, càng nhiều dữ liệu họ tiêu thụ, họ càng học hỏi.

Các thuật toán tăng cường đối thoại của Nomono dựa trên các tập dữ liệu lớn về bản ghi âm giọng nói — một số sạch sẽ và thông minh, một số ít hơn — những điều đó dạy cho các công cụ AI cách tạo ra âm thanh tốt hơn. “Các podcaster không nên cần kiến thức âm thanh tiên tiến để sản xuất âm thanh chất lượng cao,” nói Chourdakis. “Bằng cách tự động hóa một số nhiệm vụ này, họ có thể dành nhiều thời gian hơn để tập trung vào việc kể chuyện tuyệt vời và ít thời gian hơn cho các nhiệm vụ dọn dẹp nhàm chán.”

Và trong tương lai, họ có thể tiến hóa dễ dàng hơn để tạo ra một thể loại mới của podcast không gian lôi cuốn. Ví dụ, công nghệ của Nomono cho phép sản xuất âm thanh dựa trên đối tượng, cho phép các nhà sản xuất “đặt” giọng nói trong một không gian âm thanh 3D hoặc tạo ra các phiên bản động có thể được tùy chỉnh cho người nghe.

“Sản xuất truyền thông hiện đang bước vào một giai đoạn mà nếu bạn có thể mơ ước, nó có thể xảy ra,” nói LeBoeuf của Descript. “Và bạn không còn cần phải có một phòng thu đắt tiền hoặc nhiều thập kỷ đào tạo để đạt được mục tiêu của mình.”

Brad Grimes là một nhà báo công nghệ lâu năm và là cựu giám đốc truyền thông của Hiệp hội Trải nghiệm Âm thanh và Tích hợp.