Lãnh đạo tư tưởng

Tương lai của Podcasting là Trí tuệ Nhân tạo

Đã xuất bản 2 tháng 11, 2022

Đã cập nhật 23 tháng 5, 2026

Brad Grimes

Nói một cách粗略, khoảng 22.000 podcast mới được ra mắt mỗi tháng. Hiện tại, có gần 2,5 triệu podcast (hơn 71 triệu tập) trong thư mục Apple Podcasts, theo Podcast Industry Insights. Và những con số đó chỉ là những gì chúng ta biết.

“Nhiều podcaster không còn đi qua các nền tảng lớn nữa. Họ đang đi trực tiếp đến người nghe, bán nội dung cao cấp và có thành công lớn,” nói Andy Taylor, cựu nhân viên của BBC Radio và người sáng lập công ty tư vấn R&D Bwlb có trụ sở tại Cardiff.

Và đó không phải là tất cả về lượng nội dung podcast-like ngày càng tăng, cho dù được tạo ra bởi các thương hiệu để quảng cáo hay bởi các nhà sản xuất sự kiện muốn, ví dụ, làm cho các bài nói có sẵn theo yêu cầu. Mỗi mảnh nội dung cần được sản xuất và phân phối, cho dù bởi các chuyên gia âm thanh hay những người mới học nghề. Do đó, càng nhiều họ có thể tự động hóa các phần lớn của quá trình sản xuất, họ càng có thể tập trung vào nội dung.

“Các nơi khác nhau mà âm thanh được xuất bản đã bùng nổ,” giải thích Jonathan Wyner, kỹ sư trưởng tại M Works Mastering và là giáo sư tại Trường Âm nhạc Berklee ở Boston. “Với tất cả những ngữ cảnh đó, có một động lực và mệnh lệnh thực sự để các nhà sáng tạo trở nên đa năng hơn.”

Không kể đến, hiệu quả và năng suất hơn.

Sự trỗi dậy của Trí tuệ Nhân tạo

Trí tuệ nhân tạo (AI) – phần mềm có thể tự động hóa các nhiệm vụ trước đây do con người thực hiện – nắm giữ chìa khóa để xử lý lượng nội dung podcast khổng lồ. Không chỉ AI có thể tăng tốc sản xuất, mà nó còn có thể làm cho podcast nghe tốt hơn và đặt nền móng cho các trải nghiệm âm thanh của ngày mai.

“AI cơ bản giúp chăm sóc các nhiệm vụ lặp đi lặp lại để đẩy nhanh quy trình làm việc của podcaster,” giải thích Manos Chourdakis, kỹ sư nghiên cứu tại Nomono, công ty phát triển các công cụ podcasting dựa trên AI. “Ví dụ, với AI, bạn không cần phải nghe toàn bộ podcast để tìm nơi ai đó nói sai, sau đó thay thế hoặc loại bỏ nó. Bạn có thể làm điều đó mình, nhưng AI làm nhanh hơn.”

Sau đó có những công việc chỉ có thể được thực hiện với AI – ít nhất là với quy mô, chẳng hạn như loại bỏ tiếng ồn hoặc tăng cường hội thoại. “Tăng cường hội thoại chất lượng tốt sẽ là không thể nếu không có AI,” Chourdakis nói. “Ít nhất là không thể trong một khoảng thời gian hợp lý bằng cách sử dụng các công cụ truyền thống.”

Hoàn hảo cho các Nhiệm vụ Nhàn rỗi

Các ứng dụng của AI trong podcasting đa dạng như các nhiệm vụ sản xuất. Một số được tích hợp trực tiếp vào các nền tảng podcast. Khi các nhà sáng tạo tải podcast của họ lên nền tảng lưu trữ Podcast.co, hệ thống sẽ tự động “nghe” các tệp âm thanh và chuẩn hóa mức âm lượng.

“Bất kỳ công cụ nào có thể giúp giảm bớt các phần nhàm chán của công việc đều là một điều tốt,” nói Mike Cunsolo, người đồng sáng lập nền tảng. Cunsolo cũng điều hành Cue, một công ty sản xuất podcast làm việc với các thương hiệu doanh nghiệp, và Matchmaker.fm, kết nối các nhà sản xuất podcast với khách mời. “Bạn sẽ luôn cần yếu tố chuyên môn của con người, nhưng sớm thôi, máy móc có thể học cách hiểu những gì làm cho một podcast thú vị và giảm thời gian thực hiện nhiệm vụ.”

Nhà cung cấp giải pháp Descript áp dụng AI cho nhiều khía cạnh của kỹ thuật podcast, bao gồm loại bỏ tiếng ồn và kiểm soát tiếng vang. Một trong những công việc “nhàm chán” mà Descript có thể xử lý là âm thanh phòng.

“Đôi khi các nhà sản xuất cần chèn im lặng kỹ thuật số vào podcast. Có thể giữa các bản chỉnh sửa hoặc để kéo dài khoảng cách giữa các câu,” nói Jay LeBoeuf, người đứng đầu kinh doanh và phát triển doanh nghiệp tại Descript. “Nhưng điều đó nghe rất không tự nhiên.”

Nếu các nhà sản xuất không thu được âm thanh phòng khi podcast được ghi, họ có thể phải quay lại và lấy nó. Hoặc họ có thể nghe nó trong bản ghi, sao chép và dán nơi cần, sau đó chỉnh sửa kết quả để nó hòa quyện tự nhiên.

Hoặc máy tính có thể xử lý nó. Trình tạo âm thanh phòng dựa trên AI của Descript phân tích bản ghi, xác định âm thanh phòng và tự động tổng hợp nó khi cần. Công nghệ như vậy không chỉ loại bỏ các nhiệm vụ nhàm chán, mà còn cho phép linh hoạt hơn trong sản xuất.

“AI sẽ cho phép chúng ta sử dụng phần cứng ít tốn kém hơn, phòng thu có âm thanh kém hơn và vị trí ồn ào hơn và vẫn có được kết quả tốt,” nói Chourdakis của Nomono.

Các Khả năng Dựa trên Trí tuệ Nhân tạo Mới

AI cũng mở ra cánh cửa cho sự đổi mới trong podcasting – tạo ra các giải pháp mới nâng cao tiêu chuẩn cho các podcaster và người nghe. Ví dụ, công cụ Tham chiếu Âm thanh Dịch (EAR) giúp các podcaster tìm nhạc không có bản quyền dựa trên các bài hát họ thích.

“Hãy nói bạn đang tìm kiếm nhạc cho phần giới thiệu hoặc kết thúc, và bạn đang nghĩ về một bài hát cụ thể, nhưng nó được bảo vệ bởi bản quyền,” nói Chourdakis. “Hệ thống sử dụng AI để giúp bạn tìm kiếm điều gì đó tương tự.”

Tại Bwlb, nhóm của Taylor đã phát triển Accordion, một giải pháp dựa trên AI có thể lấy một podcast và tái tạo nó với các độ dài khác nhau.

“Mỗi phần khác của cuộc sống chúng ta đang trở nên thông minh hơn – ngôi nhà thông minh, tủ lạnh thông minh,” Taylor nói. “Người dùng muốn có nhiều quyền kiểm soát và tiện lợi hơn từ trải nghiệm podcast của họ.”

Khi Taylor làm việc trên các tài liệu cho BBC, anh sẽ được yêu cầu tạo các phiên bản ngắn hơn để chạy trên các nền tảng khác nhau. Quá trình này luôn được thực hiện thủ công. Accordion áp dụng các thuật toán phần mềm vào nội dung podcast để tạo ra các phiên bản thông minh với các độ dài khác nhau. “Nó không tăng tốc bất cứ điều gì,” Taylor nói, “nhưng nó cho người dùng quyền kiểm soát thời lượng nội dung mà không mất đi cấu trúc âm thanh hoặc khả năng nghe.”

Đặt sự tập trung vào Câu chuyện Truyền thông Ngập

Càng nhiều podcaster sử dụng các công cụ AI, chúng càng trở nên tốt hơn. Nói cách khác, càng nhiều dữ liệu chúng tiêu thụ, chúng càng học hỏi.

Thuật toán tăng cường hội thoại của Nomono dựa trên các tập dữ liệu lớn về bản ghi giọng nói – một số sạch sẽ và thông minh, một số ít hơn – những thứ dạy cho các công cụ AI cách tạo ra âm thanh tốt hơn. “Các podcaster không nên cần kiến thức âm thanh nâng cao để sản xuất âm thanh chất lượng cao,” nói Chourdakis. “Bằng cách tự động hóa một số nhiệm vụ này, họ có thể dành nhiều thời gian hơn để tập trung vào việc kể chuyện tuyệt vời và ít thời gian hơn cho các nhiệm vụ dọn dẹp nhàm chán.”

Và trong tương lai, họ có thể tiến hóa dễ dàng hơn để tạo ra một thể loại podcast ngập mới. Ví dụ, công nghệ của Nomono cho phép sản xuất âm thanh dựa trên đối tượng, cho phép các nhà sản xuất “đặt” giọng nói trong không gian âm thanh 3D hoặc tạo ra các phiên bản động có thể được tùy chỉnh cho người nghe.

“Sản xuất truyền thông hiện đang bước vào một giai đoạn mà nếu bạn có thể mơ ước, nó có thể xảy ra,” nói LeBoeuf của Descript. “Và bạn không còn cần một phòng thu đắt tiền hoặc nhiều thập kỷ đào tạo để đạt được mục tiêu của mình.”

Brad Grimes

Brad Grimes là một nhà báo công nghệ lâu năm và là cựu giám đốc truyền thông của Hiệp hội Trải nghiệm Âm thanh và Tích hợp.

Unite.AI

Tương lai của Podcasting là Trí tuệ Nhân tạo

Sự trỗi dậy của Trí tuệ Nhân tạo

Hoàn hảo cho các Nhiệm vụ Nhàn rỗi

Các Khả năng Dựa trên Trí tuệ Nhân tạo Mới

Đặt sự tập trung vào Câu chuyện Truyền thông Ngập

You may like