Kết nối với chúng tôi

Tương lai của Podcasting là AI

Lãnh đạo tư tưởng

Tương lai của Podcasting là AI

mm

Nói một cách đại khái, khoảng 22,000 podcast mới được tung ra trong một tháng. Hiện có gần 2.5 triệu (hơn 71 triệu tập) trong thư mục Apple Podcasts, theo Thông tin chi tiết về ngành podcast. Và đó chỉ là những thứ chúng ta biết.

Andy Taylor, cựu nhân viên của BBC Radio và là người sáng lập công ty tư vấn R&D có trụ sở tại Cardiff, cho biết: "Nhiều podcaster hiện nay thậm chí còn không sử dụng các nền tảng lớn. Họ tiếp cận trực tiếp người nghe, bán nội dung cao cấp và đạt được thành công lớn". bwlb.

Và đó là chưa kể đến khối lượng nội dung giống như podcast ngày càng tăng, cho dù được tạo bởi các thương hiệu để quảng cáo hay các nhà sản xuất sự kiện muốn cung cấp các cuộc nói chuyện theo yêu cầu chẳng hạn. Mỗi phần nội dung cần được sản xuất và phân phối, cho dù bởi các chuyên gia âm thanh hay những người đang học nghề. Do đó, họ càng có thể tự động hóa các dải sản xuất lớn thì họ càng có thể tập trung vào nội dung.

Kỹ sư trưởng của Jonathan Wyner tại M Works Mastering và là giáo sư tại Cao đẳng Âm nhạc Berklee ở Boston. “Với tất cả những bối cảnh đó, có một động lực và mệnh lệnh thực sự để người sáng tạo trở nên linh hoạt hơn.”

Chưa kể, năng suất và hiệu quả hơn.

Sự trỗi dậy của AI

Trí tuệ nhân tạo (AI) — phần mềm có thể tự động hóa các tác vụ do con người thực hiện trước đây — nắm giữ chìa khóa để xử lý cơn sóng thần nội dung podcast. AI không chỉ có thể tăng tốc độ sản xuất mà còn có thể làm cho podcast nghe hay hơn và tạo tiền đề cho trải nghiệm âm thanh trong tương lai.

Manos Chourdakis, kỹ sư nghiên cứu tại giải thích: “AI về cơ bản giúp xử lý các nhiệm vụ lặp đi lặp lại để đẩy nhanh quy trình làm việc của podcaster. nomono, phát triển các công cụ podcasting dựa trên AI. “Ví dụ, với AI, bạn không cần phải nghe toàn bộ podcast để tìm ra chỗ nào ai đó nói sai, rồi thay thế hoặc xóa nó. Bạn có thể tự làm điều đó, nhưng AI làm điều đó nhanh hơn.”

Sau đó, có những công việc chỉ có thể được thực hiện với AI — ít nhất là ở quy mô, chẳng hạn như loại bỏ tiếng ồn hoặc tăng cường đối thoại. Chourdakis nói: “Việc nâng cao chất lượng đối thoại tốt sẽ không thể thực hiện được nếu không có AI. “Ít nhất là không thể trong một khung thời gian hợp lý khi sử dụng các công cụ truyền thống.”

Hoàn hảo cho các nhiệm vụ tầm thường

Các ứng dụng của AI trong podcasting cũng đa dạng như các nhiệm vụ sản xuất. Một số được tích hợp trực tiếp vào nền tảng podcast. Khi người sáng tạo tải podcast của họ lên nền tảng lưu trữ Podcast.co, hệ thống sẽ tự động “lắng nghe” các tệp âm thanh và chuẩn hóa các mức âm thanh.

Mike Cunsolo, người đồng sáng lập nền tảng này cho biết: “Bất kỳ công cụ nào có thể giúp giảm bớt những công việc gây khó chịu cho đầu óc đều là một điều tốt. Cunsolo cũng chạy Gợi ý, một công ty sản xuất podcast làm việc với các thương hiệu của công ty và mai mối.fm, kết nối các nhà sản xuất podcast với khách. “Bạn sẽ luôn cần yếu tố chuyên môn của con người, nhưng máy móc sẽ sớm học cách hiểu điều gì làm cho một podcast trở nên thú vị và giảm thời gian thực hiện công việc.”

Nhà cung cấp giải pháp Mô tả áp dụng AI vào nhiều khía cạnh của kỹ thuật podcast, bao gồm loại bỏ tiếng ồn và kiểm soát tiếng vang. Một trong những công việc “đau đầu” hơn mà Descript có thể xử lý là tông màu phòng.

“Đôi khi các nhà sản xuất cần chèn khoảng lặng kỹ thuật số vào podcast. Jay LeBoeuf, trưởng bộ phận kinh doanh và phát triển doanh nghiệp tại Descript cho biết, có thể là giữa các lần chỉnh sửa hoặc để kéo dài khoảng cách giữa các câu. “Nhưng điều đó nghe có vẻ cực kỳ không tự nhiên.”

Nếu nhà sản xuất không nắm bắt được âm thanh phòng khi ghi podcast, họ có thể phải quay lại và lấy lại. Hoặc họ có thể nghe nó trong bản ghi âm, sao chép và dán khi cần, sau đó chỉnh sửa kết quả để làm cho nó hòa trộn một cách tự nhiên.

Hoặc máy tính có thể xử lý nó. Trình tạo âm thanh trong phòng dựa trên AI của Descript sẽ phân tích bản ghi, xác định âm thanh trong phòng và tự động tổng hợp khi cần. Công nghệ như vậy không chỉ loại bỏ các nhiệm vụ nặng nhọc mà còn cho phép sản xuất linh hoạt hơn.

Chourdakis của Nomono cho biết: “AI sẽ cho phép chúng tôi sử dụng phần cứng ít tốn kém hơn, phòng có âm thanh kém hơn và địa điểm ồn ào hơn mà vẫn đạt được kết quả tốt.

Khả năng dựa trên AI mới

AI cũng mở ra cơ hội đổi mới trong podcasting — tạo ra các giải pháp mới giúp nâng cao tiêu chuẩn cho người làm podcast và người nghe. Ví dụ: công cụ Epidemic Audio Reference (EAR) giúp các podcast tìm nhạc không có bản quyền dựa trên các bài hát họ thích.

Chourdakis nói: “Giả sử bạn đang tìm nhạc mở đầu hoặc kết thúc và bạn đang nghĩ đến một bài hát cụ thể, nhưng bài hát đó được bảo vệ bởi bản quyền. “Hệ thống sử dụng AI ẩn dưới mui xe để giúp bạn tìm thấy thứ gì đó tương tự.”

Tại Bwlb, nhóm của Taylor đã phát triển Phong cầm, một giải pháp dựa trên AI có thể lấy một podcast và tái tạo nó ở nhiều độ dài khác nhau.

Taylor nói: “Mọi phần khác trong cuộc sống của chúng ta đang trở nên thông minh hơn - nhà thông minh, tủ lạnh thông minh. “Mọi người cũng muốn kiểm soát nhiều hơn và thuận tiện hơn từ trải nghiệm podcast của họ.”

Khi Taylor làm phim tài liệu cho BBC, anh ấy được yêu cầu viết các phiên bản ngắn hơn để chạy trên các nền tảng khác nhau. Quá trình này luôn luôn là thủ công. Accordion áp dụng các thuật toán phần mềm cho nội dung podcast để tạo ra các phiên bản có độ dài khác nhau một cách thông minh. “Nó không tăng tốc độ,” Taylor nói, “nhưng nó cho phép người dùng kiểm soát thời lượng của nội dung mà không làm mất đi cấu trúc giai điệu hoặc khả năng nghe.”

Tập trung vào cách kể chuyện nhập vai

Càng nhiều podcast sử dụng các công cụ AI, họ càng trở nên tốt hơn. Nói cách khác, họ càng nhập nhiều dữ liệu, họ càng học được nhiều hơn.

Các thuật toán nâng cao đối thoại của Nomono dựa trên bộ dữ liệu lớn gồm các bản ghi âm giọng nói — một số rõ ràng và dễ hiểu, một số kém hơn — dạy cho các công cụ AI cách tạo ra âm thanh tốt hơn. Chourdakis nói: “Người phát thanh podcast không cần kiến ​​thức âm thanh nâng cao để tạo ra âm thanh chất lượng cao. “Bằng cách tự động hóa một số nhiệm vụ này, họ có thể dành nhiều thời gian hơn để tập trung vào cách kể chuyện hay và ít thời gian hơn cho các nhiệm vụ dọn dẹp tẻ nhạt.”

Và trong tương lai, chúng có thể phát triển dễ dàng hơn để tạo ra một thể loại podcast không gian, nhập vai mới. Ví dụ: công nghệ của Nomono cho phép sản xuất âm thanh dựa trên đối tượng, cho phép nhà sản xuất “đặt” giọng nói vào âm thanh 3D hoặc tạo các phiên bản động có thể điều chỉnh cho người nghe.

LeBoeuf của Descript cho biết: “Việc sản xuất phương tiện truyền thông hiện đang bước vào giai đoạn mà nếu bạn có thể mơ thì điều đó có thể xảy ra. “Và bạn không còn cần phải có một phòng thu đắt tiền hay hàng thập kỷ đào tạo để đạt được mục tiêu của mình.”

Brad Grimes là một nhà báo công nghệ lâu năm và là cựu giám đốc truyền thông của Hiệp hội trải nghiệm nghe nhìn và tích hợp.