思想领袖

播客的未来是人工智能

发布于 2022年11月2日

更新于 2026年5月23日

作者

Brad Grimes

大约每个月都会有22,000个新播客被推出。根据播客行业洞察的数据，目前苹果播客目录中有近250万个播客（超过7100万集）。当然，这只是我们所知道的播客。

“很多播客创作者现在不再通过大平台发布他们的内容，”曾在BBC广播公司工作、卡迪夫研发咨询公司Bwlb的创始人安迪·泰勒说。“他们直接与听众联系，出售高级内容，并取得了巨大的成功。”

此外，还有大量的类似播客的内容，无论是由品牌创建用于推广还是由活动组织者创建用于提供按需服务的内容。每一份内容都需要被制作和分发，无论是由音频专业人员还是刚刚入门的创作者完成。因此，他们可以自动化大量的制作过程，这样他们就可以更专注于内容本身。

“音频被发布的平台已经呈爆发式增长，”伯克利音乐学院波士顿分校教授、M Works Mastering公司首席工程师乔纳森·怀纳解释道。“在这么多不同的环境下，创作者有很强的动力去变得更加多才多艺。”

更不用说，他们需要变得更加高效和富有成效。

人工智能的崛起

人工智能（AI）——可以自动完成以前由人类完成的任务的软件——是处理播客内容海啸的关键。人工智能不仅可以加快制作速度，还可以让播客听起来更好，并为明天的音频体验奠定基础。

“人工智能基本上可以帮助处理重复的任务，以加快播客创作者的工作流程，”Nomono的研究工程师曼诺斯·丘尔达基斯解释道。Nomono开发了基于人工智能的播客工具。“例如，使用人工智能，你不需要听完整集播客来找到某个人说错的地方，然后替换或删除它。你可以自己做，但人工智能可以更快地完成。”

然后还有只能通过人工智能才能完成的任务——至少在规模上如此，例如去除噪音或增强对话。“高质量的对话增强在没有人工智能的情况下几乎是不可能的，”丘尔达基斯说。“至少在传统工具的合理时间内是不可能的。”

适合琐碎任务

播客中人工智能的应用与制作任务一样多样。有些人工智能应用直接集成到播客平台中。当创作者将他们的播客上传到托管平台Podcast.co时，系统会自动“聆听”音频文件并标准化音量。

“任何可以帮助减少工作中枯燥部分的工具都是件好事，”平台联合创始人迈克·康索洛说。康索洛还运营着播客制作公司Cue，该公司为企业品牌提供服务，并运营着Matchmaker.fm，该平台连接播客制作人和嘉宾。“你总是需要人类专业知识的元素，但机器很快就能学会理解什么让一个播客变得有趣，并减少任务时间。”

解决方案提供商Descript将人工智能应用于播客工程的各个方面，包括噪音去除和回声控制。Descript可以处理的一项更为“枯燥”的任务是房间音调。

“有时制作人需要在播客中插入数字静默，”Descript的商业和企业发展负责人杰伊·勒博夫说。“也许是在编辑之间或是为了拉长句子之间的间距。但是听起来非常不自然。”

如果制作人在录制播客时没有捕捉到房间音调，他们可能需要回去再录制。或者他们可以在录音中找到它，复制和粘贴到需要的地方，然后编辑结果以使其听起来自然。

或者计算机可以处理它。Descript的基于人工智能的房间音调生成器分析录音，识别房间音调，并在需要时自动合成它。这种技术不仅消除了琐碎的任务，还允许更大的制作灵活性。

“人工智能将使我们能够使用更便宜的硬件、更差的录音室和更嘈杂的环境，并且仍然能取得良好的效果，”Nomono的丘尔达基斯说。

新的基于人工智能的功能

人工智能还为播客开启了创新的大门——创造新的解决方案，以提高播客创作者和听众的标准。例如，Epidemic Audio Reference（EAR）工具帮助播客创作者找到基于他们喜欢的歌曲的无版权音乐。

“假设你正在寻找开头或结尾的音乐，你正在想一个特定的歌曲，但它受到版权保护，”丘尔达基斯说。“该系统使用人工智能来帮助你找到类似的东西。”

在Bwlb，泰勒的团队开发了Accordion，这是一种基于人工智能的解决方案，可以将播客重制为不同长度的版本。

“生活的其他方面都变得更智能了——智能家居，智能冰箱，”泰勒说。“人们也希望从播客体验中获得更多的控制和便利。”

当泰勒为BBC制作纪录片时，他经常被要求为不同的平台创建较短的版本。这个过程总是手动进行的。Accordion使用软件算法来智能地创建不同长度的播客内容版本。“这并不加快速度，”泰勒说，“但它让用户可以在不失去语调结构或可听性的情况下控制内容的长度。”

专注于沉浸式讲故事

播客创作者使用人工智能工具越多，就会变得越好。换句话说，人工智能工具吞噬的数据越多，就会学到越多。

Nomono的对话增强算法基于大型语音录音数据集——一些清晰可懂，另一些则不太清晰——这些数据集教会人工智能工具如何生成更好的音质。“播客创作者不应该需要高级音频知识来制作高质量的音频，”丘尔达基斯说。“通过自动化一些任务，他们可以花更多时间专注于伟大的故事讲述，并减少枯燥的清理任务。”

在未来，他们可以更轻松地演变成创建沉浸式、空间化播客的新体裁。例如，Nomono的技术使得基于对象的音频制作成为可能，这允许制作人将声音“放置”在3D声音景观中或创建可以根据听众定制的动态版本。

“媒体制作现在进入了一个阶段，如果你可以梦想它，它就可以实现，”Descript的勒博夫说。“而且你不再需要昂贵的录音棚或几十年的培训来实现你的目标。”

Brad Grimes

Brad Grimes 是一位长期从事技术记者的同时也是 Audiovisual and Integrated Experience Association 的前任传讯总监。

Unite.AI

播客的未来是人工智能

人工智能的崛起

适合琐碎任务

新的基于人工智能的功能

专注于沉浸式讲故事

发现更多