存根 播客的未来是人工智能 - Unite.AI
关注我们.

思想领袖

播客的未来是人工智能

mm

发布时间

 on

粗略地说,一个月内大约有 22,000 个新播客推出。 据统计,目前 Apple 播客目录中有近 2.5 万个播客(超过 71 万集) 播客行业洞察。 这些只是我们所知道的。

“很多播客现在甚至没有通过大平台。 他们直接面向听众,销售优质内容并取得巨大成功。”前 BBC 广播电台、卡迪夫研发咨询公司创始人安迪·泰勒 (Andy Taylor) 说道 布劳布.

更不用说越来越多的类似播客的内容了,无论是由品牌为了促销而创建的,还是由想要按需提供演讲的活动制作者创建的。 每一条内容都需要制作和分发,无论是由音频专业人士还是学习技术的人。 因此,他们越能实现大量生产的自动化,他们就越能专注于内容。

“音频发布的不同地方刚刚出现爆炸式增长,”M Works Mastering 的首席工程师兼教授 Jonathan Wyner 解释道。 波士顿伯克利音乐学院. “在所有这些背景下,创作者有真正的动机和必要性来变得更加多才多艺。”

更不用说,生产力更高、效率更高。

人工智能的兴起

人工智能(AI)——可以自动执行以前由人类完成的任务的软件——是应对播客内容海啸的关键。 人工智能不仅可以加快制作速度,还可以使播客听起来更好,并为未来的音频体验奠定基础。

“人工智能基本上可以帮助处理重复性任务,从而加快播客的工作流程。” 野物,开发基于人工智能的播客工具。 “例如,有了人工智能,你不必听整个播客就能找到有人说错的地方,然后替换或删除它。 你 可以 你自己做,但人工智能做得更快。”

还有一些杂务只能通过人工智能来完成——至少在规模上是这样,比如消除噪音或增强对话。 “如果没有人工智能,高质量的对话增强是不可能的,”Chourdakis 说。 “至少在合理的时间内使用传统工具是不可能的。”

非常适合琐碎的任务

人工智能在播客中的应用与制作任务一样多种多样。 有些直接内置于播客平台中。 当创作者将他们的播客上传到托管平台时 播客网,系统自动“监听”音频文件并标准化声级。

“任何能够帮助减少工作中令人麻木的部分的工具都是一件好事,”该平台的联合创始人 Mike Cunsolo 说。 坎索洛也跑 球杆,一家与企业品牌合作的播客制作公司,以及 红娘.fm,它将播客制作者与客人联系起来。 “你总是需要人类的专业知识元素,但很快机器就可以学会理解是什么让播客变得有趣并减少任务时间。”

解决方案提供商 描述 将人工智能应用于播客工程的许多方面,包括噪声消除和回声控制。 Descript 可以处理的更“令人头脑麻木”的杂务之一是房间音调。

“有时制作人需要在播客中插入数字沉默。 也许是在编辑之间或拉长句子之间的间距,”Descript 的业务和企业发展主管 Jay LeBoeuf 说。 “但这听起来非常不自然。”

如果制作人在录制播客时没有捕获房间音,他们可能必须返回并获取它。 或者他们可以在录音中聆听,在需要的地方复制并粘贴,然后编辑结果以使其自然混合。

或者计算机可以处理它。 Descript 基于人工智能的房间音调生成器可分析录音、识别房间音调,并在需要时自动合成。 这种技术不仅消除了琐碎的任务,还提供了更大的生产灵活性。

Nomono 的 Chourdakis 表示:“人工智能将使我们能够使用更便宜的硬件、听起来更差的房间和更吵闹的地点,但仍然可以获得良好的结果。”

基于人工智能的新功能

人工智能还为播客创新打开了大门——创造新的解决方案,提高播客和听众的标准。 例如,流行音频参考(EAR)工具可以帮助播客根据他们喜欢的歌曲找到无版权的音乐。

“假设您正在寻找片头或片尾音乐,并且您正在考虑一首特定的歌曲,但它受版权保护,”Chourdakis 说。 “该系统在底层使用人工智能来帮助你找到类似的东西。”

在 Bwlb,泰勒的团队开发了 手风琴,一种基于人工智能的解决方案,可以拍摄播客并以不同的长度进行复制。

“我们生活的其他部分都在变得更加智能——智能家居、智能冰箱,”泰勒说。 “人们也希望从播客体验中获得更多控制和便利。”

当泰勒为 BBC 制作纪录片时,他会被要求制作较短的版本以在不同的平台上运行。 该过程始终是手动的。 Accordion 将软件算法应用于播客内容,以智能地创建不同长度的版本。 “它不会加快任何速度,”泰勒说,“但它可以让用户控制内容的持续时间,而不会失去音调结构或可听性。”

将重点放在沉浸式讲故事上

播客使用人工智能工具越多,他们就会变得越好。 换句话说,他们摄入的数据越多,他们学到的就越多。

Nomono 的对话增强算法基于大型录音数据集(有些清晰易懂,有些则不太清晰),这些算法教会人工智能工具如何生成更好的声音。 “播客不需要先进的音频知识来制作高质量的音频,”Chourdakis 说。 “通过自动化其中一些任务,他们可以花更多的时间专注于精彩的故事讲述,而不是花更少的时间进行繁琐的清理任务。”

未来,它们可以更轻松地发展,创造一种新的沉浸式空间播客类型。 例如,Nomono 的技术支持基于对象的音频制作,允许制作人将声音“放置”在 3D 音景中或创建可以为听众量身定制的动态版本。

“媒体制作现在正进入一个只要你能梦想,它就能实现的阶段,”Descript 的 LeBoeuf 说道。 “而且你不再需要拥有昂贵的工作室或数十年的培训来实现你的目标。”

布拉德·格莱姆斯 (Brad Grimes) 是一名长期科技记者,也是视听和综合体验协会的前通讯总监。