人工智能

游戏开发者寻求语音AI的新创意机会

mm

声音合成技术,尤其是语音合成技术,在近年来变得更加复杂。虽然文本转语音技术已经存在几十年,但这种技术变得更加自然。最近的算法可以在几小时内合成高度逼真的音频样本。随着技术的进步,更多的应用打开了,包括创意媒体的可能性。最近,VentureBeat报道,视频游戏公司已经开始调查使用AI语音生成来产生视频游戏对话。

一家公司,Leviathan Games,已经开始在他们正在开发的游戏中实施语音AI。Leviathan Games的老板Wyeth Ridgway解释说,语音AI可以以戏剧性的方式改变游戏设计。Ridgway解释说,语音AI在游戏设计中的使用是一个新兴趋势,与过去十年中3D动画软件的转变类似,像Pixar这样的公司创建了专有的软件来促进动画和建模。

传统的语音生成方法是通过实时追加预先录制的音频文件,拼接句子和短语。这种语音生成方法需要录制数百小时的对话和手动标记音频剪辑。它听起来也有些不自然,因为语调和强调在词语之间会发生变化。相比之下,最新的语音AI听起来更自然,工作方式也不同。

语音AI基于深度神经网络。 WaveNet 是最早可以生成令人信服的自然听起来的音频样本的AI之一。由于声音样本是从头开始生成的,因此不需要预先录制数百小时的对话,只要有足够的训练数据即可。优化的GAN和LSTM模型可以在仅仅几小时的标记音频训练后生成音频。结果可以非常令人信服,例如当Google的Duplex实验 打电话预约理发店 时。

随着这些技术变得更加强大、标准化和容易通过云计算访问,很可能更多的游戏开发者会转向语音AI来减少生产时间和成本。一些公司已经创建了可以被游戏开发者使用的模型。 Replica Studios 专门从事AI语音技术,他们的技术生成的音频样本可以在 这里这里听到。

游戏开发者不太可能选择放弃使用语音演员而使用AI。事实上,语音AI可以为语音演员打开更多机会。目前,许多游戏开发公司经常跳过语音对话,因为创建语音对话所需的时间投入和成本。语音演员通常需要被召回更多录音会议,如果脚本有变化或游戏导演想要不同的表演。语音AI可以用来实验/原型化对话,感受脚本需要做出的改变和修订,然后在调用专业语音演员之前录制脚本。这可能会导致更多公司有资源投资于创建语音对话。

AI语音模型甚至可以在特定语音演员的语音上进行训练,并使用AI生成琐碎的对话片段,只要演员被支付使用其语音的费用。 VentureBeat报道,语音演员如Simon J. Smith,对于使用语音AI模型的增加及其潜在的开启新语音演技机会持乐观态度。

除了使用语音AI来原型化脚本或为次要角色创建语音行之外,游戏开发者还可以使用语音AI为角色扮演视频游戏提供更多的自定义选项。目前,即使允许玩家为其角色选择语音的游戏也只有少数几个选项。使用语音AI,选项可以是功能性无限的。

博客作者和程序员,专攻 Machine Learning Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。