Connect with us

人工智能

游戏开发者期待语音AI带来新的创作机会

mm

声音合成技术,尤其是语音合成技术,在近年来变得更加成熟。虽然文本转语音技术已经存在几十年,但这种技术变得更加自然。最近的算法可以在几小时的音频基础上合成出非常逼真的音频样本。随着技术的进步,更多的应用也随之开启,包括在创意媒体方面的可能性。最近,根据VentureBeat报道,视频游戏公司已经开始研究使用AI语音生成来为视频游戏产生对话。

一家公司,Leviathan Games,已经开始在他们正在开发的游戏中实施语音AI。Leviathan Games的老板Wyeth Ridgway解释说,语音AI可以以戏剧性的方式改变游戏设计。Ridgway解释说,游戏设计中使用语音AI是一个新兴趋势,并将其与过去十年中3D动画软件的变化进行比较,像Pixar这样的公司创建了专有的软件来促进动画和建模。

传统的语音生成方法是通过实时连接预先录制的音频文件,拼接句子和短语。这种语音生成方法需要录制数百小时的对话和手动标记音频剪辑。它听起来也有些不自然,因为语调和强调往往会在单词之间转变。相比之下,最新的语音AI听起来更自然,工作方式也不同。

语音AI基于深度神经网络。WaveNet是最早可以生成令人信服的自然听起来的音频样本的AI之一。由于声音样本是从头开始生成的,因此只要有足够的训练数据,就不需要预先录制数百小时的对话。优化的GAN和LSTM模型可以在仅仅几小时的标记音频训练后生成音频。结果可以非常令人信服,例如当Google的Duplex实验打电话预约理发时。

随着这些技术变得更加强大、标准化和通过云计算更容易访问,可能更多的游戏开发者会转向语音AI来减少生产时间和成本。一些公司已经在创建可以被游戏开发者使用的模型。 Replica Studios专门从事AI语音技术,一些由他们的技术生成的音频样本可以在这里这里听到。

不太可能游戏开发者会选择放弃使用语音演员而使用AI。事实上,语音AI可以为语音演员开辟更多机会。目前,许多游戏开发公司经常跳过语音对话,因为创建语音对话需要大量时间和成本。语音演员通常需要被召回更多录音会议,如果脚本有变化或者游戏导演想要不同的表演。语音AI可以被用于实验/原型对话,感受脚本需要做出的修改和修订,然后再召唤专业语音演员来录制脚本。这可能会导致更多公司有资源投资于创建语音对话。

AI语音模型甚至可以被训练为特定语音演员的声音,并使用AI生成琐碎的对话片段,只要演员被支付使用他们声音的费用。 根据VentureBeat报道,语音演员如Simon J. Smith,对于语音AI模型的使用及其开辟新的语音演员机会持乐观态度。

除了用于原型脚本或为次要角色创建语音行之外,游戏开发者还可以使用语音AI为角色扮演视频游戏提供更多自定义选项。目前,即使允许玩家为他们的角色选择语音的游戏也只有少数几个选项。使用语音AI,选项可以功能性地无限。

博客作者和程序员,专攻 Machine Learning Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。