人工智能

游戏开发者寻求语音AI的新创意机会

发布于 2020年9月16日

更新于 2026年5月25日

作者

Daniel Nelson

声音合成技术，尤其是语音合成技术，在近年来变得更加复杂。虽然文本转语音技术已经存在几十年，但这种技术变得更加自然。最近的算法可以在几小时内合成高度逼真的音频样本。随着技术的进步，更多的应用打开了，包括创意媒体的可能性。最近，VentureBeat报道，视频游戏公司已经开始调查使用AI语音生成来产生视频游戏对话。

一家公司，Leviathan Games，已经开始在他们正在开发的游戏中实施语音AI。Leviathan Games的老板Wyeth Ridgway解释说，语音AI可以以戏剧性的方式改变游戏设计。Ridgway解释说，语音AI在游戏设计中的使用是一个新兴趋势，与过去十年中3D动画软件的转变类似，像Pixar这样的公司创建了专有的软件来促进动画和建模。

传统的语音生成方法是通过实时追加预先录制的音频文件，拼接句子和短语。这种语音生成方法需要录制数百小时的对话和手动标记音频剪辑。它听起来也有些不自然，因为语调和强调在词语之间会发生变化。相比之下，最新的语音AI听起来更自然，工作方式也不同。

语音AI基于深度神经网络。 WaveNet 是最早可以生成令人信服的自然听起来的音频样本的AI之一。由于声音样本是从头开始生成的，因此不需要预先录制数百小时的对话，只要有足够的训练数据即可。优化的GAN和LSTM模型可以在仅仅几小时的标记音频训练后生成音频。结果可以非常令人信服，例如当Google的Duplex实验打电话预约理发店时。

随着这些技术变得更加强大、标准化和容易通过云计算访问，很可能更多的游戏开发者会转向语音AI来减少生产时间和成本。一些公司已经创建了可以被游戏开发者使用的模型。 Replica Studios 专门从事AI语音技术，他们的技术生成的音频样本可以在这里和这里听到。

游戏开发者不太可能选择放弃使用语音演员而使用AI。事实上，语音AI可以为语音演员打开更多机会。目前，许多游戏开发公司经常跳过语音对话，因为创建语音对话所需的时间投入和成本。语音演员通常需要被召回更多录音会议，如果脚本有变化或游戏导演想要不同的表演。语音AI可以用来实验/原型化对话，感受脚本需要做出的改变和修订，然后在调用专业语音演员之前录制脚本。这可能会导致更多公司有资源投资于创建语音对话。

AI语音模型甚至可以在特定语音演员的语音上进行训练，并使用AI生成琐碎的对话片段，只要演员被支付使用其语音的费用。 VentureBeat报道，语音演员如Simon J. Smith，对于使用语音AI模型的增加及其潜在的开启新语音演技机会持乐观态度。

除了使用语音AI来原型化脚本或为次要角色创建语音行之外，游戏开发者还可以使用语音AI为角色扮演视频游戏提供更多的自定义选项。目前，即使允许玩家为其角色选择语音的游戏也只有少数几个选项。使用语音AI，选项可以是功能性无限的。

Daniel Nelson

博客作者和程序员，专攻 Machine Learning 和 Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。

Unite.AI

游戏开发者寻求语音AI的新创意机会

You may like