人工智能

育碧训练AI代理驾驶赛车游戏中的汽车

发布于 2019年12月29日

更新于 2026年5月25日

作者

Daniel Nelson

“AI”一词经常被用于视频游戏的讨论中，但它通常指的是控制视频游戏中非玩家角色逻辑，而不是指任何由计算机科学家认可的AI驱动的系统。利用人工神经网络的AI实际应用在视频游戏行业中相对较少，但正如VentureBeat报道的那样，游戏公司育碧最近发表了一篇论文，研究了AI代理的可能用途，该论文使用了强化学习。

虽然像DeepMind和OpenAI这样的实体已经研究了AI在各种视频游戏中的表现，例如星际争霸2，Dota 2和Minecraft，但几乎没有关于AI在游戏开发者通常面临的特定约束下的使用的研究。育碧La Forge，育碧的原型部门，刚刚发表了一篇论文，详细介绍了一种能够在商业视频游戏中执行可预测操作的算法。根据报告，AI算法能够达到当前的基准，并可靠地执行复杂任务。

论文的作者指出，虽然强化学习在某些视频游戏的背景下已经被证明是有效的，往往能达到与人类玩家相同的水平，但OpenAI和DeepMind创建的系统很少对游戏开发者有用。作者指出，缺乏可访问性是一个大问题，最令人印象深刻的结果是由拥有大量计算资源的研究团队实现的，而这些资源通常超出了游戏开发者的可用范围。研究人员写道：

“这些系统在视频游戏行业中使用相对较少，我们认为缺乏可访问性是主要原因。确实，真正令人印象深刻的结果……是由拥有大量计算资源的研究团队实现的，这些资源通常超出了视频游戏工作室的可用范围。”

育碧的研究团队旨在通过创建一种优化强化学习来解决这些问题，解决数据样本收集和运行时预算约束等问题。育碧的解决方案是基于加州大学伯克利分校的研究。伯克利研究人员开发的Soft Actor-Critic模型能够创建一个可以有效地推广到新条件的模型，并且比大多数模型更高效。育碧团队采用了这种方法，并将其适应于离散和连续动作。

育碧的研究团队在三个不同的游戏中评估了他们的算法的性能。他们使用了两个足球游戏来测试算法，以及一个简单的平台游戏。虽然这些游戏的结果略逊于行业的最先进结果，但他们还进行了另一个测试，算法的性能更好。研究人员使用了一个赛车视频游戏作为他们的测试用例，AI代理需要跟随给定的路径并在训练期间没有见过的环境中应对障碍。有两个连续的动作，方向和加速，以及一个二元动作（制动）。

研究人员在论文中总结了他们的结果，宣称混合Soft Actor-Critic方法在训练AI代理以高速度在商业视频游戏中驾驶方面是成功的。根据研究人员的说法，他们的训练方法可以潜在地适用于各种可能的交互方法。这些方法包括AI代理具有与玩家相同的输入选项的实例，展示了“此类算法对视频游戏行业的实用性”。根据研究人员的说法，他们的训练方法可以潜在地适用于各种可能的交互方法。这些方法包括AI代理具有与玩家相同的输入选项的实例，展示了“此类算法对视频游戏行业的实用性”。

Daniel Nelson

博客作者和程序员，专攻 Machine Learning 和 Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。

Unite.AI

育碧训练AI代理驾驶赛车游戏中的汽车

You may like