人工智能

育碧训练AI代理驾驶赛车游戏中的汽车

mm

“AI”一词经常被用于视频游戏的讨论中,但它通常指的是控制视频游戏中非玩家角色逻辑,而不是指任何由计算机科学家认可的AI驱动的系统。利用人工神经网络的AI实际应用在视频游戏行业中相对较少,但正如VentureBeat报道的那样,游戏公司育碧最近发表了一篇论文,研究了AI代理的可能用途,该论文使用了强化学习。

虽然像DeepMind和OpenAI这样的实体已经研究了AI在各种视频游戏中的表现,例如星际争霸2,Dota 2和Minecraft,但几乎没有关于AI在游戏开发者通常面临的特定约束下的使用的研究。育碧La Forge,育碧的原型部门,刚刚发表了一篇论文,详细介绍了一种能够在商业视频游戏中执行可预测操作的算法。根据报告,AI算法能够达到当前的基准,并可靠地执行复杂任务。

论文的作者指出,虽然强化学习在某些视频游戏的背景下已经被证明是有效的,往往能达到与人类玩家相同的水平,但OpenAI和DeepMind创建的系统很少对游戏开发者有用。作者指出,缺乏可访问性是一个大问题,最令人印象深刻的结果是由拥有大量计算资源的研究团队实现的,而这些资源通常超出了游戏开发者的可用范围。研究人员写道:

“这些系统在视频游戏行业中使用相对较少,我们认为缺乏可访问性是主要原因。确实,真正令人印象深刻的结果……是由拥有大量计算资源的研究团队实现的,这些资源通常超出了视频游戏工作室的可用范围。”

育碧的研究团队旨在通过创建一种优化强化学习来解决这些问题,解决数据样本收集和运行时预算约束等问题。育碧的解决方案是基于加州大学伯克利分校的研究。伯克利研究人员开发的Soft Actor-Critic模型能够创建一个可以有效地推广到新条件的模型,并且比大多数模型更高效。育碧团队采用了这种方法,并将其适应于离散和连续动作。

育碧的研究团队在三个不同的游戏中评估了他们的算法的性能。他们使用了两个足球游戏来测试算法,以及一个简单的平台游戏。虽然这些游戏的结果略逊于行业的最先进结果,但他们还进行了另一个测试,算法的性能更好。研究人员使用了一个赛车视频游戏作为他们的测试用例,AI代理需要跟随给定的路径并在训练期间没有见过的环境中应对障碍。有两个连续的动作,方向和加速,以及一个二元动作(制动)。

研究人员在论文中总结了他们的结果,宣称混合Soft Actor-Critic方法在训练AI代理以高速度在商业视频游戏中驾驶方面是成功的。根据研究人员的说法,他们的训练方法可以潜在地适用于各种可能的交互方法。这些方法包括AI代理具有与玩家相同的输入选项的实例,展示了“此类算法对视频游戏行业的实用性”。根据研究人员的说法,他们的训练方法可以潜在地适用于各种可能的交互方法。这些方法包括AI代理具有与玩家相同的输入选项的实例,展示了“此类算法对视频游戏行业的实用性”。

博客作者和程序员,专攻 Machine Learning Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。