人工智能
从Atari到Doom:谷歌如何使用AI重新定义视频游戏
视频游戏行业,如今价值3470亿美元,已经发展成为娱乐世界中的重要参与者,全球吸引了超过30亿人。从最初的简单游戏如Pong和Space Invaders开始,行业已经发展到具有更复杂的游戏如Doom,这些游戏以其3D视觉效果和家用游戏机体验开创了新的标准。如今,行业正站在一个新时代的门槛上,这个新时代受到人工智能(AI)的影响。领导这一变革的是谷歌,利用其丰富的资源和技术来重新定义视频游戏的创作、玩法和体验。本文探讨了谷歌在重新定义视频游戏方面的旅程。
开始:AI玩Atari游戏
谷歌在视频游戏中使用AI的开始是一个关键的发展:创建一个能够识别游戏环境并像人类玩家一样反应的AI。早期工作中,他们引入了一个深度强化学习代理,该代理可以直接从游戏中学习控制策略。这个发展的核心是一个卷积神经网络,使用Q-learning训练,处理原始屏幕像素,并将其转换为基于当前状态的游戏特定操作。
研究人员将这个模型应用于七个Atari 2600游戏,没有修改架构或学习算法。结果令人印象深刻——模型在六个游戏中超越了之前的方法,并在三个游戏中超过了人类的表现。这一发展突出了AI处理复杂、交互式视频游戏的潜力,只需视觉输入即可。
这种突破为后来的成就奠定了基础,例如DeepMind的AlphaGo击败围棋世界冠军。AI代理在掌握具有挑战性的游戏方面的成功已经激发了进一步的研究,包括交互式系统和机器人。这种发展的影响仍然可以在机器学习和AI领域中感受到。
AlphaStar:AI学习StarCraft II复杂游戏策略
在早期AI成功的基础上,谷歌将目光投向一个更复杂的挑战:StarCraft II。这个实时战略游戏以其复杂性而闻名,玩家必须控制军队、管理资源和执行策略。2019年,谷歌推出了AlphaStar,一个能够以专业水平玩StarCraft II的AI代理。
AlphaStar的发展使用了深度强化学习和模仿学习的混合。它首先通过观看专业玩家的回放来学习,然后通过自我对战来提高自己的策略,运行数百万场比赛来完善其策略。这种成就展示了AI处理复杂、实时策略游戏的能力,取得了与人类玩家相当的结果。
超越个别游戏:朝着更通用的游戏AI
谷歌的最新进展标志着从掌握个别游戏到创造更通用的AI代理的转变。最近,谷歌研究人员推出了SIMA,即可扩展的多世界代理,这是一个新的AI模型,旨在使用自然语言指令来导航各种游戏环境。与早期需要访问游戏源代码或自定义API的模型不同,SIMA仅需要两个输入:屏幕图像和简单的语言命令。
SIMA将这些指令转换为键盘和鼠标操作,以控制游戏中的角色。这种方法使其能够以类似人类游戏玩法的方式与不同的虚拟环境交互。研究表明,跨多个游戏训练的AI比仅在单个游戏中训练的AI表现更好,突出了SIMA在驱动游戏AI新时代方面的潜力。
谷歌正在继续扩展SIMA的能力,探索如何开发出能够适应各种游戏环境的、语言驱动的代理。这种发展代表了创建能够适应和在各种交互式环境中茁壮成长的AI的重要一步。
游戏设计中的生成式AI
最近,谷歌扩大了其重点,从增强游戏体验转向开发支持游戏设计的工具。这一转变是由生成式AI的进步驱动的,特别是在图像和视频生成方面。一个重要的发展是使用AI创建适应性非玩家角色(NPC),这些角色以更真实和不可预测的方式对玩家行为做出反应。
此外,谷歌还探索了程序化内容生成,AI可以帮助设计关卡、环境和整个游戏世界,基于特定的规则或模式。这种方法可以简化开发过程,并为玩家提供独特的、个性化的体验,每次游戏都能激发好奇心和期待。一个值得注意的例子是Genie,一个允许用户通过提供图像或描述来设计2D视频游戏的工具。这种方法使游戏开发更加便捷,即使对于没有编程技能的人来说也是如此。
Genie的创新之处在于其能够从各种2D平台游戏的视频资料中学习,而不是依赖于明确的指令或标记数据。这种能力使Genie能够更好地理解游戏机制、物理和设计元素。用户可以从一个基本的想法或草图开始,Genie将生成一个完整的游戏环境,包括设置、角色、障碍和游戏机制。
游戏开发中的生成式AI
在之前的进步基础上,谷歌最近推出了其迄今为止最雄心勃勃的项目,旨在简化传统上需要大量编码和专业技能的复杂、耗时的游戏开发过程。最近,他们推出了GameNGen,一个旨在简化游戏开发过程的生成式AI工具。GameNGen允许开发者使用自然语言提示来构建整个游戏世界和叙事,大大减少了创建游戏所需的时间和精力。通过利用生成式AI,GameNGen可以生成独特的游戏资产、环境和故事情节,使开发者能够专注于创造力而不是技术细节。例如,研究人员使用GameNGen开发了完整版的Doom,展示了其能力,并为更高效、更便捷的游戏开发过程铺平了道路。
GameNGen背后的技术涉及一个两阶段的训练过程。首先,一个AI代理被训练来玩Doom,生成游戏数据。然后,这些数据被用来训练一个生成式AI模型,该模型可以根据之前的操作和视觉效果预测未来的帧。结果是一个能够实时生成游戏画面的生成式扩散模型,而无需传统的游戏引擎组件。这种从手动编码到AI驱动的生成转变标志着游戏开发的一个重要里程碑,提供了一种更高效、更便捷的方式来创建高质量的游戏,适用于较小的工作室和个人创作者。
结论
谷歌在AI方面的最新进展将从根本上改变游戏行业。凭借像GameNGen这样的工具,使开发者能够创建详细的游戏世界,以及SIMA提供的通用游戏交互,AI正在改变游戏的创作、体验和玩法。
随着AI的不断发展,它承诺提高游戏开发的创造力和效率。开发者将拥有新的机会来探索创新理念,并提供更吸引人、更身临其境的体验。这一转变标志着视频游戏演变过程中的一个重要时刻,凸显了AI在塑造互动娱乐未来的日益增长的作用。












