思想领袖

游戏生成数据可能是AI训练中最被低估的资源

mm

AI公司过去五年一直在消费互联网上每一篇文本、每一张图片和每一份公开可用的数据。这种供应是有限的,我们正接近一个临界点,即没有足够的数据来维持AI进步的步伐。

然而,有一个明显的候选者被AI行业大多忽略了。

我以建造游戏系统为生,游戏系统每天流经的数据与大多数AI研究人员曾经处理过的数据完全不同。然而,几乎没有人在游戏领域以外关注这些数据。

游戏平台每天生成数十亿字节的行为数据,包括结构化的实时决策、经济活动和社会交互,所有这些都发生在具有统一物理规则的环境中。

几乎没有这些数据被用于AI训练。然而,已经使用这些数据的公司,如DeepMind和NVIDIA,已经取得了该领域的一些最重要的突破。

AI的数据问题

Epoch AI的一项研究表明,公开可用的、由人类生成的文本数据将在2026年至2032年之间被完全耗尽。ChatGPT、Gemini和Claude等模型已经消耗了互联网上几乎所有可用的数据。

合成数据或AI生成的文本被用作AI的输入,但这种方法会导致模型随时间推移而恶化,研究人员称之为模型崩溃现象。

我认为该领域需要的是一个丰富的、交互的、多模态的信息,其中因果关系在实时发生,每个动作都有一个可衡量的后果。游戏正好产生这种数据,并且以几乎无与伦比的规模生产。

游戏平台每天推送数十亿字节的行为数据,包括玩家移动、战略选择、反应时间、经济交易和社会交互,所有这些都流经结构化的、时间戳的流中,大多数AI研究人员从未接触过这些数据。

一篇关于游戏生成数据的学术论文提出了一个九类的分类,并认为绝大多数这样的数据仍然未被AI行业利用。

我可以从自己的经验中证实这一点。游戏系统每天流经的数据量在其他任何AI研究领域都被认为是一笔宝贵的财富。在游戏中,这些数据却被归档或丢弃。

为什么游戏数据不同

当你在游戏引擎中工作足够长的时间后,你开始意识到自己拥有多少结构化数据,而这些数据在AI领域中几乎无人问津。每个游戏会话都会产生同步的物理、玩家行为和系统级因果关系,这种规模的数据在其他地方很难找到。

游戏引擎强制执行物理规则。物体按照一致的规则掉落、碰撞和破碎,这意味着数据中包含了系统级的因果关系,而不是模型从文本相关性中推断出的模式。

当玩家发射一个投射物时,引擎计算轨迹、风阻和冲击。AI从一个直接通过每次交互演示物理的环境中学习,而不是将物理定律视为统计近似值。

还有多模态对齐问题。在游戏中,视觉数据、音频提示、玩家输入和环境状态同时发生并被记录在一起。这种自然的同步在现实世界的数据集中需要花费大量资金来复制,因为研究人员通常需要手动标记和对齐每个模态。

游戏还以规模生产边缘情况,通过程序生成内容。《无人深空》有18亿个独特的星球,对于AI来说,这种变化非常重要,因为边缘情况决定了模型是否可靠地工作或危险地失败。

然后还有涌现复杂性,这可能是最有价值的特性。当OpenAI将代理放入一个简单的捉迷藏游戏中,这些代理在数亿轮游戏中发展出了六个不同的复杂策略阶段,全部都是自主产生的,没有一行代码告诉他们该做什么。

他们建造了由可移动物体制成的庇护所,使用坡道突破防御工事,甚至利用物理漏洞来冲浪盒子越过墙壁。所有这些都没有被编程。它们都从游戏环境中的竞争中涌现出来,没有任何一行代码告诉他们该做什么。

这种自动生成的复杂性正是AI研究在规模上所需要的,游戏是唯一能够可靠地在没有昂贵的人工监督的情况下产生这种复杂性的环境。

从游戏板到诺贝尔奖

游戏训练的AI转移到现实世界的最明显证据是一个赢得诺贝尔奖的系统,这是我一直以来反复提到的例子,当人们问我为什么围绕游戏和AI建立我的职业生涯时。

DeepMind从2016年的AlphaGo开始,然后开发了AlphaZero,一个在没有任何人类知识的情况下自学国际象棋、围棋和将棋的系统。AlphaZero的架构成为AlphaFold的基础,后者解决了50年来一直存在的蛋白质折叠问题,并为其创造者赢得了2024年的诺贝尔化学奖。

DeepMind的CEO德米斯·哈萨比斯已经公开谈论过这一流程。他告诉《科学美国人》,游戏从来不是最终目标,而是开发和测试AI技术的最有效方式,然后再将其应用于真正的科学问题。

我记得读到这篇文章时,感觉有人已经准确表达了我多年来从游戏开发内部看到的东西。

这种轨迹自那时起已经在整个领域中重现。OpenAI首先通过Gymnasium标准化的强化学习环境,现在支撑着机器人、自动驾驶汽车和工业自动化的研究。

代理、环境、动作和奖励的游戏结构最初是研究方便的,现在已经成为任何需要在物理世界中行动的AI系统的默认框架。

游戏作为新的模拟层

2025年12月,NVIDIA发布了NitroGen,一个在40000小时的游戏数据上训练的基础模型,涵盖1000多个游戏。该模型观察公开可用的游戏视频,提取控制器叠加层中的玩家动作,并直接从原始像素学习玩游戏。

在从未遇到过的游戏中,NitroGen展示了最高52%的任务成功率,相比从头开始训练的模型有所提高。但真正的意义在于底层的架构。

NitroGen运行在NVIDIA的GR00T机器人框架上,这是该公司用于ISAAC Sim平台的物理AI和模拟到现实转换的相同基础。游戏代理和工厂机器人共享相同的底层系统。

NVIDIA的Jim Fan将该项目描述为构建“一个用于动作的GPT”,一个可以在任何环境中学习操作的通用模型。

作为一个构建生成NitroGen所消耗的数据的游戏系统的人,我发现很难夸大这对我所在行业的影响。

这不仅限于NVIDIA。Waymo已经模拟了200亿英里的驾驶数据来训练其自动驾驶汽车,所有这些都在游戏引擎风格的环境中进行,排练了在现实道路上太危险或太罕见的场景。

基于游戏引擎的外科手术平台已经显示出显著的培训效果改善。城市规划师使用类似的工具进行城市规模的交通优化。

游戏引擎已经成为一个通用的模拟层,AI需要通过与环境的交互来学习。游戏引擎已经成为一个通用的模拟层,AI需要通过与环境的交互来学习。

无人谈论的基础设施

当人们讨论AI基础设施时,他们往往指的是数据中心、GPU集群和计算。在我工作的所有这些年里,我可以用一只手计算出AI领域有人提到游戏环境的次数。这种脱节很快就会消失。

这将变得更加明显,因为传统的数据集即将枯竭。生产最丰富的交互式数据的行业将不可避免地转向AI研究的中心,游戏、模拟和虚拟世界比其他任何东西都更好地填补了这一空白。

资金已经在跟随这一趋势。2025年,游戏领域的AI价值为45.4亿美元,预计到2035年将达到810亿美元。

我交谈的大多数游戏工作室仍然认为自己是娱乐公司。但是,当你的系统生成下一代AI模型需要的数据时,你无论是否计划过,都处于基础设施业务中。

伊尔曼·沙扎耶夫是Dizzaract的创始人和CEO,Dizzaract是中东和北非地区最大的游戏工作室。他是一名人工智能研究员和联合国专家,隶属于联合国毒品和犯罪问题办公室(UNODC)计划,致力于人工智能和现实世界影响的交叉点。