人工智能

DeepMind 的 AI 达到 StarCraft II 的最高排名

Published October 31, 2019

Updated April 28, 2026

Alex McFarland

DeepMind 的 AlphaStar ，一个人工智能（AI）系统，已经达到 StarCraft II 的最高级别，这是一款极其流行和复杂的电脑游戏。该 AI 的表现超过了 99.8% 的所有注册人类玩家。

该 AI 系统经过 44 天的训练，才能达到这种水平。它使用了一些最好的人类玩家的录像，并从他们那里学习，直到最终与自己对战。

“AlphaStar 成为第一个达到任何专业玩的电子竞技游戏中人类表现的顶级的 AI 系统，在完全不受限制的游戏中，在专业批准的条件下，” DeepMind 研究员 David Silver 说。

“自从计算机破解了 Go 、国际象棋和扑克牌游戏， StarCraft 游戏已经成为，基本上是由社区达成共识的， AI 的下一个大挑战，” Silver 说。 “它被认为是最接近人类能力极限的游戏。”

该工作发表在科学杂志Nature上。

什么是 StarCraft ？

简单地说， StarCraft 的目标是建立文明并对抗外星人。

它是一款实时策略游戏，玩家控制数百个单位，并必须做出重要的经济决策。在游戏中，有成千上万的时间步骤和数千种可能的行动。这些是在十分钟的游戏时间内实时选择的。

AlphaStar “代理”

DeepMind 开发了 AlphaStar “代理”，并为游戏中的每个种族创建了一个。不同的种族各有其独特的优势和劣势。在“AlphaStar 联赛”中， AI 与自己和“剥削者”代理对战，后者针对 AlphaStar 的弱点。

该 AI 最令人印象深刻的一点是，它不是为了以超人类的速度执行操作而开发的。相反，它学习了不同的获胜策略。

与 StarCraft 游戏一样，实际应用需要人工代理在复杂的环境中与其他代理交互、竞争和协调。因此， StarCraft 已经成为人工智能研究的一个重要方面。

军事兴趣

也许这项工作中更令人意外的方面之一是，它将会引起军事的兴趣。

“军事分析师一定会关注 AlphaStar 成功的实时策略，这是一个明显的例子，展示了 AI 在战场规划中的优势。但这是一个极其危险的想法，具有可能导致人道主义灾难的潜力。AlphaStar 从特定环境中的大数据中学习策略。来自叙利亚和也门等冲突的数据将太过稀疏，无法使用，”谢菲尔德大学的人工智能和机器人教授诺埃尔·夏基说。

“正如 DeepMind 在最近的联合国活动中解释的那样，这样的方法对于武器控制将是极其危险的，因为动作是不可预测的，并且可以以意想不到的方式创造性地进行。这违反了武装冲突的法律，”