人工智能
DeepMind 的 AI 达到 StarCraft II 的最高排名

DeepMind 的 AlphaStar ,一个人工智能(AI)系统,已经达到 StarCraft II 的最高级别,这是一款极其流行和复杂的电脑游戏。该 AI 的表现超过了 99.8% 的所有注册人类玩家。
该 AI 系统经过 44 天的训练,才能达到这种水平。它使用了一些最好的人类玩家的录像,并从他们那里学习,直到最终与自己对战。
“AlphaStar 成为第一个达到任何专业玩的电子竞技游戏中人类表现的顶级的 AI 系统,在完全不受限制的游戏中,在专业批准的条件下,” DeepMind 研究员 David Silver 说。
“自从计算机破解了 Go 、国际象棋和扑克牌游戏, StarCraft 游戏已经成为,基本上是由社区达成共识的, AI 的下一个大挑战,” Silver 说。 “它被认为是最接近人类能力极限的游戏。”
该工作发表在科学杂志Nature上。
什么是 StarCraft ?
简单地说, StarCraft 的目标是建立文明并对抗外星人。
它是一款实时策略游戏,玩家控制数百个单位,并必须做出重要的经济决策。在游戏中,有成千上万的时间步骤和数千种可能的行动。这些是在十分钟的游戏时间内实时选择的。
AlphaStar “代理”
DeepMind 开发了 AlphaStar “代理”,并为游戏中的每个种族创建了一个。不同的种族各有其独特的优势和劣势。在“AlphaStar 联赛”中, AI 与自己和“剥削者”代理对战,后者针对 AlphaStar 的弱点。
该 AI 最令人印象深刻的一点是,它不是为了以超人类的速度执行操作而开发的。相反,它学习了不同的获胜策略。
与 StarCraft 游戏一样,实际应用需要人工代理在复杂的环境中与其他代理交互、竞争和协调。因此, StarCraft 已经成为人工智能研究的一个重要方面。
军事兴趣
也许这项工作中更令人意外的方面之一是,它将会引起军事的兴趣。
“军事分析师一定会关注 AlphaStar 成功的实时策略,这是一个明显的例子,展示了 AI 在战场规划中的优势。但这是一个极其危险的想法,具有可能导致人道主义灾难的潜力。AlphaStar 从特定环境中的大数据中学习策略。来自叙利亚和也门等冲突的数据将太过稀疏,无法使用,”谢菲尔德大学的人工智能和机器人教授诺埃尔·夏基说。
“正如 DeepMind 在最近的联合国活动中解释的那样,这样的方法对于武器控制将是极其危险的,因为动作是不可预测的,并且可以以意想不到的方式创造性地进行。这违反了武装冲突的法律,”
在短时间内取得了长足进步
在一月份,职业 StarCraft II 玩家格热戈什·科明茨击败了 AlphaStar。在这场游戏中,这是一个巨大的挫折,对于投资了数百万美元的技术的谷歌来说。从那时起,DeepMind 的 AI 在短时间内取得了长足进步,并且这些新的发展具有巨大的影响。












