Connect with us

通用人工智能

Facebook 的 AI 挑战花火游戏

mm

Facebook AI 研究(FAIR)开发了一种新型 AI,在与花火游戏对战中取得了非常令人印象深刻的成绩。这一新发展是 Facebook 的 AI 研究的一个重大进步。

花火是一种类似于 Solitaire 的纸牌游戏。虽然大多数用于此类技术的游戏都是将 AI 直接对战人类,例如国际象棋或围棋,但花火则需要玩家之间进行合作以实现共同目标。

Facebook 使用机器人在游戏中相互合作,直到他们超越了之前使用的 AI 系统。最近最好的 AI 系统在游戏中取得了 23.92 分(满分 25 分),而新的 AI 达到了 24.61 分(满分 25 分)。

今年 2 月,谷歌、DeepMind、卡内基梅隆大学和牛津大学的研究人员提出了花火基准,并创建了能够玩这个游戏的额外 AI,他们称之为“AI 研究的新前沿”。

研究人员对这一新发展感到兴奋,因为帮助机器人合作的同一 AI 可能可以应用于其他领域。一个可能的应用是改善虚拟助手与人类的交互方式。

Facebook AI 研究员诺姆·布朗(Noam Brown)谈到了新的 AI 系统。

“这其中的一个令人兴奋的事情是,我们观察到的改进与深度强化学习中观察到的改进是正交的:您可以将其添加到任何策略之上,它将使其变得更加强大,”布朗在接受 VentureBeat 采访时说。“我们看到结果远远超过了我们或其他研究人员的预期。事实上,搜索带来的好处比过去使用的所有深度强化学习算法带来的好处更强。”

Facebook 的 AI 新发展出现在研究人员继续创建能够挑战最复杂游戏的软件的时候。2016 年,谷歌的 DeepMind AI 系统击败了中国象棋游戏中最好的人类玩家。

花火现在被认为是测试 AI 的最佳游戏,因为它建立在团队合作和策略之上,这是 AI 需要达到的一个重要里程碑。在这种环境中使用时,AI 可以改进和变得更加复杂。

亚当·勒勒(Adam Lerer)是 Facebook 研究员和论文的贡献者。

“我认为我们转向这些合作游戏的原因之一是,我们已经到了一个地步,至少在竞争性游戏方面,没有游戏可以玩了,”他说。

花火有 2 到 5 名玩家,他们被发放随机的牌。这些牌有不同的颜色和数字,团队将它们放在桌子上,按照颜色和正确的数字顺序排列。

玩家无法看到自己的牌,但队友可以看到。玩家可以给队友提示。例如,队友可以给出关于颜色的提示,导致其他人打出或丢弃牌。

游戏中更复杂的一个方面是,玩家必须弄清楚线索的含义。这部分对于机器人来说很难弄清楚,因为他们只有有限的信息。

机器人能够建立策略是因为 Facebook 使用的技术和强化学习。Facebook 相信这种技术可以应用于其他领域,如机器人、自动驾驶汽车和其他系统。

“这对人类来说是非常自然的事情,这种能够站在别人的角度,理解他们为什么采取某些行动,思考什么,甚至不知道某些事情。但是,这是 AI 历史上一直难以做到的,”他说。“关于灵长类动物是否具有心智理论以及人类婴儿在什么年龄发展出心智理论,已经有很长时间的争论,我认为终于在 AI 中看到这种行为是非常有趣的。我认为这将在我们希望部署 AI 到现实世界与人类交互时非常重要,因为人类期望这种行为。”

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。