AGI 与未来 AI

图灵测试是什么及其重要性？

发布于 2020年7月21日

更新于 2026年5月25日

作者

Antoine Tardif, Unite.AI 首席执行官兼创始人

如果您曾经接触过人工智能（AI），您一定听说过“图灵测试”。这是阿兰·图灵在1950年首次提出的测试，旨在确定AI是否达到人类水平的智能。从概念上讲，如果AI能够通过测试，它就达到了与人类相当或无法区分的智能水平。

我们将探讨阿兰·图灵是谁，图灵测试是什么，为什么它很重要，以及为什么图灵测试的定义可能需要演变。

谁是阿兰·图灵？

图灵是一位古怪的英国数学家，以其开创性的思想而闻名。

1935年，22岁的图灵凭借其概率理论研究获得了剑桥大学国王学院的研究员资格。他的抽象数学思想使他转向了一个尚未被发明的领域。

1936年，图灵发表了一篇论文，现被认为是计算机科学的基础。这是他发明了“通用机”的概念，可以解码和执行任何一组指令。

1939年，图灵被英国政府的密码破解部门招募。在那时，德国正在使用所谓的“恩尼格玛机”来加密所有军事和海军信号。图灵迅速开发了一台新机器（“炸弹”），能够大规模破解恩尼格玛消息。这一发展被认为在帮助阻止纳粹德国的侵略方面起到了重要作用。

1946年，图灵回到他在1936年发表的革命性思想上，开发了一台电子计算机，能够运行各种计算。他为自动计算引擎（ACE）设计了详细的计划。

1950年，图灵发表了他的开创性作品，询问“机器能否思考？”这篇论文彻底改变了计算机科学和人工智能。

1952年，在一名年轻人向警察举报后，图灵因其同性恋活动被判定为严重不端行为。因此，他的政府安全许可被撤销，他的职业生涯也被毁灭。为了惩罚他，他被化学阉割。

他的生活被摧毁后，他于1954年6月8日被他的清洁工人在家中发现。他在前一天死于氰化物中毒。一个半吃的苹果躺在他的身体旁边。验尸官的结论是自杀。

幸运的是，他的遗产继续存在。

什么是图灵测试？

1950年，阿兰·图灵在《心智》杂志上发表了一篇题为“计算机和智能”的论文。在这篇详细的论文中，提出了“机器能否思考？”的问题。该论文建议放弃定义机器是否能思考的尝试，而是用“模仿游戏”来测试机器。这个简单的游戏由三个人玩：

一个男人（A）
一个女人（B），
和一个审问者（C），可以是任何性别。

游戏的概念是审问者与男人（A）和女人（B）分开，目标是让审问者确定谁是男人，谁是女人。在这种情况下，男人的目标（A）是欺骗审问者，而女人（B）可以尝试帮助审问者（C）。为了公平，不能使用口头提示，只能使用打字问答。问题变成了：审问者如何知道谁值得信任？

审问者只知道他们的标签X和Y，并在游戏结束时简单地说“X是A，Y是B”或“X是B，Y是A”。

问题变成了，如果我们删除男人（A）或女人（B），并用一个智能机器代替，机器是否可以使用其AI系统欺骗审问者（C）使其相信它是男人或女人？这本质上是图灵测试的性质。

换句话说，如果你在不知不觉中与一个AI系统交互，并假设实体是人类，AI是否可以无限期地欺骗你？

图灵测试为什么重要

在阿兰·图灵的论文中，他暗示他相信图灵测试最终会被击败。他说：“到2000年，我相信在大约50年内，计算机将能够被编程，以便它们能够很好地玩模仿游戏，以至于平均审问者在5分钟的提问后不会有超过70％的机会做出正确的识别。”

通过现代视角来看，似乎完全有可能一个AI系统能够在5分钟内欺骗人类。我们有多久与支持聊天机器人交互，而不知道聊天机器人是人类还是机器人?

有很多报告称图灵测试已经通过。2014年，一个名为尤金·古斯曼的聊天机器人程序，模拟一个13岁的乌克兰男孩，据说已经在雷丁大学组织的活动中通过了图灵测试。聊天机器人显然说服了33％的伦敦皇家学会的法官相信它是人类。然而，批评者迅速指出测试的不足之处，包括法官数量不多，测试时间短（仅5分钟），以及缺乏证据。

2018年，谷歌的Duplex预约系统在谷歌助手的帮助下，致电一家美发沙龙预约一次理发。在这种情况下，AI系统没有自我介绍为AI，并在与沙龙接待员通话时假装成人类。在短暂的交流后，理发预约成功安排，双方挂断了电话。

https://youtu.be/0YaAFRirkfk

然而，在自然语言处理（NLP）的时代，其子领域包括自然语言理解（NLU）和自然语言解释（NLI），我们需要问，机器在不完全理解其所说内容的背景下询问和回答问题，是否真正具有智能?

如果我们审视IBM开发的沃森的技术，沃森是一种能够回答自然语言提出的问题的计算机系统，旨在击败《危险边缘》冠军，那么很明显，沃森能够通过从互联网下载大量世界知识（包括200万页的信息，来源包括维基百科）而不是真正理解语言背景来击败世界冠军。虽然沃森在游戏过程中无法访问互联网，但这对一个可以在游戏开始前访问所有人类知识的AI来说只是一个小限制。

类似于搜索引擎，关键词和参考点被创建。如果AI能够达到这种理解水平，那么我们应该考虑到，根据今天的技术进步，欺骗人类5或10分钟简直是低估了标准。

图灵测试是否应该演变？

图灵测试在经受住时间考验方面做得非常出色。然而，自1950年以来，AI已经发生了戏剧性的变化。每当AI实现我们认为只有人类才能做到的事情时，我们就会将标准提高。只不过是时间问题，AI就能一致地通过我们目前理解的图灵测试。

回顾AI的历史，判断AI是否能达到人类智能水平的最终标准几乎总是基于它是否能击败人类在各种游戏中。1949年，克劳德·香农发表了关于如何使计算机玩国际象棋的想法，因为这被认为是人类智能的巅峰。

直到1996年2月10日，世界象棋冠军卡斯帕罗夫在与IBM计算机Deep Blue的一场三小时比赛中输掉了第一场六场比赛中的第一场。没过多久，国际象棋就不再被认为是人类智能的巅峰。国际象棋被中国3000多年前发明的围棋所取代。AI达到人类智能水平的标准被提高了。

快进到2015年10月，AlphaGo对阵三届欧洲冠军范辉，AlphaGo以5-0的比分赢得了第一场比赛。围棋被认为是世界上最复杂的游戏，具有10^360种可能的走法。突然，标准又被提高了。

最终，人们认为AI必须能够击败大型多人在线角色扮演游戏（MMORPG）的玩家团队。OpenAI迅速通过使用深度强化学习来应对这一挑战。

由于标准的持续提高，我们应该重新考虑图灵测试的现代定义。当前的测试可能过于依赖欺骗和聊天机器人的技术。可能随着机器人技术的发展，为了真正达到人类智能水平，AI需要与我们在现实世界中交互和“生活”，而不是在游戏环境或模拟环境中。

如果机器人可以与我们交谈、提出想法和解决方案，可能只有到那时图灵测试才会通过。图灵测试的最终版本可能是当AI接近人类并试图说服我们它是自我意识的时刻。

到那时，我们也将实现人工通用智能（AGI）。到那时，AI/机器人将迅速超过我们的智能水平。

Antoine Tardif, Unite.AI 首席执行官兼创始人

安托万是一位具有远见的领导者和Unite.AI的联合创始人，他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者，他相信人工智能将对社会产生电力的影响一样的颠覆性影响，并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家，他致力于探索这些创新将如何塑造我们的世界。另外，他还是Securities.io的创始人，这是一个专注于投资尖端技术的平台，这些技术正在重新定义未来并重塑整个行业。

Unite.AI

图灵测试是什么及其重要性？

谁是阿兰·图灵？

什么是图灵测试？

图灵测试为什么重要

图灵测试是否应该演变？

发现更多