人工智能

什么是图灵测试以及为什么它很重要？

更新 on 2020 年 9 月 27 日

安托万·塔迪夫

如果您接触过人工智能 (AI)，那么您无疑听说过“图灵测试'。这是阿兰·图灵在1950年首次提出的测试，该测试旨在作为人工智能是否达到人类水平智能的终极实验。从概念上讲，如果人工智能能够通过测试，它就已经达到了与人类相当或没有区别的智能。

我们将探讨谁阿兰·图灵就是，测试是什么，为什么它很重要，以及为什么测试的定义可能需要发展。

艾伦·图灵是谁？

图灵是一位古怪的英国数学家，因其未来主义的突破性想法而闻名。

1935 年，22 岁的他在概率论方面的研究为他赢得了剑桥大学国王学院的院士奖。他的抽象数学思想推动他在一个尚未发明的领域走向完全不同的方向。

1936 年，图灵发表了一篇论文，现在被认为是计算机科学的基础。他就是在这里发明了这个概念可以解码并执行任何指令集的“通用机器”。

1939年，图灵被英国政府密码破译部门招募。当时德国正在使用所谓的“谜机' 至对其所有军事和海军信号进行加密。图灵迅速开发了一台新机器（'炸弹”）它能够在工业规模上破解 Enigma 信息。这一发展被认为有助于帮助击退纳粹德国的侵略。

1946 年，图灵重新致力于他于 1936 年发表的革命性想法，即开发一台能够运行各种类型计算的电子计算机。他为所谓的“ 自动计算引擎（高手。）

1950 年，图灵发表了他的开创性著作，询问“机器会思考吗？”。这篇论文彻底改变了计算机科学和人工智能。

1952年，在被一名年轻人举报后，图灵因同性恋活动而被判犯有严重猥亵罪。因此，他的政府安全许可被撤销，他的职业生涯被毁。为了惩罚他，他被化学阉割。

8 年 1954 月 XNUMX 日，他的生活支离破碎，后来在家里被清洁工发现。前一天，他死于氰化物中毒。他的尸体旁边放着一个被吃了一半的苹果。验尸官的判决是自杀。

幸运的是，他的遗产继续存在。

什么是图灵测试？

1950年，阿兰·图灵发表了一篇开创性的论文，题为“计算机与智能”在《心灵》杂志上。在这篇详细的论文中，问题是“机器能思考吗？” 被提议。该论文建议放弃对机器是否可以思考的定义，而用“模仿游戏”来测试机器。这个简单的游戏由三个人玩：

一个男人（A）
一个女人（B），
审讯员 (C)，可以是任意性别。

游戏的概念是审讯者呆在一个与男人（A）和女人（B）分开的房间里，目标是让审讯者识别出男人是谁，女人是谁。在这种情况下，男人（A）的目标是欺骗审讯者，同时女人（B）可以尝试帮助审讯者（C）。为了公平起见，不能使用任何口头提示，而只能来回发送打印的问题和答案。那么问题就变成了：审讯者如何知道该信任谁？

询问者只知道它们的标签 X 和 Y，并且在游戏结束时，他简单地陈述“X 是 A，Y 是 B”或“X 是 B，Y 是 A”。

那么问题就变成了，如果我们去掉男人（A）或女人（B），并用智能机器代替那个人，机器能否利用其人工智能系统来欺骗审讯者（C）相信他是男人或女人？一个女人？这本质上就是图灵测试的本质。

换句话说，如果你在不知情的情况下与人工智能系统进行交流，并且你假设另一端的“实体”是人类，那么人工智能会无限期地欺骗你吗？

为什么图灵测试很重要

在艾伦图灵的论文中，他提到了这样一个事实：他相信图灵测试最终可以被击败。他说：“到 2000 年，我相信在大约 10 年后，将有可能对计算机进行编程，其存储容量约为 XNUMX⁹，让他们玩模仿游戏，以至于一般审讯者在五分钟的审讯后做出正确识别的机会不会超过百分之七十。=

当通过现代视角看待图灵测试时，人工智能系统似乎很有可能欺骗人类五分钟。人类与支持聊天机器人互动的频率有多高，但不知道聊天机器人是人类还是机器人？

有许多关于图灵测试通过的报道。 2014年，一个名为的聊天机器人程序尤金·古斯特曼该游戏模拟了一名13岁的乌克兰男孩，据说在雷丁大学组织的一次活动中通过了图灵测试。该聊天机器人显然让伦敦皇家学会 33% 的评委相信它是人类。尽管如此，批评者还是很快指出了测试的不足之处、许多评委不相信这一事实、测试的持续时间（只有 5 分钟）以及缺乏即将到来的证据来证明这一成就。

2018年，Google Duplex预订系统在Google Assistant的帮助下，给一家发廊打电话预约理发。在这种情况下，人工智能系统并没有将自己介绍为人工智能，而是在通话过程中假装人类与沙龙的接待员交谈。简短的交流后，理发就顺利约好了，双方都挂断了电话。

Google I/O 2018 Google Duplex 美发沙龙电话会议

Google I/O 2018 Google Duplex Hair Salon Call

Watch this video on YouTube

尽管如此，现在是自然语言处理（NLP）的时代，其子领域包括自然语言理解（NLU）和自然语言解释（NLI），如果机器在没有完全理解的情况下提出和回答问题，那么就需要提出这个问题。理解其背后的背景，机器真的智能吗？

毕竟，如果您回顾沃森背后的技术，一个能够回答以自然语言提出的问题的计算机系统，由 IBM 开发，用于击败 Jeopardy 冠军，很明显，沃森通过互联网下载大量世界知识，而无需真正理解世界知识，从而能够击败世界冠军。该语言背后的上下文。有 200 亿页信息，来自包括维基百科在内的各种来源。沃森在玩游戏时无法访问互联网，但对于可以在游戏开始前访问所有人类知识的人工智能来说，这只是一个小限制。

与搜索引擎类似，创建了关键字和参考点。如果人工智能能够达到这种理解水平，那么我们应该考虑到，基于当今先进的技术，欺骗人类 5 到 10 分钟根本就没有设定足够高的标准。

图灵测试应该发展吗？

图灵测试在经受住时间的考验方面做得非常出色。尽管如此，自 1950 年以来，人工智能已经发生了巨大的发展。每当人工智能实现我们声称只有人类才能做到的壮举时，我们就会设定更高的标准。人工智能能够持续通过我们所理解的图灵测试只是时间问题。

回顾人工智能的历史，人工智能能否达到人类智能水平的最终晴雨表几乎总是基于它能否在各种游戏中击败人类。 1949年，克劳德香农发表了他关于如何让计算机下国际象棋这一主题的想法，因为这被认为是人类智能的终极顶峰。

直到 10 年 1996 月 XNUMX 日，经过三个小时的艰苦比赛后，国际象棋世界冠军加里·卡斯帕罗夫在与深蓝的六场比赛中输掉了第一场比赛，一台 IBM 计算机，每秒能够评估 200 亿次动作。不久之后，国际象棋就不再被认为是人类智力的顶峰。国际象棋随后被围棋游戏所取代，围棋游戏起源于3000多年前的中国。人工智能实现人类智能水平的门槛提高了。

时间快进到 2015 年 XNUMX 月，AlphaGo 与三届欧洲冠军卫冕冠军樊麾先生进行了首场比赛。 AlphaGo 赢得了第一场与围棋职业选手的比赛比分是5-0。围棋被认为是世界上最复杂的游戏 10³⁶⁰可能的举动。突然间，酒吧又上移了。

最终争论的焦点是人工智能必须能够击败 MMORPG（大型多人在线角色扮演游戏）的玩家团队。 OpenAI 通过使用深度强化学习迅速应对挑战。

正是由于众所周知的条形图的这种一致移动，我们应该重新考虑图灵测试的新现代定义。当前的测试可能过于依赖欺骗和聊天机器人中的技术。随着机器人技术的发展，我们可能会要求人工智能真正实现人类水平的智能，人工智能将需要在我们的现实世界中进行交互和“生活”，而不是游戏环境或具有其定义规则的模拟环境。

如果机器人能够像其他人类一样与我们互动，通过对话、提出想法和解决方案，而不是欺骗我们，也许只有这样才能通过图灵测试。图灵测试的最终版本可能是人工智能接近人类，并试图让我们相信它具有自我意识。

至此，我们也就实现了通用人工智能（AGI）。那么人工智能/机器人在智力上迅速超越我们将是不可避免的。