关注我们.

人工智能能否通过人类认知测试?探索人工智能的极限

人工智能

人工智能能否通过人类认知测试?探索人工智能的极限

mm
人工智能认知测试挑战

DigiOps与人工智能 从自动驾驶汽车到辅助医疗诊断,人工智能技术已取得显著进展。然而,一个重要的问题仍然存在: 人工智能能否通过为人类设计的认知测试? 虽然人工智能在以下领域取得了令人瞩目的成果 语言处理 和解决问题的能力,但它仍然难以复制人类思维的复杂性。

人工智能模型如 ChatGPT 可以有效地生成文本并解决问题,但在面对认知测试时,它们的表现并不那么好,例如 蒙特利尔认知评估 (MoCA),旨在衡量人类智力。

人工智能的技术成就与认知局限性之间的差距凸显了其潜力面临的重大挑战。人工智能尚未达到人类思维的水平,尤其是在需要抽象推理、情感理解和情境感知的任务上。

了解认知测试及其在人工智能评估中的作用

认知测试,例如 MoCA,对于衡量人类智力的各个方面至关重要,包括记忆力、推理能力、解决问题能力和空间意识。这些测试通常用于临床诊断阿尔茨海默病和痴呆症等疾病,有助于了解大脑在不同情况下的功能。回忆单词、画钟表和识别图案等任务可以评估大脑应对复杂环境的能力,而这些技能在日常生活中至关重要。

然而,当应用于人工智能时,结果却大相径庭。ChatGPT 或谷歌 Gemini 等人工智能模型可能擅长识别模式和生成文本等任务,但它们在需要更深入理解的认知方面却举步维艰。例如,虽然人工智能可以遵循明确的指令完成任务,但它缺乏抽象推理、解读情绪或运用情境的能力,而这些正是人类思维的核心要素。

因此,认知测试在评估人工智能时具有双重目的。一方面,它们凸显了人工智能在处理数据和高效解决结构化问题方面的优势。另一方面,它们也揭示了人工智能在复制人类所有认知功能方面存在的巨大差距,尤其是在涉及复杂决策、情商和情境感知等方面。

随着人工智能的广泛应用,其在医疗保健和自主系统等领域的应用要求的不仅仅是完成任务。认知测试为评估人工智能能否处理需要抽象推理和情感理解的任务提供了基准,而这些正是人类智能的核心特质。例如,在医疗保健领域,虽然人工智能可以分析医疗数据并预测疾病,但它无法提供情感支持,也无法根据患者的具体情况做出细致的决策。同样,在自动驾驶汽车等自主系统中,解读不可预测的场景通常需要类似人类的直觉,而目前的人工智能模型恰恰缺乏这种直觉。

通过为人类设计的认知测试,研究人员可以识别人工智能需要改进的领域,并开发更先进的系统。这些评估还有助于设定对人工智能能够实现的目标的切合实际的期望,并强调哪些领域仍然需要人类的参与。

认知测试中的人工智能局限性

人工智能模型在数据处理和模式识别方面取得了令人瞩目的进步。然而,在涉及抽象推理、空间感知和情感理解的任务时,这些模型面临着巨大的局限性。 最近的一项研究 该研究使用蒙特利尔认知评估(MoCA,一种用于衡量人类认知能力的工具)对多个人工智能系统进行了测试,结果显示人工智能在结构化任务方面的优势与其在更复杂的认知功能方面面临的困难之间存在明显差距。

在这项研究中,ChatGPT 4o 得分为 26 分(满分 30 分),表明存在轻度认知障碍,而谷歌的 Gemini 得分仅为 16 分(满分 30 分),表明存在重度认知障碍。人工智能面临的最大挑战之一是视觉空间任务,例如绘制时钟或复制几何形状。这些任务需要理解空间关系并组织视觉信息,而人类凭借直觉的优势正是这些领域。尽管收到了明确的指令,人工智能模型仍然难以准确完成这些任务。

人类认知整合感官输入、记忆和情感,从而实现自适应决策。人们在解决问题时,尤其是在模糊的情况下,依赖直觉、创造力和情境。这种抽象思维和在决策中运用情商的能力是人类认知的一个关键特征,它使人们能够应对复杂多变的情境。

相比之下,人工智能的工作原理是通过算法和统计模式处理数据。虽然它可以根据学习到的模式生成响应,但它并不能真正理解数据背后的背景或含义。这种理解能力的缺乏使得人工智能难以执行需要抽象思维或情感理解的任务,而这些能力在认知测试等任务中至关重要。

有趣的是,在人工智能模型中观察到的认知局限性与阿尔茨海默病等神经退行性疾病中观察到的损伤有相似之处。在研究中,当人工智能被问及空间感知能力时,它的回答过于简单且依赖于具体情境,类似于认知能力下降的个体。这些发现强调,虽然人工智能擅长处理结构化数据和进行预测,但它缺乏进行更细致决策所需的深度理解。这种局限性尤其体现在医疗保健和自主系统方面,因为判断和推理在这些领域至关重要。

尽管存在这些局限性,但仍有改进的潜力。较新版本的人工智能模型,例如 ChatGPT 4o,在推理和决策任务方面已取得进展。然而,复制类似人类的认知需要改进人工智能设计,这可能通过以下方式实现: 量子计算 或更先进的神经网络。

人工智能在复杂认知功能方面的挑战

尽管人工智能技术取得了长足进步,但距离通过为人类设计的认知测试仍有很长的路要走。虽然人工智能擅长解决结构化问题,但在更细微的认知功能方面却有所欠缺。

例如,当被要求绘制几何形状或解读空间数​​据时,AI 模型常常会出错。人类天生就能理解和组织视觉信息,而 AI 却难以有效地做到这一点。这凸显了一个根本问题:AI 处理数据的能力并不等同于理解人类思维的工作方式。

人工智能局限性的核心在于其基于算法的本质。人工智能模型通过识别数据中的模式来运作,但它们缺乏人类用于决策的情境感知和情商。虽然人工智能可以根据训练内容高效地生成输出,但它无法像人类那样理解这些输出背后的含义。这种无法进行抽象思维,加上缺乏同理心的特性,阻碍了人工智能完成需要更深层次认知功能的任务。

人工智能与人类认知之间的差距在医疗保健领域尤为明显。人工智能可以协助完成诸如分析医学扫描或预测疾病等任务,但它无法在涉及了解患者情况的复杂决策中取代人类的判断。同样,在自动驾驶汽车等系统中,人工智能可以处理大量数据来检测障碍物,但它无法复制人类在突发情况下做出瞬间决策时所依赖的直觉。

尽管面临这些挑战,人工智能仍展现出改进的潜力。较新的人工智能模型开始处理涉及推理和基本决策的更高级任务。然而,即使这些模型不断进步,它们仍然远远达不到通过为人类设计的认知测试所需的广泛认知能力。

底线

总而言之,人工智能在许多领域取得了令人瞩目的进步,但要通过为人类设计的认知测试,仍有很长的路要走。虽然人工智能可以处理数据和解决问题等任务,但在需要抽象思维、同理心和情境理解的任务上却举步维艰。

尽管人工智能取得了一些进步,但它在空间感知和决策等任务上仍然举步维艰。尽管人工智能在未来展现出光明前景,尤其是在技术进步的背景下,但它距离复制人类认知还相去甚远。

阿萨德·阿巴斯博士 终身副教授 在巴基斯坦伊斯兰堡 COMSATS 大学获得博士学位。 来自美国北达科他州立大学。 他的研究重点是先进技术,包括云、雾和边缘计算、大数据分析和人工智能。 阿巴斯博士在著名的科学期刊和会议上发表文章,做出了重大贡献。