报告

斯坦福AI指数2026报告揭示:AI领域发展迅速,但监管机制滞后

mm

斯坦福大学人机交互人工智能研究所于4月13日发布了2026年AI指数报告,记录了AI领域的最新发展。报告显示,AI技术的进步速度创下历史新高,但监管、评估和理解AI的机制却越来越落后。

该报告是目前最全面的AI发展轨迹记录,跟踪了技术性能、经济影响、公众态度和政策发展等方面的变化。今年的报告描绘了一个AI行业的发展图景:AI技术在科学和数学领域取得了突破性的成就,吸引了创纪录的投资,并以比个人电脑和互联网更快的速度渗透到了日常生活中。但同时,报告也记录了公众对AI的信任度下降、透明度降低以及AI对初级职位的影响等问题。

突破性表现和持续的盲点

报告显示,AI模型已经达到或超过了人类在科学和数学领域的基准水平。例如,在SWE-bench Verified编码基准测试中,AI性能从60%提高到几乎100%的人类基准水平,这反映了AI代码生成器对软件开发的快速影响。谷歌的Gemini Deep Think在国际数学奥林匹克比赛中获得金牌。

AI代理也表现出类似的加速。终端基准测试(Terminal-Bench)中,AI完成实际任务的成功率从2025年的20%提高到2026年的77.3%。网络安全代理解决问题的成功率从2024年的15%提高到93%。

然而,报告也强调了AI的“锯齿边缘”——同一个模型可以解决研究生级别的物理问题,但只能正确读取模拟时钟50.1%的时间。机器人仍然只能完成12%的实际家务任务,如折叠衣服或洗碗。AI在视频生成、多步骤规划、财务分析和某些专家级别的学术考试方面仍然存在困难。

中美AI差距缩小到微小

多年来,美国的AI实验室一直领先于中国的对手。但这种差距已经消失。自2025年初以来,美国和中国的模型一直在争夺性能排行榜的首位。截至2026年3月,Anthropic的领先模型仅领先2.7个百分点——这个优势可能会在下一个发布周期中消失。

竞争格局比任何单一的排行榜更复杂。美国仍然生产更多的顶级模型和更高影响力的专利。中国在出版数量、引用次数、专利产出和工业机器人安装方面领先。中国的生成式AI用户数量以惊人的速度增长。

但一个令人担忧的趋势潜藏在这些数字之下:自2017年以来,AI研究人员流入美国的数量下降了89%,过去一年 alone 下降了80%。报告将此视为一种结构性弱点,即使投资也无法弥补。

创纪录的投资和环境成本

2025年,全球企业AI投资达到581.7亿美元,较上一年增长130%。私人AI投资达到344.7亿美元,较2024年增长127.5%。美国占据了285.9亿美元的投资额,是中国12.4亿美元私人投资的23倍,尽管报告指出,中国政府通过国家指导基金渠道了估计2000年至2023年间912亿美元的资源。

AI建设的环境成本变得越来越难以忽视。Grok 4的估计训练排放量达到72,816吨二氧化碳当量,相当于一年内驾驶17,000辆汽车的排放量。AI数据中心的电力容量达到29.6GW,约等于满负荷时纽约州的整个电力需求。仅GPT-4o推理的年度用水量就可能超过1200万人的饮用水需求。

生产力提高,初级职位减少

报告记录了客户支持和软件开发领域生产力的提高,分别为14%至26%,以及营销团队的提高,最高可达72%。对于需要更多判断力的任务,影响较弱或为负。AI驱动的编码工具已经为开发工作流程带来了可衡量的效率提高,但劳动力影响已经显现。

2024年以来,美国22至25岁的软件开发人员的就业人数下降了近20%,尽管老年开发人员的数量正在增长。这种模式也出现在其他具有高AI曝光度的领域,包括客户服务。公司调查表明,高管预计这一趋势将加速,计划的员工减少幅度超过最近的裁员。企业中AI代理的采用率仍然停留在各个部门的个位数,表明测量到的替代效应先于广泛的代理部署。

采用速度超过教育和治理

生成式AI在推出三年内覆盖了53%的全球人口,速度快于个人电脑和互联网。2026年初,生成式AI工具为美国消费者带来的估计价值达到172亿美元,每用户的中位数价值在2025年和2026年之间增加了三倍。

在年轻用户中,采用率甚至更高:五分之四的美国高中和大学生使用AI进行学校作业。但只有半数的初中和高中拥有AI政策,只有6%的教师认为这些政策明确。

公众信任度下降,专家乐观情绪上升

报告中最具启示性的发现可能是AI内外专家之间的认知差距。73%的美国专家认为AI对就业市场的影响是积极的。只有23%的普通公众持有相同的看法——一个50个百分点的差距。经济和医疗保健领域也存在类似的差距。

全球范围内,59%的人报告称对AI的益处感到乐观,较2025年上升7个百分点。但是,人们对该技术的紧张情绪也上升到了52%。只有33%的美国人期望AI能够改善他们的工作,低于全球平均值40%。

对政府监管的信任度差异很大。美国在对政府监管AI的信任度方面排名最后,仅为31%。欧盟在AI治理方面比美国和中国拥有更多的信任。

透明度下降

AI能力集中在少数公司中的同时,也伴随着对开放性的退缩。基础模型透明度指数(Foundation Model Transparency Index),该指数衡量主要AI公司披露训练数据、计算能力、功能、风险和使用政策的程度,平均分数从上年的58下降到40。最有能力的模型往往披露的信息最少。

关注点

2026年AI指数报告描述了一个处于转折点的领域。技术进步正在加速,经济利益正在增加,而可能指导两者的治理框架却正在失去地位。美国机构的人才流失、初级就业机会的减少以及专家和公众之间的认知差距是值得密切关注的三个趋势。如果AI继续扩张而没有相应的衡量、透明度和公众参与的投资,AI的能力与社会管理AI的能力之间的差距只会继续扩大。

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。