Thought Leaders
January 1, 2026
2026:企业领域特定人工智能之年
对于急于整合人工智能的企业来说,无论技术发展多快,一个障碍始终反复出现:幻觉。最近一份贝恩公司的报告发现,尽管过去一年企业的实验和投资大幅增加,但输出质量仍然是生成式人工智能采用的主要障碍。更复杂的是,根据一份报告,ChatGPT、Copilot和Perplexity等人工智能助手有45%的时间会扭曲新闻内容,引入缺失的上下文、误导性细节、错误的归因或完全捏造的信息。我们正在走出人工智能的“惊叹”阶段,进入性能阶段,在这个阶段,可衡量的影响比新奇性更重要。这些不准确之处不仅会侵蚀信任,还会使企业决策面临风险。一个单一的幻觉洞察可能导致声誉损害、战略失误或代价高昂的操作错误。然而,为了避免落后于同行,许多组织仍在部署并非为其行业专业工作流程和监管约束而构建的通用人工智能模型。依赖通用人工智能的风险通用模型显然有其优势。它们在广泛的构思、起草和加速日常沟通任务方面非常有效。但随着企业将人工智能的使用扩展到更专业化或受监管的工作流程中,新的风险类别开始出现。幻觉只是风险格局的一部分。它们伴随着一系列日益增多的高风险漏洞,例如越狱、提示注入和敏感数据暴露。当人工智能触及关键任务工作流程时,这些威胁变得更加严峻。今年早些时候,医疗保健应用出现了多起具有临床意义的幻觉案例,包括误诊概率增加。这暴露了在高风险环境中使用非专业模型的更大危险。一个被误解的医疗摘要或不正确的建议可能会带来改变生活的后果,同时也会中断原本顺畅的工作流程。难怪72%的标准普尔500指数公司现在报告了与人工智能相关的风险,而2023年这一比例仅为12%。他们的担忧范围从数据隐私和偏见到知识产权泄露和监管合规,这标志着一个更广泛的转变:公司董事会和投资者越来越像对待网络安全一样严肃对待人工智能风险。向专业化人工智能系统的转变2025年证明,仅靠规模已不再能驱动重大突破。虽然生成式人工智能的早期阶段以“越大越好”为特征,但我们已经达到了一个平台期,增加模型规模和训练数据只能带来微小的增益。专业化的、领域特定的人工智能模型并不试图无所不知;相反,它们被设计为在特定行业或工作流程的背景下了解重要信息。专为特定目的构建的人工智能带来三个关键好处: 更高的准确性:基于公司和行业信息训练的模型在精确性和可靠性方面优于通用模型。 更快的投资回报率:由于这些系统直接映射到定义好的任务和工作流程,它们能更快地带来可衡量的影响。 更安全的部署:专为特定目的构建的系统更自然地符合特定行业的法规,降低了风险并促进了内部采用。 人工智能市场正在做出相应反应:像Harvey(法律运营)、OpenAI的Project Mercury(金融建模与分析)以及Anthropic的Claude for Life Sciences(科学研究与发现)等工具反映了向专业化更广泛的转向。原因很简单:目前只有39%的公司报告其人工智能投资直接带来了利润,这表明仅靠通用工具无法产生企业级的投资回报率。实现真实、可衡量的人工智能投资回报率专为特定目的构建的人工智能在应用于结构化、可重复、明确定义的工作流程时表现出色。这些系统不是提供跨越数百万个主题的广泛但肤浅的知识,而是在诸如并购分析、合规、风险评分、客户画像开发和运营预测等任务中提供精确的性能。这种差异既是功能性的,也是经济性的。从实验转向大规模实施的公司越来越多地通过投资回报率的视角来评判人工智能投资。许多取得最强劲成果的公司都关注三个优先事项: 聚焦的、与工作职责一致的影响:人工智能必须切实改善生产力、盈利能力或决策能力,而不仅仅是产生令人印象深刻的输出。 监管一致性:构建时考虑到合规性的工具减少了后续的摩擦。 员工采用:技能提升、治理和文化准备与技术性能同样重要。 在评估供应商时,公司应确保系统是为他们实际需要做出的决策而构建的。首先从准确性开始:模型能否处理您领域的术语、约束条件和边缘情况?然后看透明度。供应商应能解释模型是如何基于事实的、依赖哪些数据源,以及其输出是否清晰可引用。在企业环境中,一个可以追溯到可信来源的答案与答案本身同样重要。最后,评估系统融入现有工作流程的难易程度。最成功的人工智能部署是团队能够信任、管理并无须增加复杂性即可集成的系统。值得信赖的企业人工智能的未来在于领域特定性随着企业从人工智能炒作转向运营现实,信任和可靠性将成为成功部署的决定性属性。仅靠规模已不再能保证性能突破。企业人工智能采用的下一阶段将由模型提供的洞察的相关性和价值来定义。2026年将完成从生成式人工智能作为孤立工具到集成系统的转变。这也将是人工智能变得更加主动、嵌入式且行业特定化的一年。随着生成式人工智能融入每个产品、服务和流程,它将逐渐淡入背景。差异化将来自那些理解上下文并能带来可衡量影响的系统。在2026年,真正的价值将来自于使用为企业实际需要做出的决策而设计的模型。