思想领袖
企业中的AI:计算完整成本

AI已经超越了理论和新颖性。对于许多组织来说,它现在与核心系统一起成为基础设施的一部分。很多人仍然认为AI主要是公共LLM和聊天机器人——可以在浏览器中使用并在完成后丢弃的东西。通过这种视角来看AI,可以忽略更广泛的模型和技术,这些模型和技术可以更高效地改善结果,带来更少的风险。
事实上,AI应该像其他任何重大基础设施投资一样被评估——从一开始就有明确的成本、收益和运营风险视图。将其带到可用状态意味着投资于高质量的数据管道、可观察性、治理和保持AI与期望的业务结果一致的人员。这里的捷径会将账单转移到未来,并附加利息。
AI成本如何真正扩展
可以理解,团队可能会认为AI成本以直线方式增长:做两倍的工作,支付两倍的钱。实际上,努力、成本和结果可以独立地以意想不到的方式移动。当要求AI一次读取长文档时,它必须考虑每个词与其他每个词的关系。在大多数流行的LLM中,这意味着所涉及的工作量和因此而产生的成本不会以人们自然期望的方式增长——输入量加倍,成本加倍——而是随着输入长度的平方而增长。了解诸如这一点的基本原理可以对任何AI部署的底线产生真正的影响。如果一个组织每天处理大量文本,例如监管机构,最初就设计了基于图搜索或检索管道的系统,而不是将整个文档发送到模型,用户体验仍然是“提问,几秒钟内得到答案”,就像公共聊天机器人一样。这让AI热衷的高管们对即时交互感到满意,同时在表面下,系统做的不必要工作更少,计算账单也更低。
AI支出如何在组织中分配
技术选择只是故事的一部分,另一部分是组织如何从一开始就接近AI。在许多组织中,数据准备与工程部门在一起。合规审查与法律部门在一起。云支出与平台或基础设施团队在一起。模型选择、配置和任何微调通常与少数专家操作员在一起。每个群体看到自己的工作和自己的预算线。支出显示为这里的计算,那里的人员时间,并且被吸收到“业务正常”中,分散在几个团队中。由于数字分散在成本中心,单个AI计划的全部落地成本可能在任何一个地方都不可见,并且容易被低估。在这种环境中,AI成本可能会悄悄地飙升,只是因为没有人在一个地方跟踪整个数字。
AI成本管理的实用方法
避免AI并不是组织的正确做法,但将AI视为万能技术也不是正确的做法。好的策略始终是从期望的结果开始,反向工作。并非每种情况都需要最先进、昂贵的运行、大型通用模型。许多任务可以通过机器学习技术来处理,这些技术属于AI的范畴,可以在现有的基础设施上运行。
从小型试点项目开始,测量所有权的总成本,而不仅仅是模型使用情况,这意味着要看计算、当然,还要看集成工作、工程时间、变更管理和合规努力。目标是选择最小、最简单的模型来实现可接受的结果,而不是假设“更多的模型”意味着“更多的好处”。
AI不是一件事,它是可以以不同方式使用的技术和工具的组合。以这种方式看待AI,可以打破围绕令人印象深刻的结果的神秘感,并允许企业以更大的责任感和更大的效果来利用其力量。
人、时间和AI
每个AI部署在实践中都是人和软件之间的合作。无论是否正式承认,这就是工作的完成方式。当前向更多代理AI的转变——可以链接步骤、调用其他系统并在较少提示下运行的工具——并没有改变这一点,实际上它提高了正确的人员工作流程的赌注。
这些工具很容易被过度信任。当系统流利地和自信地提供答案时,人们自然会认为它通常是正确的。如果没有适当的培训、明确的界限和合理的检查,就将这种工具放入工作流程中,它可以悄悄地产生一系列小错误。每个错误都必须由一个人发现、理解和修复。在纸面上,AI看起来很高效,但在实践中,有一个隐藏的成本,就是额外的人类时间来清理它造成的混乱。在面向客户或受监管的环境中,这些小错误还可能带来声誉损失。然而,无论工具如何交付或使用,对其输出的责任仍然归属于组织,并且在日常生活中归属于使用它们的人类操作员。这需要被明确理解,才能使这些工具真正有用。
更好的模式是故意的合作伙伴关系:熟练的人员保持对结果的明确控制,AI被用来加速适合它的工作部分,例如总结、草拟、分类、搜索。即使需要一些检查和更正,AI在工作流程中的整体效果也可以是速度、一致性和能力的增加,这是人类团队无法独自实现的。
治理作为AI预算的一部分
即使技术选择是合理的,使用是高效的,AI支出中越来越大的一部分将与原始计算而不是治理相关联。对于在欧盟运营的组织,AI法案使这一点变得非常明确。它对AI采取基于风险的视角,这一点很重要,这并不仅仅适用于面向公众的产品。在招聘和晋升、员工管理和监控以及某些安全相关决策等领域使用的内部系统可能会受到影响,并带来对风险管理、文档记录、日志记录和人类监督的期望。其他地区正在朝着类似的方向发展,即使规则看起来略有不同,但总体趋势是相同的:较大的组织预计会知道AI在哪里使用、做什么以及如何控制它。
这对内部AI项目的实际影响是,它们现在带有自己的治理工作量,这不是可选的。每个新用例可能意味着新的风险或影响评估、更多的监控和来自合规、审计或风险团队的更多问题。这些都不会出现在模型使用指标中,但它们是必须支付的真正工作量。
这并不是不使用AI的理由。它提醒我们,内部AI启用流程的运行成本不仅仅是调用模型的价格。治理和监管期望现在是所有权的总成本的一部分。
AI部署何处出错
AI项目中熟悉的模式是演示和实际使用之间的差距。在受控环境中,具有狭窄的问题集和友好数据,结果可能看起来完美。在那一刻,很容易认为系统已经准备好承担一整类工作。
问题往往出现在稍后,当系统暴露在真实使用的全部多样性和数量时:不寻常的查询、紧张的用户、不完整的记录、凌乱的边缘情况。在演示中看不到的裂缝开始表现为误导的答案、错过的细微差别、支持循环、更长的处理时间和对信任的安静损害。内部指标,例如“处理的查询”和“节省的时间”,可能看起来很好,但最终用户的实际体验可能会讲述一个不同的故事。
直接从精致的演示或小型试点跳转到更广泛的部署,仅凭在受控条件下取得的成功作为系统准备就绪的证据,这可能是一个代价高昂的错误。在现实世界中,用户带来了凌乱的查询、不完整的数据和他们自己的关于工具可以做什么的假设。如果期望没有得到管理,系统周围的工作流程没有设计为具有后备和升级机制,组织将支付双倍的费用:一次用于构建,另一次用于额外的支持、返工、投诉和失去的信任。技术可能看起来令人印象深刻,但如果没有对其如何满足真实的人员和真实流程的务实态度,投资的回报率就会迅速侵蚀。
另一方面,经过精心设计的系统,具有内置的明确界限和人类所有权,可以做到人类团队无法独自完成的事情:在几秒钟内扫描大量信息,跨多年数据发现模式,并处理通常超出范围的常规决策。关键是,要获得这些好处,组织必须将雄心与对技术在现实世界中将如何表现的现实视角相匹配。
结束语
这并不是反对AI的论点,而是将其与其他任何可以从根本上改变业务运营的系统一样严肃对待的论点。
当AI被有效利用时,它可以帮助小团队以更大的规模运作,发现手动难以发现的模式,并使专家判断更进一步。但是,要达到这一点,需要对AI的使用、总成本和治理有明确的认识。这意味着要对模型和架构做出有意的选择,投资于数据和可观察性,并设计保持人员参与的流程。
“快速行动,打破事物”是一句为人类团队在人规模的系统上工作而写的口号:如果某事物坏了,你会将其回滚、修补并继续前进。一旦AI被编织到客户、员工或公民的决策中,这种态度会产生更快、更强烈、更难以逆转的问题。速度仍然很重要,AI可以在这里提供帮助,但它必须与对风险、成本和责任的明确认识相匹配。
没有办法完全消除成本或风险。但是,有一种明显的区别,即那些依赖于临时实验的组织和那些以有序的方式将AI融入其运营的组织,具有从支出到成功的清晰视野。组织面临的各种问题和结果中,没有单一的AI解决方案可以解决所有问题。企业中AI的有效使用始终应是专业的、受监督的和谨慎的。












