云计算预测的变化
作者 Jon Howe, 首席解决方案架构师,Myriad360 我曾经见过的模式我在云计算成为一种潮流时就开始了我的职业生涯。从那个角度,我看到了最初的采用:兴奋、灵活性、以及一切都将变得更快的感觉。这导致了大规模的采用,每个工作负载都是候选者,每个供应商都有一个云计算故事。然而,采用只是我看到的第一半。然后,我看到了另一面:复归。公司将特定的工作负载移回本地,询问每个应用程序是否真正需要云计算的灵活性。那次移动发生的原因是经济转变和工作负载的成熟度,曾经使云计算成为每个事情的明显选择的假设不再成立,一旦组织开始在规模上检查它们。既然我已经完整地经历了一次这样的过程,我就能在它再次形成时认识到它的形状。现在,当我帮助公司弄清楚AI在他们的环境中应该做什么时,大规模采用/复归模式开始看起来很熟悉。云计算的修正为了了解为什么这种相似之处很重要,有助于从云计算本身发生了什么开始。转向云计算是合理的。它消除了摩擦,给组织带来了灵活性和速度,并且对于不确定或快速变化的工作负载来说是有意义的。它是合理的,因为它是为特定类型的工作而设计的。DevOps团队优先考虑云计算,因为云计算是为迭代、可变或难以预测的工作而设计的。但是,他们正在建设的东西并没有保持静止。云计算没有改变,但工作负载已经改变了。随着流程成熟并变得可预测,组织开始关注获取自己的数据的成本。出口费、存储成本、传输费用:这些费用很容易被忽略,当灵活性是值得的,而当工作负载稳定下来时,这些费用就很难被忽略了。2024年,在多年收取数据出口费之后,AWS、Azure和Google Cloud都为客户提供了免费的数据出口服务,如DataCenterDynamics报道所述。一旦这些成本变得可见,数学计算就不再适用于越来越多的工作负载。曾经使云计算成为一个良好策略的经济学,带有一些缺点,变得在经济上不可行,适用于越来越多的AI导向的工作负载。公司重新审视了他们的策略,并询问每个应用程序是否真正需要云计算提供的东西。当他们实际运行数字时,答案对于很多工作负载来说是“否”。这些累积的答案成为行业误标的修正。这种修正被称为“云计算复归”,通常被错误地描述。它实际上是工作负载成熟度:成熟的公司学习将每个工作负载与适合它的基础设施模型相匹配。数据支持选择性阅读而不是整体阅读。IDC发现,大约80%的组织预计在接下来的12个月内会有一些复归,即使少于10%的组织已经将整个工作负载复归回本地,如CIO.com报道所述。正确解读结论并不是说云计算是一个错误。云计算仍然是有价值的,但它不再是普遍的。成熟状态是混合的:云计算在它已经证明自己有价值的地方,私有或专用基础设施在其他地方。相同的修正曲线,不同的技术那段弧线现在已经完成并标记好了。同样的形状正在用AI开始可见地形成。每个供应商、每个会议、每个销售电话现在都在谈论AI。饱和度与我曾经看到的云计算相同。支出是真实的:Gartner预测,2025年全球生成式AI的支出将达到6440亿美元,同比增长76.4%。相同的饱和度意味着即将到来的修正。我相信类似的修正即将到来,不是因为AI是坏的,而是因为产生云计算复归的相同动态也适用于这里。它即将到来,因为组织正在将AI驱动的工作流推向他们的环境,而没有始终知道在他们自己的环境中,故事将如何结束。采用与成熟度之间的差距是可以衡量的:麦肯锡发现,88%的组织现在报告称至少在一个功能中定期使用AI,但大多数仍然处于试验阶段,只有大约39%报告了企业级的EBIT影响。在没有策略的情况下推动它,并不意味着结局是不确定的。这种修正是会到来的。它总会来。你在没有策略的情况下推动它,最终经济和运营现实会迫使你进行修正。这种修正模式已经有了一个名字,这不是我创造的。AI复归,即将特定任务从概率AI系统移出并返回到确定性工作流的过程,一旦这些任务变得稳定和可重复,这不是我创造的概念。这是一个我正在观察的模式。我不是唯一一个观察它的人:Gartner预测,到2027年底,超过40%的代理AI项目将被取消,理由是成本不断增加、商业价值不明确以及风险控制不充分。AI修正的样子为了预测修正,定义两个类型的工作流是有帮助的。确定性工作流是基于规则的、可预测的和可重复的。相同的输入和相同的规则产生相同的输出,每次都是如此。它是快速的、固定的。它做它被设计要做的事情,什么也不多,什么也不少。概率工作流使用AI或基于模型的推理来解释上下文并产生可能的答案。它在处理模糊性、非结构化信息或判断调用时很有用,在这些情况下,固定的规则会失效,推理承担了负担。有了这些定义,时间问题就回答了自己。概率工作流通常是早期的正确工具,当流程尚未完全理解时。它们变得有问题,当公司继续使用它们时,流程已经明确。一个具体的工作流使早期和晚期的区别变得明显。工作流的一部分真正需要AI。例如,从呼叫记录中识别正确的帐户需要推理,确定性系统无法做到。其他部分,例如将文件附加到记录或发布通知,是确定性任务。固定的规则,直接的API调用,每次都是相同的输出。我自己也犯了这个错误:我正在构建一个内部自动化,串联呼叫记录,路由信息到我们的CRM,分配操作项,并将更新推送到Slack。诱惑是将所有内容都通过AI运行,这种诱惑带来了真正的、反复出现的负担。虽然有将整个过程通过AI调用的诱惑,但每个AI调用都会引入延迟,并带来使用和基础设施成本。AI系统需要监控、提示管理和防护栏,因为底层模型不断被其所有者以不可预测的方式开发。你永远不知道它什么时候会开始表现出不同的行为;输出可能会以创建规模上的治理问题的方式发生变化。如果这种情况持续下去,它就会变成纯粹的浪费。想象一下,一家公司使用AI分析50,000个支持票。AI识别出五条最常见的解决路径。最初,AI以概率方式处理:读取每张票并做出判断。随着时间的推移,公司验证了这些模式。解决路径现在已知。将它们转换为确定性工作流分支不会从过程中删除AI,但它会删除重复的做法,即为重新发现已经知道的答案而付费给AI。那就是概率税:运行不再需要概率推理的工作的AI的附加成本、延迟和治理负担。成熟的运营模式是什么样的如果在AI上运行解决方案是一个税收,那么成熟的举动就是根据类型划分工作。云成熟度产生了混合基础设施,云计算在它已经证明自己有价值的地方,专用基础设施在其他地方。我预测AI成熟度将产生混合运营,具有相同的逻辑。这种划分产生了一个明确的运营规则。概率系统在真正的模糊性存在的地方是有价值的。人类是模糊的。非结构化数据是模糊的。尚未完全理解的流程是模糊的。推理是所有这些的正确工具。规则的另一半同样重要:确定性系统是规模、成本、速度和治理很重要的地方。概率层发现和解释。确定性层执行。在实践中,两个信号告诉你给定工作负载属于哪一类: 如果您发现您的团队依赖于AI来完成已经变得稳定、可重复和已知的工作,那么这是一个候选项,用于复归,因为您正在为确定性工作支付概率税。 如果您发现您的确定性代码充满了异常处理程序和可变性考虑,那么这是一个迹象,表明您可能实际上需要AI。规则集正在尝试近似推理。 在实践中,这个边界通常被绘制为一个置信度阈值。当模型的置信度超过90%时,或者在以下情况下优雅地失败,这个边界通常是在实践中被绘制的。这重新定义了什么才是真正赢得AI的含义。采用AI最成功的公司将不是那些使用AI最多的公司,而是那些知道何时使用AI以及何时补充AI的公司。