思想领袖

AI正在迫使网络可观察性的重置

mm

多年来,网络可观察性一直是一个工具讨论。哪个平台收集最广泛的遥测数据?哪个代理覆盖了我更为晦涩的设备?哪种架构在规模上表现最佳?在网络的哪些点应该捕获数据包?这种对话假设网络相对稳定,变化是渐进的。

但现在不是这样了。

AI驱动的工作负载正在增加流量的可变性,因为AI在整个企业中加速采用。最近的研究显示,88%的组织现在在至少一个业务功能中使用AI。混合架构跨越云、数据中心、WAN和边缘。安全和性能信号现在以五年前没有的方式重叠。业务预期更快的解决方案、更少的中断和明确的责任。

在这种压力下,当前的网络可观察性方法正在失败。不是因为团队缺乏技能,而是因为可观察性底层的架构没有跟上节奏。

这不是关于添加更多的仪表盘或捕获更多的数据。这是关于认识到可观察性必须从工具集合演变成一个连贯的数据基础。这个基础将使网络运营(NetOps)团队能够利用AI进行网络可观察性和智能。

以下是如何思考您当前的位置和如何向前迈进。

您在成熟度曲线上的位置?

来自Enterprise Management Associates(EMA)的研究显示,只有46%的IT领导者认为他们在网络可观察性工具方面取得了完全的成功。大多数投诉都是众所周知的,工具扩散、警报噪音和数据质量差是其中的几个。

EMA的2025年报告网络可观察性成熟度模型:如何规划NetOps卓越还确定了五个不同的成熟度阶段:

  1. 临时和反应性
  2. 碎片化和机会主义
  3. 集成和集中管理
  4. 智能和自动化
  5. 优化和AI驱动

今天,我想关注中间三个阶段,这是大多数组织所处的阶段,然后描述如何走向最后一个阶段。

碎片化和机会主义

您有多个可观察性工具。通常是三个或四个。行业研究反映了相同的模式,87%的NetOps团队现在依赖多个可观察性工具,但只有29%的警报是可行的。覆盖范围存在,但不均匀。工程师们作为集成层,在控制台之间切换并在脑海中关联事件。AI可能存在,但它在孤立的环境中运行。团队在这个阶段努力工作,但架构却对他们不利。

集成和集中管理

您已经在基础设施和流量方面实现了强大的监控覆盖。系统之间有一些集成。仪表盘是标准化的。您可能已经为常见的事件实现了早期的自动化。

但根因分析仍然依赖于手动拼接。预测性见解是有限的。AI加速分析,但它并没有从根本上改变网络的理解方式。

智能和自动化

遥测数据在重要的地方是实时的。流、数据包和配置数据是相关的。警报是上下文的,而不是基于阈值的。AI支持异常检测、容量预测和引导式补救。自动化是故意引入的,并且在政策界限内。只有拥有足够资源的组织才处于这一阶段。

一小部分最优组织已经达到成熟度的最后阶段,即优化和AI驱动。工具本身并不能帮助您进化。

从智能和自动化到优化和AI驱动:接下来要做什么

现代化网络可观察性并不需要丢弃现有的东西。它需要从工具转向数据的转变。

1. 从数据一致性开始,而不是更多的AI

在扩展AI计划之前,问问自己:我们的网络数据是否干净、一致并且在域之间连接?

不一致的遥测数据格式、云或SD-WAN中的盲点、重复的IP空间和过时的库存记录会比大多数高管意识到的更大程度地破坏AI的结果。如果遥测数据不能可靠地与来自权威地址的身份和上下文相关联,关联就变成了概率性的,而不是确定性的。

这就是基础网络服务的重要性。DNS、DHCP和IP地址管理(统称为DDI)构成了网络的权威地图。每个设备、工作负载和连接都与该层相交。

当可观察性遥测数据用权威身份和地址智能丰富时,分析变得有根据。AI可以更有信心地将预期行为与真正的异常区分开来。根因分析发生得更快。自动化变得更安全。

2. 通过深度集成减少工具扩散

大多数企业将继续运行多个可观察性系统。这不是主要问题。问题是浅层集成。

将一个仪表盘嵌入到另一个仪表盘中或共享基本数据导出并不创建一致性。成熟的环境在数据层面集成。它们协调遥测数据的收集、跨域关联警报并启用跨越工具的工作流,而不是被困在工具内部。

当集成达到这种水平时,整合变得理性,而不是政治性的。冗余系统更容易退役。重叠的遥测数据更容易合理化。AI在统一的上下文中运行,而不是在拼接在一起的碎片中运行。

3. 分阶段现代化以避免破坏

破坏遗留环境的恐惧是合理的。没有人想在追求架构纯度的同时破坏生产。分阶段的方法降低了这种风险。

第一阶段:叠加智能

将遥测数据流式传输到共享的分析层。用身份和策略上下文丰富它。使用AI进行检测和推荐,而不是自主执行。

第二阶段:标准化和合理化

随着关联性提高和噪音减少,确定冗余的工具并退役那些无法参与统一架构的工具。

第三阶段:引入带有防护栏的自动化

从低风险的自动化场景开始。让代理AI建议补救,然后允许执行。随着信心和治理的成熟,逐渐扩大。

这不是关于切换开关。这是关于在不牺牲稳定的情况下提高一致性。

战略转变:转向优化和AI驱动

可观察性不再是监控工具的集合。它是核心的AI驱动基础设施,需要新的基准。当组织将可观察性锚定在统一的数据架构和权威网络智能上时,AI变得具有预测性。

预测分析从理论转变为实践。通过分析历史和实时遥测数据,AI可以识别容量紧张、配置漂移或异常行为的早期信号,然后采取行动。团队在用户注意到性能下降之前进行干预,而不是修复中断。这尤其重要,因为大规模IT中断可能会使组织每小时损失高达200万美元

容量规划变得动态,而不是周期性的。资源耗尽和服务饱和可以提前预测,实现主动优化,而不是被动扩展。

这是即将到来的未来。

如果您的数据是碎片化的,AI将会暴露它。

如果您的基础是连贯的,AI将成为您的杠杆。

问题不是您是否会采用AI驱动的可观察性和智能。问题是您的架构是否为其做好准备。

斯科特·富尔顿(Scott Fulton)是BlueCat的首席产品和技术官,也是一位拥有20多年经验的企业技术领导者,经验涵盖云基础设施、DevOps和网络安全。他之前创立了云可观测性初创公司OpsCruise,在那里他领导了开发用于Fortune 500组织的AI驱动技术。