思想领袖
人工智能正在迫使网络可观察性重置

多年来,网络可观察性一直是一个工具讨论。哪个平台收集最广泛的遥测数据?哪个代理覆盖了我更多的不常见设备?哪种架构在大规模上表现最佳?我们应该在网络的哪些点捕获数据包?这种对话假设网络相对稳定,变化是渐进的。
但现在不是这样了。
人工智能驱动的工作负载正在增加流量的可变性,因为企业中的人工智能采用正在加速。最近的研究表明,88%的组织现在在至少一个业务功能中使用人工智能。混合架构跨越云、数据中心、WAN和边缘。安全和性能信号现在以五年前没有的方式重叠。业务预期更快的解决方案、更少的中断和明确的责任。
在这种压力下,当前的网络可观察性方法正在失败。不因为团队缺乏技能,而是因为可观察性底层的架构没有跟上。
这不是关于添加更多的仪表板或捕获更多的数据。这是关于认识到可观察性必须从工具集合演变成一个连贯的数据基础。这个基础将使网络运营(NetOps)团队能够利用人工智能进行网络可观察性和智能。
以下是如何思考您当前的位置和如何向前迈进。
您在成熟度曲线上的位置在哪里?
Enterprise Management Associates(EMA)的研究表明,只有46%的IT领导者认为他们在网络可观察性工具方面完全成功。大多数投诉都是众所周知的,工具蔓延、警报噪音和数据质量差等都在名单上。
EMA的2025报告网络可观察性成熟度模型:如何规划NetOps卓越还确定了五个不同的成熟度阶段:
- 临时和反应性
- 碎片化和机会主义
- 集成和集中管理
- 智能和自动化
- 优化和人工智能驱动
今天,我想关注中间三个阶段,这是大多数组织所处的阶段,然后描述到达最后阶段的路径。
碎片化和机会主义
您拥有多个可观察性工具。通常是三或四个。行业研究反映了相同的模式,87%的NetOps团队现在依赖多个可观察性工具,但只有29%的警报是可执行的。覆盖范围存在,但它是不均匀的。工程师们充当集成层,在控制台之间切换并在脑海中关联事件。人工智能可能存在,但它在孤岛中运行。团队在这个阶段努力工作,但架构却阻碍了他们。
集成和集中管理
您已经在基础设施和流量上实现了强大的监控覆盖。系统之间有一些集成。仪表板是标准化的。您可能已经为常见的事件实现了早期自动化。
但根因分析仍然依赖于手动拼接。预测性洞察力是有限的。人工智能加速分析,但它并没有从根本上改变网络的理解方式。
智能和自动化
遥测数据在重要的地方是实时的。流、数据包和配置数据是关联的。警报是上下文的,而不是基于阈值的。人工智能支持异常检测、容量预测和引导式补救。自动化是在政策防护栏内引入的。只有拥有丰富资源的组织才处于这一阶段。
一小部分最佳实践组织已经达到成熟度的最后阶段,即优化和人工智能驱动。工具本身并不能帮助您进化。
从智能和自动化到优化和人工智能驱动:下一步该怎么办
现代化网络可观察性不需要抛弃现有的东西。它需要从工具转向数据的转变。
1. 从数据一致性开始,而不是更多的人工智能
在扩展人工智能计划之前,问问自己:我们的网络数据是否干净、一致且在域之间相连?
不一致的遥测数据格式、云或SD-WAN中的盲点、重复的IP空间和过时的库存记录会比大多数高管意识到的更严重地破坏人工智能的结果。如果遥测数据不能可靠地与权威的地址和上下文相关联,关联将是概率性的而不是确定性的。
这就是基础网络服务的重要性。DNS、DHCP和IP地址管理(统称为DDI)构成了网络的权威地图。每个设备、工作负载和连接都与该层相交。
当可观察性遥测数据与权威身份和地址智能相结合时,分析变得有根据。人工智能可以更有信心地区分预期行为和真正的异常。根因分析发生得更快。自动化变得更安全。
2. 通过深度集成减少工具蔓延
大多数企业将继续运行多个可观察性系统。这不是主要问题。问题是浅层集成。
将一个仪表板嵌入到另一个中或共享基本数据导出并不创建一致性。成熟的环境在数据层集成。它们协调遥测数据收集、跨域关联警报,并启用跨工具的工作流,而不是被困在工具内。
当集成达到这种水平时,整合变得理性,而不是政治化。冗余系统更容易退役。重叠的遥测数据更容易合理化。人工智能在统一的上下文中运行,而不是在拼接的碎片中运行。
3. 分阶段现代化以避免破坏
破坏遗留环境的恐惧是合理的。没有人希望在追求架构纯度的同时破坏生产。分阶段的方法降低了这种风险。
阶段一:叠加智能
将遥测数据流式传输到共享的分析层中。用身份和策略上下文来丰富它。使用人工智能进行检测和推荐,而不是自主执行。
阶段二:标准化和合理化
随着关联性提高和噪音减少,确定冗余工具并退役那些无法参与统一架构的工具。
阶段三:引入防护栏自动化
从低风险的自动化场景开始。让agentic AI建议补救,然后允许执行。随着信心和治理的成熟,逐渐扩大。
这不是关于切换开关。这是关于在不牺牲稳定性的情况下增加一致性。
战略转变:转向优化和人工智能驱动
可观察性不再是监控工具的集合。它是核心的人工智能驱动基础设施,需要新的基准。当组织将可观察性锚定在统一的数据架构和权威网络智能上时,人工智能变得具有预测性。
预测分析从理论转变为实践。通过分析历史和实时遥测数据,人工智能可以识别容量紧张、配置漂移或异常行为的早期信号,然后它们升级。团队不再为修复中断而奔忙,而是在用户注意到性能下降之前进行干预。这尤其重要,因为大规模的IT中断可能会让组织每小时损失高达200万美元。
容量规划变得动态,而不是周期性的。资源耗尽和服务饱和可以提前预测,实现主动优化,而不是被动扩展。
这是即将到来的东西。
如果您的数据是碎片化的,人工智能将会暴露它。
如果您的基础是连贯的,人工智能就成为杠杆。
问题不是您是否会采用人工智能驱动的可观察性和智能。问题是您的架构是否为其做好准备。












