思想领袖
现在是实施代理网络运营中心(Agentic NOC)的时机

现代网络与几年前的网络相比已经发生了巨大的变化,尤其是在远程工作和人工智能(AI)以及软件即服务(SaaS)快速采用之后。过去的网络是集中式和相对可预测的,现在却变成了一个复杂的云平台、边缘设备、分支办公室、家庭互联网和本地系统的网络。
传统的网络运营中心(NOC)并不是为这种新的网络环境而设计的。大多数监控工具仍然需要手动地在不同的系统之间关联数据,这使得维持网络可见性变得更加困难,并且当工程师需要快速做出决策和排除故障时,他们会面临大量的冲突警报。
服务提供商和企业IT团队也面临着类似的压力。利润率很低,团队也变得更加精简,但是客户获取周期的标准并没有改变。当合同需要八到十个月才能变得有利可图时,客户留存和高质量的客户体验就变得非常重要。
总的来说,代理网络运营中心(Agentic NOC)的时机已经成熟。
构建代理网络运营中心
根据Gartner的报告,尽管只有17%的组织目前部署了代理AI,但60%的组织预计在未来两年内部署代理AI。这继续了自从该技术开始获得关注以来代理AI的快速采用曲线,代理AI可以主动地对数据进行推理,而不仅仅是被动地自动化定义的任务。
对于网络运营中心(NOC)来说,代理AI是区别于碎片化或沮丧、更快的解决时间、减少停机时间和更完整地理解网络环境的关键。然而,要实现这些好处,代理网络运营中心必须以人工智能和人类操作员之间的协作为基础。速度永远不如准确性和可靠性重要,所以当人工智能可以增强故障诊断、根因分析和最终推荐行动时,人类的判断力对于最后的验证仍然至关重要。
代理网络运营中心也以结构化数据为特征。准确的库存、一致的标签和命名约定以及网络范围内的流量、路由和性能的可见性都描绘了当前发生的情况、网络应该如何表现以及以前如何解决问题的图景。没有这种视图,任何分析都将是不完整的,操作员无法自动化他们无法看到或理解的东西。
部落知识的捕获也属于这一范畴。
网络运营中心最大的资源是其工程师的大脑。多年来诊断和解决网络问题的经验和直觉是即使最先进的人工智能模型也无法复制的东西,除非得到帮助。这就是为什么这种部落知识需要被记录和转换成可以被消化和重用的格式的原因。精心改进的运行手册和集中式学习循环也有作用,为人类和机器行为提供了基准,以更有效地识别改进领域。
代理网络运营中心的真正好处
IT和网络问题是2024年23%最具影响力的停机事件的原因。同一分析发现,过去三年中,近40%的组织由于人为错误而经历了重大停机事件。这种停机率从任何角度来看都是不可持续的,无论是从商业角度、工程角度还是消费者角度来看。然而,这正是代理网络运营中心如此重要的原因。
代理网络运营中心的承诺不是为了自治而自治,而是为了更快、更自信的运营,建立在真正的网络可见性的基础上。当问题发生在网络上,最大的延迟往往不是检测,而是理解发生了什么、影响了什么以及下一步该怎么做。代理系统有助于压缩这一时间线,首先是通过加速根因分析。
识别问题的根因是在几分钟内还是几个小时或几天内,是有巨大差异的。根据ITIC的研究,一小时的网络停机时间的平均成本超过了300,000美元,适用于中型至大型企业。事实上,41%的企业报告称,每小时的停机成本在1百万美元至5百万美元以上。
然而,当操作员被要求手动搜索数据时,现实往往更接近后者。另一方面,代理AI工具可以在几秒钟内发现潜在的原因和受影响的服务,并推荐下一步骤。当经济利益如此高时,快速的根因分析和更安全的补救措施已经成为必不可少的东西。
除了增强战术任务外,代理网络运营中心还作为知识共享的促进者,将整个组织的工程师的专业知识结合成一个共享的资源。从长远来看,这个过程创建了一个持续的学习循环,每次事件的成功和挑战都有助于告知和改进人工智能的推荐,当新事件发生时。
例如,假设一家公司一直在处理持续的网络性能问题,并决定实施新设备以尝试提高效率,但更新需要配置更改。在此过程中,出了问题,触发了停机事件。在代理网络运营中心时代,人工智能系统可以关联遥测数据、拓扑、设备状态和最近的更改,最终指向操作员可能的根因,只需一小部分时间。代理系统对网络运营的积极影响是明显的,数据也支持这一点。
麦肯锡最近发现,网络运营中的自主问题解决和维修减少了多达70%的故障排除票,并且降低了55-80%的运营成本,同时将维修时间提高了30-40%。
需要注意的挑战
组织最常见的错误之一是没有建立必要的基础就全力投入人工智能。根据KPMG的报告,70%的工人渴望人工智能的好处,但没有可靠的数据和完善的流程,人工智能系统的价值就会受到影响。
相反,人工智能应该被逐渐引入。构建代理网络运营中心是一个旅程。最终,系统应该开始拥有更高级和更主动的用例,例如检测温度波动的模式或识别设备重启的趋势——这些都是即将发生的停机事件的信号。在开始时,专注于较小的任务,如帮助诊断,为系统留出空间来学习和改进。
另一个错误是认为每个动作都可以从自动化中受益。一个好的经验法则是,当人类反复解决同一个问题时,这个任务就是一个适合自动化的候选项。采取这种渐进的方法也可以帮助建立信任和信心。
自2025年2月以来,美国员工对人工智能的信任已经下降了33%,根据德勤的报告,而麦肯锡2026年人工智能信任指数发现,输出不准确仍然是大多数美国企业(74%)对人工智能的首要担忧,其次是网络安全问题(72%)。记得KPMG发现美国工人渴望接受人工智能的报告吗?该报告还发现,只有41%的工人愿意信任人工智能。
克服人工智能犹豫的关键在于治理和可解释性。明确的运营防护栏和审计跟踪为工程师提供了清晰的洞察,了解人工智能代理如何得出最终的推荐,以及如何捕获和解决错误,以免错误在下游造成损害。信任、治理和人类验证是区分有用的人工智能操作和冒险的自动化的关键,这就是为什么代理网络运营中心的目标永远不应该是去除人类的监督,而是增强人类的监督。
现代网络要求今天的操作员做很多事情。为了跟上节奏,人类的努力需要从重复的故障诊断转移到政策、验证、治理和新颖或高风险的案例上。代理人工智能有助于使这种转变成为可能,通过更早地识别和解决问题、更有效地跨团队共享知识以及使决策更加一致。网络被监控和维护的方式的持续演进和改进根植于代理人工智能。












