Connect with us

Thời điểm cho Trung tâm điều hành Agentic NOC đã đến

Lãnh đạo tư tưởng

Thời điểm cho Trung tâm điều hành Agentic NOC đã đến

mm

Mạng hiện đại không còn giống với phiên bản của nó chỉ vài năm trước, sau khi chuyển sang làm việc từ xa và thời đại áp dụng AI và SaaS nhanh chóng. Những gì từng là tập trung và tương đối có thể dự đoán được bây giờ là một mạng lưới phức tạp của các nền tảng đám mây, thiết bị biên, văn phòng chi nhánh và internet tại nhà, cũng như các hệ thống tại chỗ.

Trung tâm điều hành mạng truyền thống (NOC) không được xây dựng cho điều này. Hầu hết các công cụ giám sát vẫn yêu cầu sự tương quan dữ liệu thủ công trên các hệ thống khác nhau, khiến việc duy trì khả năng hiển thị trở nên khó khăn hơn và khiến các kỹ sư phải đối mặt với một lượng lớn các cảnh báo mâu thuẫn khi họ cần đưa ra quyết định và giải quyết vấn đề nhanh chóng.

Các nhà cung cấp dịch vụ và đội ngũ CNTT doanh nghiệp đang hoạt động trong một áp lực tương tự. Lợi nhuận là thấp và đội ngũ là mỏng hơn, nhưng tiêu chuẩn cho chu kỳ thu hút khách hàng vẫn không thay đổi. Khi mất từ 8 đến 10 tháng trước khi một hợp đồng trở nên có lợi, các vấn đề về việc giữ chân và trải nghiệm khách hàng chất lượng cao là rất quan trọng.

Tổng thể, sân khấu đã được thiết lập hoàn hảo cho trung tâm điều hành Agentic.

Xây dựng Trung tâm điều hành Agentic NOC

Theo Gartner, mặc dù chỉ 17% tổ chức hiện đang triển khai AI Agentic, 60% dự kiến sẽ làm như vậy trong hai năm tới. Điều này tiếp tục một đường cong áp dụng tích cực kể từ khi công nghệ bắt đầu thu hút sự chú ý với khả năng suy luận chủ động trên dữ liệu, không chỉ tự động hóa các nhiệm vụ được định nghĩa một cách thụ động.

Đối với NOC, AI Agentic là sự khác biệt giữa sự phân mảnh hoặc thất vọng, thời gian giải quyết nhanh hơn, thời gian ngừng hoạt động giảm và sự hiểu biết hoàn chỉnh hơn về môi trường. Để những lợi ích này trở thành hiện thực, tuy nhiên, trung tâm điều hành Agentic NOC phải được gắn kết trong sự hợp tác giữa AI và các nhà điều hành con người. Tốc độ không bao giờ quan trọng hơn độ chính xác và độ tin cậy, vì vậy khi AI có thể tăng cường phân tích nguyên nhân gốc rễ, phân tích và cuối cùng đề xuất hành động, sự phán quyết của con người vẫn rất quan trọng cho việc xác nhận cuối cùng.

Trung tâm điều hành Agentic NOC cũng được định nghĩa bởi dữ liệu được cấu trúc tốt. Hàng tồn kho chính xác, quy ước đặt tên và nhãn nhất quán, cũng như khả năng hiển thị trên toàn mạng về lưu lượng, định tuyến và hiệu suất đều vẽ lên một bức tranh về những gì đang xảy ra hiện tại, cách mạng nên hoạt động và cách các vấn đề đã được giải quyết trước đây. Nếu không có tầm nhìn này, bất kỳ phân tích nào cũng sẽ không đầy đủ, và các nhà điều hành không thể tự động hóa những gì họ không thể nhìn thấy hoặc hiểu.

Việc thu thập kiến thức bộ lạc cũng thuộc phạm vi này.

Tài nguyên lớn nhất mà NOC có là não bộ của các kỹ sư. Sự kết hợp giữa kinh nghiệm và trực giác đến từ nhiều năm chẩn đoán và giải quyết các vấn đề mạng là điều mà ngay cả mô hình AI tiên tiến nhất cũng không thể sao chép mà không có sự giúp đỡ. Đó là lý do tại sao kiến thức bộ lạc này cần được ghi lại và dịch sang một định dạng có thể được tiêu thụ và tái sử dụng. Các quy trình chạy và vòng lặp học tập tập trung cũng có vai trò quan trọng, cung cấp một cơ sở cho hành vi của con người và máy để xác định hiệu quả hơn các lĩnh vực cần cải thiện.

Lợi ích thực sự

Các vấn đề CNTT và mạng đứng sau 23% số lần ngừng hoạt động có tác động lớn nhất vào năm 2024. Phân tích cũng cho thấy rằng trong ba năm qua, gần 40% tổ chức đã trải qua một sự cố lớn do lỗi của con người. Tỷ lệ ngừng hoạt động này không bền vững từ bất kỳ góc độ nào, kinh doanh, kỹ sư hoặc người tiêu dùng. Tuy nhiên, nó minh họa chính xác tại sao trung tâm điều hành Agentic NOC lại quan trọng đến vậy.

Lời hứa của trung tâm điều hành Agentic NOC không phải là tự chủ vì lợi ích của nó, mà là hoạt động nhanh hơn và tự tin hơn, được xây dựng trên nền tảng của khả năng hiển thị mạng thực sự. Khi một vấn đề xảy ra trên mạng, sự chậm trễ lớn nhất thường không phải là việc phát hiện, mà là hiểu những gì đã thay đổi, những gì bị ảnh hưởng và những gì cần làm tiếp theo. Các hệ thống Agentic giúp nén thời gian này, bắt đầu với phân tích nguyên nhân gốc rễ được tăng tốc.

Sự khác biệt giữa việc xác định nguyên nhân gốc rễ của một vấn đề trong vài phút so với vài giờ hoặc thậm chí vài ngày là rất lớn. Chi phí trung bình của chỉ một giờ ngừng hoạt động mạng có thể vượt quá 300.000 đô la cho các doanh nghiệp cỡ trung và lớn. Trên thực tế, 41% báo cáo chi phí ngừng hoạt động hàng giờ trong khoảng từ 1 triệu đến hơn 5 triệu đô la theo một nghiên cứu gần đây của ITIC.

Và yet, thực tế thường gần hơn với cái sau khi các nhà điều hành được yêu cầu phải tìm kiếm dữ liệu một cách thủ công. Mặt khác, các công cụ AI Agentic có thể đưa ra các nguyên nhân và dịch vụ bị ảnh hưởng tiềm năng và đề xuất các bước tiếp theo trong vài giây. Khi các ставка tài chính là rất cao, việc phân tích nguyên nhân gốc rễ nhanh hơn và khắc phục an toàn hơn đã trở thành một điều cần thiết tuyệt đối.

Ngoài việc tăng cường các nhiệm vụ chiến thuật, trung tâm điều hành Agentic NOC hoạt động như một người tạo điều kiện cho việc chia sẻ kiến thức – kết hợp chuyên môn của các kỹ sư từ khắp tổ chức thành một tài nguyên chung. Về lâu dài, quá trình này tạo ra một vòng lặp học tập liên tục nơi các thành công và thách thức từ mỗi sự cố đều phục vụ để thông tin và tinh chỉnh các khuyến nghị của AI khi các sự cố mới xảy ra.

Ví dụ, giả sử một công ty đã phải đối mặt với các vấn đề về hiệu suất mạng liên tục và quyết định triển khai một thiết bị mới để cố gắng cải thiện hiệu suất, nhưng việc cập nhật yêu cầu một thay đổi cấu hình. Trong quá trình này, điều gì đó đi sai và nó kích hoạt một sự cố. Trong thời đại trung tâm điều hành Agentic NOC, một hệ thống AI có thể tương quan telemetry, topology, trạng thái thiết bị và các thay đổi gần đây, cuối cùng chỉ ra nguyên nhân gốc rễ có thể của vấn đề cho nhà điều hành trong một phần nhỏ của thời gian. Tác động tích cực của các hệ thống Agentic đối với hoạt động mạng là rõ ràng, và dữ liệu hỗ trợ nó.

McKinsey gần đây đã phát hiện ra rằng việc giải quyết và sửa chữa vấn đề tự động trong hoạt động mạng đã giảm số lượng vé giải quyết vấn đề xuống 70%, cùng với chi phí hoạt động từ 55-80%, trong khi cải thiện thời gian sửa chữa từ 30-40%.

Thử thách cần chú ý

Một trong những sai lầm phổ biến nhất mà các tổ chức mắc phải là lao vào AI mà không thiết lập nền tảng cần thiết. Hầu hết (70%) người lao động đều渴望 về lợi ích của AI theo KPMG, nhưng nếu không có dữ liệu đáng tin cậy và các quy trình được ghi lại tốt, giá trị của các hệ thống này sẽ bị ảnh hưởng.

Thay vào đó, AI nên được giới thiệu một cách tăng dần. Xây dựng một trung tâm điều hành Agentic NOC là một hành trình. Cuối cùng, các hệ thống nên bắt đầu sở hữu nhiều trường hợp sử dụng tiên tiến và chủ động hơn, chẳng hạn như phát hiện các mẫu trong các đỉnh nhiệt hoặc xác định các xu hướng trong việc khởi động lại thiết bị – cả hai đều có thể là tín hiệu cho một sự cố sắp tới. Tuy nhiên, ở giai đoạn đầu, việc tập trung vào các nhiệm vụ nhỏ như hỗ trợ chẩn đoán để lại không gian cho các hệ thống học hỏi và cải thiện.

Một sai lầm khác là nghĩ rằng mọi hành động đều có thể được tự động hóa. Một quy tắc chung là khi một con người giải quyết cùng một vấn đề nhiều lần, nhiệm vụ đó là một ứng cử viên tốt cho tự động hóa. Việc tiếp cận dần dần này cũng có thể giúp xây dựng niềm tin và sự tự tin.

Kể từ tháng 2 năm 2025, niềm tin vào AI trong số nhân viên Mỹ đã giảm 33% theo Deloitte, trong khi Chỉ số niềm tin AI của McKinsey năm 2026 cho thấy rằng sự không chính xác của đầu ra vẫn là mối quan ngại hàng đầu về AI đối với đa số doanh nghiệp Mỹ (74%), tiếp theo là các vấn đề về an ninh mạng (72%). Hãy nhớ rằng báo cáo của KPMG cho thấy người lao động Mỹ渴望 chấp nhận AI? Báo cáo cũng cho thấy rằng chỉ 41% sẵn sàng tin tưởng vào nó.

Đưa ra lời giải cho sự do dự về AI là quản trị và giải thích. Các rào cản hoạt động rõ ràng và các thử nghiệm cho phép các kỹ sư có cái nhìn rõ ràng về cách một đại lý AI đã đưa ra khuyến nghị cuối cùng, cũng như các cơ chế để bắt và giải quyết các lỗi trước khi chúng có thể gây ra thiệt hại. Niềm tin, quản trị và xác nhận của con người là những gì phân biệt hoạt động Agentic hữu ích với tự động hóa rủi ro, đó là lý do tại sao mục tiêu của trung tâm điều hành Agentic NOC không bao giờ nên là loại bỏ sự giám sát của con người, mà là tăng cường nó.

Mạng hiện đại yêu cầu rất nhiều từ các nhà điều hành ngày nay. Để theo kịp, nỗ lực của con người cần chuyển hướng khỏi việc phân tích lặp đi lặp lại và hướng tới chính sách, xác nhận, quản trị và các trường hợp rủi ro cao hoặc mới. AI Agentic giúp thực hiện sự chuyển đổi này, xác định và giải quyết các vấn đề sớm hơn, chia sẻ kiến thức hiệu quả hơn trên các đội và đưa ra quyết định nhất quán hơn. Sự tiến hóa và cải thiện liên tục về cách mạng được giám sát và duy trì là dựa trên AI Agentic.

Alex Cruz Farmer có gần 20 năm kinh nghiệm xây dựng và mở rộng các nền tảng SaaS và cơ sở hạ tầng từ giai đoạn đầu đến IPO và mua lại. Ông trước đây đã giữ các vị trí lãnh đạo sản phẩm tại Cloudflare và Cisco ThousandEyes, thúc đẩy tăng trưởng doanh thu, sản phẩm mới và khả năng AI và hiện đang lãnh đạo sản phẩm tại Kentik trên các giải pháp thông minh mạng và nhà cung cấp dịch vụ.