Connect with us

Lãnh đạo tư tưởng

Trung tâm dữ liệu tự chữa lành: Làm thế nào AI đang chuyển đổi hoạt động CNTT

mm

“Nếu bạn có thể cho đội ngũ hoạt động của tôi chỉ 30 phút mỗi ngày, đó sẽ là một chiến thắng.” Một yêu cầu khiêm tốn của một CIO phản ánh thực tế của các đội ngũ hoạt động CNTT ngày nay – mắc kẹt trong chế độ chữa cháy phản ứng, chạy bằng nhiên liệu. Nhưng những cơn bão cảnh báo 3 giờ sáng và những khoảnh khắc phục hồi truyền thống định nghĩa hoạt động CNTT truyền thống đang trở nên lỗi thời.

Trung tâm dữ liệu tự chữa lành – từng có vẻ như là tương lai – đang xuất hiện thông qua các hệ thống agentic AI có khả năng phát hiện, chẩn đoán và giải quyết vấn đề trước khi các nhà điều hành con người nhận được cảnh báo đầu tiên. Điều này không phải là lý thuyết; nó đang xảy ra ngay bây giờ, thay đổi cơ bản cách quản lý cơ sở hạ tầng doanh nghiệp và định nghĩa lại vai trò của các đội ngũ hoạt động CNTT.

Môi trường CNTT đã vượt quá khả năng theo dõi và quản lý hợp lý của con người. Các tổ chức điều hướng các cơ sở hạ tầng hybrid phức tạp bao gồm các hệ thống cũ, đám mây riêng, nhiều nhà cung cấp đám mây công cộng và môi trường tính toán biên. Khi vấn đề phát sinh, chúng sẽ lan truyền. Sự chậm trễ của cơ sở dữ liệu nhỏ khiến thời gian chờ của ứng dụng, dẫn đến cơn bão thử lại và suy giảm dịch vụ rộng rãi. Các công cụ truyền thống được thiết kế cho kiến trúc đơn giản hơn không thể theo kịp – chúng hoạt động trong các silo, thiếu khả năng hiển thị跨 nền tảng và tạo ra hàng nghìn cảnh báo không liên kết khiến ngay cả những đội ngũ hoạt động có kinh nghiệm nhất cũng bị choáng ngợp.

Sự phức tạp này mang lại cơ hội cho AI mang lại giá trị chưa từng có. AI excels chính xác nơi con người gặp khó khăn – quản lý các vấn đề được tạo ra bởi hệ thống với kết quả xác định. Sự cố hệ thống không mơ hồ. Chúng theo các mẫu – mẫu mà AI có thể xác định, phân tích và cuối cùng giải quyết mà không cần can thiệp của con người. Các hệ thống agentic AI chứng minh khả năng này bằng cách nén lên đến 95% cảnh báo trong khi proactively phát hiện và giải quyết vấn đề trước khi chúng trở thành gián đoạn dịch vụ.

Beyond Alert Triage: Làm thế nào Tự chữa lành Thực sự Hoạt động

Khả năng tự chữa lành bắt đầu với sự tương quan. Ở nơi con người chỉ thấy cảnh báo không liên kết, các tác nhân AI nhận ra mẫu, hợp nhất thông tin trên toàn bộ ngăn xếp công nghệ thành thông tin hợp lý. Một nhà cung cấp dịch vụ quản lý toàn cầu đang xử lý 1,4 triệu sự kiện mỗi tháng đã triển khai agentic AI và giảm 70% sự cố dịch vụ thông qua tương quan và tự động hóa thông minh.

Tiếp theo là phân tích nguyên nhân gốc rễ và lập kế hoạch khắc phục. Các hệ thống AI xác định không chỉ những gì đang xảy ra mà còn tại sao, sau đó đề xuất hoặc thực hiện giải pháp. Trong một bản phát hành phần mềm lớn vào năm ngoái, các tổ chức có giám sát AI tiên tiến đã bắt được những tín hiệu cảnh báo sớm và chứa đựng tác động, trong khi các đối thủ cạnh tranh phải chạy đua để kiểm soát thiệt hại.

Khắc phục tự động là trái tim của sự chuyển đổi này. Các hệ thống AI tự chủ đương đại có thể thực hiện hành động với sự giám sát của con người phù hợp. Khi hiệu suất VPN của bạn suy giảm, AI có thể phát hiện vấn đề, xác định nguyên nhân, thực hiện giải pháp và thông báo cho bạn sau đó: “Tôi nhận thấy VPN của bạn đang suy giảm, vì vậy tôi đã tối ưu hóa cấu hình. Nó đang chạy tối ưu ngay bây giờ.” Đó là sự khác biệt giữa việc liên tục dập lửa và đảm bảo chúng không bao giờ bắt đầu.

Ba Cột trụ của Tính bền vững do AI cung cấp

Các tổ chức triển khai khả năng tự chữa lành phải thiết lập ba cột trụ quan trọng:

Cột trụ đầu tiên là nhận thức. Các sự cố CNTT phải liên quan trực tiếp đến kết quả kinh doanh. Các hệ thống AI tiên tiến cung cấp bảng điều khiển có ngữ cảnh phác thảo tác động tài chính cụ thể khi hệ thống thất bại, cho phép kế hoạch phục hồi ưu tiên các công nghệ quan trọng nhất cho kinh doanh.

Cột trụ thứ hai là phát hiện nhanh. Một sự cố CNTT có thể lan truyền từ một máy chủ đến 60.000 máy chủ trong chưa đầy hai phút. Các hệ thống AI tự chủ xác định và trung hòa các mối đe dọa, giảm thời gian phản hồi bằng cách cách ly ngay lập tức các máy chủ bị ảnh hưởng, chạy chẩn đoán và triển khai giải pháp.

Cột trụ thứ ba là tối ưu hóa. Các hệ thống tự chữa lành biết những gì là bình thường và những gì không. Bằng cách nhận ra hành vi môi trường điển hình, chúng tập trung các nhóm an ninh vào các vấn đề quan trọng trong khi tự động giải quyết các vấn đề thường xuyên trước khi leo thang.

Cầu nối Kỹ năng và Nâng cao Đội ngũ

Nhưng có lẽ tác động lớn nhất của công nghệ tự chữa lành không phải là kỹ thuật. Đó là con người. Các kỹ sư cấp 3 giàu kinh nghiệm – những người có kiến thức tổ chức để chẩn đoán các sự cố thất bại kỳ lạ – đang ngày càng khan hiếm. AI cầu nối khoảng cách kỹ năng này. Với các hệ thống agentic, các kỹ sư cấp 1 có thể hoạt động hiệu quả với khả năng cấp 3, trong khi các chuyên gia giàu kinh nghiệm cuối cùng có thể tập trung vào các sáng kiến chiến lược.

Một nhà cung cấp dịch vụ chăm sóc sức khỏe đã tái sử dụng toàn bộ đội ngũ hỗ trợ cấp 1 của mình sau khi triển khai AI tự chữa lành, không phải thông qua việc giảm bớt mà bằng cách nâng cao các thành viên trong đội lên công việc đầy thách thức hơn. Họ báo cáo giảm 80% tiếng ồn cảnh báo và giảm đáng kể số lượng vé sự cố. Một tổ chức bán lẻ có hàng trăm địa điểm đã trải qua giảm 90% lượng cảnh báo, chuyển hướng đội ngũ của mình từ bảo trì sang đổi mới.

Đưa nó Từ Khái niệm đến Triển khai

Tự chữa lành không phải là plug-and-play. Nó đòi hỏi phải triển khai có phương pháp và tư duy văn hóa phù hợp. Các tổ chức nên bắt đầu với các trường hợp sử dụng được xác định rõ, thiết lập khuôn khổ quản trị cân bằng giữa tự chủ và giám sát, và đầu tư vào việc phát triển các đội ngũ có thể cộng tác hiệu quả với các hệ thống AI.

Mục tiêu không phải là thay thế con người; nó là để ngừng lãng phí thời gian của họ. Bằng cách tự động hóa các nhiệm vụ thường xuyên và cung cấp thông tin có ngữ cảnh, các hệ thống tự chữa lành đảo ngược nguyên tắc Pareto truyền thống của hoạt động CNTT – thay vì dành 80% tài nguyên cho bảo trì và 20% cho đổi mới, các đội ngũ có thể đảo ngược tỷ lệ này để thúc đẩy các sáng kiến chiến lược.

Trung tâm dữ liệu tự chữa lành đại diện cho sự kết hợp của nhiều thập kỷ tiến bộ trong hoạt động CNTT, từ giám sát cơ bản đến tự động hóa tinh vi đến các hệ thống tự chủ thực sự. Mặc dù chúng ta sẽ không bao giờ loại bỏ mọi lỗi của con người hoặc outsmart mọi mối đe dọa tinh vi, nhưng công nghệ tự chữa lành cung cấp cho các tổ chức khả năng chống chịu để phát hiện vấn đề trước khi chúng lan truyền và giảm thiểu thiệt hại từ các gián đoạn không thể tránh khỏi. Điều này không chỉ là một nâng cấp hoạt động; nó là một yêu cầu cạnh tranh cho các tổ chức hoạt động trong nền kinh tế kỹ thuật số ngày nay.

Với các hệ thống tự chữa lành, chúng ta không chỉ lấy lại thời gian – chúng ta đang viết lại mô tả công việc. Sự cố được ngăn chặn, không được quản lý. Các kỹ sư xây dựng, không phải trông giữ. Và CNTT ngừng chơi phòng thủ và bắt đầu thúc đẩy kinh doanh tiến về phía trước.

Karthik là Giám đốc Điều hành của Trí tuệ Nhân tạo tại LogicMonitor. Với gần 20 năm kinh nghiệm lãnh đạo các tổ chức sản phẩm toàn cầu, ông đã lãnh đạo các công ty khởi nghiệp tăng trưởng cao, như Aisera, và phục vụ tại các công ty đại chúng lớn như SAP. Chuyên môn của ông là xây dựng, thực hiện và mở rộng các sản phẩm Trí tuệ Nhân tạo đầu tiên cho doanh nghiệp. Trong thời gian của mình, ông đã ấp ủ và mở rộng nhiều sản phẩm Zero to One lên doanh thu và được cấp bằng sáng chế nhiều lần trong lĩnh vực Trí tuệ Nhân tạo và Tự động hóa.