Connect with us

Ronak Desai, Người sáng lập và Giám đốc điều hành của Ciroos – Loạt phỏng vấn

Phỏng vấn

Ronak Desai, Người sáng lập và Giám đốc điều hành của Ciroos – Loạt phỏng vấn

mm

Ronak Desai, người sáng lập và Giám đốc điều hành của Ciroos, lãnh đạo công ty với sứ mệnh rõ ràng là loại bỏ công việc nhàm chán của IT và trả lại thời gian cho các kỹ sư SRE, DevOps và các kỹ sư vận hành. Ông mang theo một niềm tin sâu sắc rằng AI nên tăng cường đáng kể chuyên môn của con người chứ không phải thay thế nó, đặc biệt là trong môi trường hoạt động có rủi ro cao. Trước khi thành lập Ciroos, Desai đã dành hơn 20 năm tại Cisco, nơi ông đã nắm giữ nhiều vị trí lãnh đạo cấp cao, bao gồm Phó Chủ tịch và Tổng Giám đốc của Cisco Full-Stack Observability và AppDynamics. Trong suốt sự nghiệp của mình, ông đã tập trung vào việc xây dựng các nền tảng có thể mở rộng, tập trung vào khách hàng, nắm giữ hơn 50 bằng sáng chế đang được sử dụng ngày nay và tiếp tục các nguyên tắc đổi mới và khách hàng trung thành mà đã định hình thời gian của ông tại Cisco.

Ciroos đang xây dựng một người bạn đồng hành SRE AI bản địa được thiết kế để giảm đáng kể thời gian cần thiết để điều tra và giải quyết các sự cố IT phức tạp trên các môi trường đa miền hiện đại. Nền tảng này sử dụng lý luận AI đa tác nhân bản địa để lý luận qua các tín hiệu, tự động hóa điều tra và hỗ trợ tự động hóa, tăng cường và vận hành tự chủ – đồng thời đảm bảo con người vẫn kiểm soát hoàn toàn. Bằng cách liên kết dữ liệu qua các công cụ và miền truyền thống bị cô lập, Ciroos cho phép các đội chuyển từ việc chữa cháy phản ứng sang việc ra quyết định nhanh hơn và tự tin hơn, giúp các kỹ sư tập trung vào công việc có tác động cao hơn chứ không phải vào công việc nhàm chán và kiệt sức của hoạt động.

Bạn đã dành hơn hai thập kỷ tại Cisco, giúp xây dựng một số sản phẩm mạng và quan sát thành công nhất. Điều gì đã truyền cảm hứng cho bạn để thực hiện bước nhảy và thành lập Ciroos?

Trong suốt các tương tác của tôi với các đội doanh nghiệp khác nhau, tôi đã thấy cùng một câu chuyện lặp đi lặp lại. Các đội vận hành bị choáng ngợp bởi các bảng điều khiển, theo đuổi các cảnh báo và phụ thuộc vào kiến thức tổ chức để giải quyết các vấn đề trên nhiều hệ thống. Mặc dù đã chi tiêu đáng kể vào khả năng quan sát, họ vẫn thiếu một cách để kết nối bằng chứng trên các miền trong thời gian thực. Các đồng sáng lập và tôi muốn thay đổi điều đó. Chúng tôi đã thiết lập để xây dựng một hệ thống AI có thể lý luận như một người vận hành có kinh nghiệm và làm việc cùng với các kỹ sư SRE từ đầu, cho phép các đội tập trung vào việc cải thiện độ tin cậy và độ ổn định thay vì dành thời gian tìm kiếm thông tin hoặc chữa cháy.

Bạn đã mô tả Ciroos như một phản ứng đối với một trong những vấn đề khó khăn nhất trong hoạt động – các cuộc điều tra bao gồm nhiều miền. Làm thế nào kinh nghiệm của bạn trong việc lãnh đạo kinh doanh AppDynamics và Full-Stack Observability tại Cisco đã định hình sự nhận thức đó và ảnh hưởng đến kiến trúc của Ciroos?

Tại AppDynamics, chúng tôi đã đạt được một mức độ hiểu biết cao về hành vi của ứng dụng. Tuy nhiên, khi nguyên nhân của một sự cố nằm ngoài ứng dụng (cho dù trong cấu hình đám mây, mạng hoặc IAM), việc có cái nhìn sâu sắc vào lớp ứng dụng alone là không đủ. Thách thức là thiết lập ngữ cảnh. Kinh nghiệm đó đã hướng dẫn cách chúng tôi thiết kế Ciroos. Nền tảng của chúng tôi mang lại lý luận AI để mở rộng hoạt động sản xuất. Nó xem xét các tín hiệu trên các miền, sắp xếp các sự kiện trên một dòng thời gian chung và lý luận qua các ranh giới miền để xác định nguyên nhân gốc rễ thực sự của các sự cố.

Ciroos giới thiệu khái niệm về một “đồng nghiệp SRE AI”. Làm thế nào ý tưởng về AI như một cộng tác viên khác với các công cụ tự động hóa hoặc quan sát truyền thống?

Đồng nghiệp SRE AI hoạt động giống như một đồng nghiệp mới hơn là một công cụ mới. Nó lắng nghe trước, hiểu môi trường, chấp nhận các nhiệm vụ được xác định và tạo dựng niềm tin theo thời gian. Trong khi tự động hóa truyền thống thực hiện các quy tắc, đồng nghiệp áp dụng lý luận. Khi nó xác định một vấn đề, nó chọn các đại lý chuyên gia miền phù hợp để hỏi, thu thập bằng chứng hỗ trợ và trình bày nó trong ngữ cảnh. Phần hợp tác này giải phóng thời gian của các kỹ sư để xác thực và giải quyết vấn đề thay vì phải tự suy luận ra mối tương quan.

Hệ thống của bạn sử dụng lý luận AI đa tác nhân. Bạn có thể giải thích làm thế nào các tác nhân AI đa dạng này phối hợp để tăng tốc phân tích nguyên nhân gốc rễ và cải thiện độ chính xác trên các hệ thống phức tạp?

Mỗi tác nhân có chuyên môn về miền – một trong Kubernetes, một trong đám mây, một trong mạng và như vậy. Khi một sự cố xảy ra, các tác nhân này làm việc cùng nhau như một phần của lớp lý luận trung tâm liên kết các phát hiện trong thời gian thực. Hệ thống xác định các tác nhân nào để kích hoạt, nhiệm vụ nào được giao cho mỗi tác nhân, theo thứ tự nào và trong bao lâu. Sự phối hợp này giảm thời gian điều tra và cải thiện độ chính xác bằng cách đảm bảo rằng mỗi lớp được đánh giá trong ngữ cảnh chứ không phải trong một silo.

Từ góc độ kỹ thuật, làm thế nào Ciroos lý luận động qua các nguồn dữ liệu khác nhau – như telemetry đám mây, nhật ký ứng dụng và số liệu cơ sở hạ tầng – mà không làm cho người dùng choáng ngợp với tiếng ồn?

Ciroos coi mỗi nguồn dữ liệu như một thấu kính đơn trong một bức tranh lớn hơn. Nó sắp xếp các quan sát trên các nguồn dữ liệu trên một dòng thời gian thống nhất và chỉ hiển thị các mối quan hệ nguyên nhân có liên quan. Ví dụ, nếu một sự kiện khởi động pod xảy ra sau một thay đổi nhỏ trong IAM hoặc chính sách mạng, Ciroos tự động kết nối chuỗi đó. Nó vượt ra ngoài việc cung cấp các bảng điều khiển thô và thay vào đó xây dựng một câu chuyện hoàn chỉnh dựa trên bằng chứng giúp các kỹ sư hiểu tại sao một điều gì đó đã xảy ra.

Sự tin cậy và giải thích là trung tâm của triết lý thiết kế của bạn. Làm thế nào bạn đảm bảo rằng các khuyến nghị được thúc đẩy bởi AI vẫn minh bạch và con người vẫn kiểm soát hoàn toàn?

Mỗi khuyến nghị đi kèm với bằng chứng hỗ trợ và lý luận dẫn đến nó. Các kỹ sư có thể theo dõi từng kết luận, kiểm tra các giả định của họ và quản lý mức độ tự chủ của hệ thống, từ hỗ trợ đến bán tự động. Hệ thống giữ lại kiến thức ngữ cảnh theo thời gian thông qua phản hồi của con người, cho phép nó cải thiện chất lượng quyết định trong khi vẫn được quản lý hoàn toàn. Cách tiếp cận của chúng tôi giống như cách một đội sẽ giới thiệu các thành viên mới, với các rào cản rõ ràng, lý luận trực tiếp và giám sát của con người đầy đủ. Sự tin cậy được xây dựng khi hệ thống thể hiện hiệu suất đáng tin cậy ngày càng tăng theo thời gian.

Người dùng sớm báo cáo rằng Ciroos giảm thời gian điều tra từ hàng giờ xuống vài phút. Những loại mẫu hoặc thông tin nào đã làm bạn ngạc nhiên nhất khi các đội bắt đầu sử dụng Đồng nghiệp SRE AI trong sản xuất?

Có hai điều làm tôi ngạc nhiên – đầu tiên, tốc độ mà ngay cả các doanh nghiệp lớn cũng đã phản ứng thuận lợi với giá trị cốt lõi của chúng tôi đã rất đáng khích lệ. Thứ hai, khách hàng của chúng tôi đã xem xét kỹ công nghệ của chúng tôi và đã nghĩ ra một số trường hợp sử dụng rất độc đáo đi xa hơn phân tích nguyên nhân gốc rễ. Những trường hợp sử dụng này nhấn mạnh các thách thức thực tế mà các doanh nghiệp lớn đang đối mặt ngày nay trong hoạt động sản xuất của họ.

Thuật ngữ “AI như một Đồng nghiệp” gợi ý sự cộng tác hơn là thay thế. Bạn nhìn thấy khái niệm này phát triển như thế nào khi các tổ chức trở nên thoải mái hơn khi làm việc cùng các hệ thống thông minh?

Chúng tôi xem đây là một hành trình liên quan đến tự động hóa, tăng cường và cuối cùng là tự động hóa hoàn toàn. Mặc dù Ciroos hỗ trợ tất cả các chế độ này ngày nay, chúng tôi thường thấy việc áp dụng AI của các tổ chức theo một đường cong trưởng thành. Để bắt đầu, các doanh nghiệp sử dụng hệ thống AI của chúng tôi để tự động hóa các nhiệm vụ có thể định nghĩa rõ ràng và lặp lại trong khi giảm thiểu quá tải nhận thức cho con người. Ngược lại, các hệ thống không bản địa AI đặt gánh nặng quá lớn lên người vận hành để cấu hình nhiều tham số và quy tắc trước khi khách hàng nhận ra giá trị.

Trong giai đoạn tiếp theo, các doanh nghiệp tận dụng hệ thống AI để tăng cường lý luận của con người trên quy mô lớn trên nhiều miền, ngay cả khi hệ thống cung cấp các giải thích chi tiết và khuyến nghị cho việc khắc phục mà con người xác thực và thực hiện. Đây là nơi mà hầu hết các doanh nghiệp đang ngày nay.

Theo thời gian, AI có thể quản lý toàn bộ luồng công việc sự cố một cách tự động cho doanh nghiệp, chỉ tăng cấp lên con người khi cần thiết. Chúng tôi dự kiến điều này sẽ được mở dần dựa trên nhiệm vụ. Sự tiến bộ này tương tự như cách các đội xây dựng niềm tin với các nhân viên mới. Khi bạn có được nhiều niềm tin hơn, quan hệ đối tác trở nên sâu sắc hơn.

Nhiều doanh nghiệp đã phụ thuộc vào các nền tảng quan sát và quản lý sự cố đã được thiết lập. Ciroos tích hợp với các hệ sinh thái hiện có này như thế nào mà không làm gián đoạn các quy trình làm việc?

Từ đầu, tích hợp không bao giờ là tùy chọn. Chúng tôi tin rằng một mô hình dữ liệu liên bang cung cấp cho các doanh nghiệp thời gian giá trị nhanh nhất, nhiều tùy chọn nhất và chi phí sở hữu thấp nhất. Đồng nghiệp SRE AI của Ciroos tích hợp với bảy danh mục khác nhau của các hệ thống doanh nghiệp ngày nay – quan sát, phản hồi sự cố, công cụ cộng tác, nền tảng đám mây, hệ thống vé, công cụ CI/CD và cơ sở hạ tầng vật lý thông qua các API và giao thức mở như MCP và A2A. Nó tích hợp vào các quy trình làm việc đã được thiết lập thay vì yêu cầu các đội áp dụng các quy trình mới. Thiết kế này đã giúp làm cho nó dễ dàng cho các doanh nghiệp áp dụng. Các đội nhận được câu trả lời nhanh hơn mà không cần thay đổi các quy trình làm việc hiện có của họ.

Bạn đã nhấn mạnh sự ám ảnh khách hàng và đổi mới trong suốt sự nghiệp của mình. Làm thế nào những giá trị đó định hình văn hóa của Ciroos và tầm nhìn dài hạn của nó để định nghĩa lại kỹ thuật độ tin cậy?

Sự ám ảnh khách hàng có nghĩa là tập trung không ngừng vào các thách thức thực tế mà các đội vận hành của khách hàng phải đối mặt, chẳng hạn như thời gian dài, kiệt sức, công việc nhàm chán và tìm kiếm liên tục câu trả lời cho các câu hỏi xuất hiện trong vận hành. Đổi mới là về việc giải quyết những vấn đề đó theo những cách có ý nghĩa trả lại thời gian và tập trung. Chúng tôi tưởng tượng tất cả các đội vận hành có một đồng nghiệp AI học tập liên tục, mở rộng theo nhu cầu và giúp đảm bảo độ tin cậy trên các hệ thống. Về lâu dài, chúng tôi nhìn thấy dịch vụ AI như một phần mềm trở thành tiêu chuẩn trên toàn bộ chu kỳ phát triển đến vận hành sản xuất – các hệ thống suy nghĩ, hành động và cải thiện cùng với đồng nghiệp của con người. Nếu chúng tôi có thể cung cấp cho người dùng của mình sự rõ ràng và không gian thở mà họ luôn cần, chúng tôi đã làm đúng công việc của mình. Những người dùng này có thể là các kỹ sư SRE, nhân viên vận hành IT, kỹ sư vận hành sản xuất, kỹ sư vận hành đám mây hoặc thành viên của đội DevOps thực hiện vận hành sản xuất.

Người đọc muốn tìm hiểu thêm về cách một đồng nghiệp SRE AI có thể giảm công việc nhàm chán của hoạt động, tăng tốc điều tra và hỗ trợ kỹ thuật độ tin cậy của con người trong vòng lặp nên truy cập Ciroos.

Antoine là một nhà lãnh đạo có tầm nhìn và là đối tác sáng lập của Unite.AI, được thúc đẩy bởi một niềm đam mê không ngừng nghỉ để định hình và thúc đẩy tương lai của AI và robot. Là một doanh nhân liên tục, ông tin rằng AI sẽ gây ra sự gián đoạn cho xã hội giống như điện, và thường bị bắt gặp nói về tiềm năng của các công nghệ gây gián đoạn và AGI.
Như một futurist, ông dành để khám phá cách những đổi mới này sẽ định hình thế giới của chúng ta. Ngoài ra, ông là người sáng lập của Securities.io, một nền tảng tập trung vào đầu tư vào các công nghệ tiên tiến đang định nghĩa lại tương lai và thay đổi toàn bộ lĩnh vực.