Connect with us

访谈

Ciroos创始人兼CEO罗纳克·德赛 – 采访系列

mm

罗纳克·德赛,Ciroos的创始人和CEO,带领公司以清晰的使命:消除IT琐事,给SRE、DevOps和运营工程师回归时间。他坚信AI应该有意义地增强人类的专业知识,而不是取代它,尤其是在高风险的运营环境中。在创立Ciroos之前,德赛在思科公司工作了二十多年,担任过多个高级领导职位,包括思科全栈可观察性和AppDynamics的高级副总裁和总经理。在他的职业生涯中,他专注于构建可扩展、以客户为中心的平台,拥有超过50项正在使用的专利,并继承了思科任期内的创新和客户痴迷原则。

Ciroos正在构建一个AI本地SRE队友,旨在大幅减少调查和解决复杂IT事件所需的时间,跨越现代、多域环境。该平台使用本地多智能体AI来推理信号、自动化调查和支持自动化、增强和自主运营,同时确保人类保持牢固的控制。通过关联工具和域之间的数据,这些域传统上是孤立的,Ciroos使团队能够从反应性消防转变为更快、更自信的决策,从而让工程师专注于更高影响力的工作,而不是重复和疲惫的运营琐事。

您在思科公司工作了二十多年,帮助构建了一些最成功的网络和可观察性产品。是什么启发您跳出思科并创立Ciroos?

在我与各个企业团队的互动中,我反复看到同样的故事情节。运营团队被仪表盘、警报和依赖机构知识来排除多个系统的问题所淹没。尽管在可观察性上投入了大量资金,但他们仍然缺乏一种方法来实时关联域之间的证据。我的联合创始人和我想要改变这种情况。我们出发去构建一个可以像经验丰富的运营商一样推理的AI系统,并从一开始就与SRE合作,启用团队专注于改善弹性和可靠性,而不是花时间寻找见解或解决问题。

您将Ciroos描述为对运营中最艰难问题的回应——跨多个域的调查。您在思科公司领导AppDynamics和全栈可观察性业务的经验如何塑造了这种认识,并影响了Ciroos的架构?

在AppDynamics,我们实现了对应用程序行为的高水平洞察力。然而,当事件的原因位于应用程序之外(无论是在云配置、网络还是IAM中),仅在应用程序层面上具有可见性是不够的。挑战在于建立上下文。这种经验指导了我们如何设计Ciroos。我们的平台将AI推理扩展到生产运营。它查看信号、事件和域之间的关联,并推理域边界以确定事件的真实根源。

Ciroos引入了“AI SRE队友”的概念。这种AI作为协作者的想法与传统的自动化或可观察性工具有何不同?

AI SRE队友的功能更像是一个新队友,而不是一个新工具。它首先倾听,了解环境,接受定义的任务,并随着时间的推移建立信任。虽然传统的自动化执行规则,但队友应用推理。当它识别出一个问题时,它选择相关的域专家代理,收集支持证据,并以上下文呈现。这种协作元素解放了工程师的时间,使他们能够验证和解决问题,而不是手动推导关联。

您的平台使用多智能体AI推理。您能解释一下多个AI代理如何协调以加速根源分析和提高复杂系统的准确性吗?

每个代理都具有域专业知识——一个在Kubernetes,另一个在云,另一个在网络等等。当事件发生时,这些代理作为一个中心推理层的一部分,实时关联发现。系统确定要调用哪些代理,分配给每个代理哪些任务,按什么顺序执行,以及执行多长时间。这种协调减少了调查时间,提高了准确性,确保每个层次都在上下文中进行评估,而不是在一个孤立的环境中进行评估。

从技术角度来看,Ciroos如何动态地跨不同的数据源(如云遥测、应用程序日志和基础设施指标)进行推理,而不会让用户感到不知所措?

Ciroos将每个数据源视为更大图景中的一个镜头。它将数据源上的观察结果对齐到一个统一的时间线上,并仅显示相关的因果关系。例如,如果一个Pod重启事件发生在IAM或网络策略的小变化之后,Ciroos会自动连接该序列。它超出了提供原始仪表盘的范围,而是根据证据组装一个完整的故事,以帮助工程师了解发生了什么。

信任和可解释性是您设计理念的核心。您如何确保AI驱动的建议保持透明,并且人类工程师始终保持控制?

每个建议都附有支持证据和推理。工程师可以追踪每个结论,测试他们的假设,并管理系统的自治级别,从辅助到半自治。系统通过人类反馈随着时间的推移保留上下文知识,使其能够改善决策质量,同时保持完全受控。我们的方法类似于团队如何培训新成员,具有明确的界限,直接推理和完全的人类监督。随着系统随着时间的推移表现出越来越可靠的性能,信任得以建立。

早期采用者报告称,Ciroos将调查时间从小时缩短到分钟。团队开始在生产中使用AI SRE队友时,您最惊讶的模式或见解是什么?

有两件令人愉快的事情——首先,大型企业对我们核心价值主张的反应速度之快令人振奋。其次,我们的客户仔细审视了我们的技术,并想出了超出根源分析的一些非常独特的用例。这些用例突出了大型企业今天在生产运营中面临的真正挑战。

“AI作为队友”的概念表明了协作而不是替代。您如何看待这种概念在组织越来越舒适地与智能系统合作时的演变?

我们将其视为一个涉及自动化、增强和最终自主驾驶的旅程。虽然Ciroos今天支持所有三个模式,但我们通常会看到企业采用AI的曲线。首先,企业使用我们的AI系统来自动化明确定义和可重复的任务,同时尽量减少对人类的认知负担。相比之下,非AI本地系统会给人类操作员带来过多的配置参数和规则的负担,直到客户实现价值。

在下一个阶段,企业利用AI系统来增强人类在多个域上的推理,同时系统提供详细的解释和建议以供人类验证和执行。这是大多数企业今天的状态。

随着时间的推移,AI可以自主管理整个事件工作流程,只在必要时升级到人类。我们预计这将逐渐开放,基于任务。这种进展类似于团队与新员工建立信任的方式。随着您获得更多信心,合作关系变得更加深入。

许多企业已经依赖成熟的可观察性和事件管理平台。Ciroos如何与这些现有生态系统集成,而不会破坏工作流程?

从一开始,集成就不是可选的。我们相信,联邦数据模型为企业提供了最快的时间价值、最多的选择和最低的所有权成本。Ciroos AI SRE队友今天与七个不同类别的企业系统集成——可观察性、事件响应、协作工具、云平台、票务系统、CI/CD工具和物理基础设施,通过开放API和协议,如MCP和A2A。它集成到现有的工作流程中,而不是要求团队采用新的工作流程。这种设计使企业能够轻松采用。团队可以更快地获得答案,而无需更改现有的工作流程。

您在整个职业生涯中都强调了客户痴迷和创新。这些价值观如何指导Ciroos的文化和重新定义可靠性工程的长期愿景?

客户痴迷意味着我们对客户运营团队面临的现实世界挑战(如长时间工作、疲劳、琐事和不断寻找答案)有着无情的关注。创新是关于以有意义的方式解决这些问题。我们设想所有运营团队都有一个AI队友,它可以持续学习、扩展以满足需求,并帮助确保系统的可靠性。从长远来看,我们看到AI服务作为软件成为整个开发到生产运营周期的标准——系统可以在其人类同事旁边思考、行动和改进。如果我们能够为用户提供他们一直需要的清晰度和呼吸空间,我们就做得对。这些用户可能是SRE、IT运营人员、生产运营工程师、云运营工程师或执行生产运营的DevOps团队成员。

希望了解更多关于如何使用AI SRE队友减少运营琐事、加速调查和支持人工在环可靠性工程的读者可以访问Ciroos

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。