访谈
杰里米·伯顿,Observe 首席执行官 – 采访系列

杰里米·伯顿,Observe 首席执行官,是一位具有超过 20 年领导经验的企业软件高管,曾在 Dell Technologies、EMC、Oracle 和 VERITAS 等主要科技公司任职。他曾领导全球团队从事产品开发、营销和战略性并购,打造和扩张存储、安全和 SaaS 业务。伯顿还联合创立了 Oracle 技术网络,该网络在全球拥有数百万成员,并目前担任 Snowflake 董事会成员和迈凯伦 F1 车队的顾问。
Observe 是一家位于加利福尼亚州圣马特奥的下一代 SaaS 可观察性平台,帮助 SRE、DevOps 和工程团队调查和优化现代分布式系统。它建立在 Snowflake 的数据基础设施之上,将日志、指标和跟踪统一为一个单一的、上下文丰富的数据集,使团队能够加速事件响应、确定根本原因并在复杂的云环境中提高可靠性。
您曾在全球巨头如戴尔、EMC 和 Oracle 担任高级领导职务,现在您正在 Observe 领导一家初创公司。是什么激励您放弃稳定和规模,跳入从零开始构建的挑战中?
我在职业生涯中很幸运能够为一些不可思议的领导者工作,包括拉里·埃利森和迈克尔·戴尔。我在他们任职 20 或 30 年后与他们合作,但使他们杰出的原因是他们从一开始就参与其中。他们做出了早期的产品决策,建立了市场途径,并为长期成功设定了文化。我的角色是对他们已经完成的几十年的辛勤工作进行增量改进。最终,我在职业生涯中达到了一个点,我想向自己证明,我也可以建立一家公司,推出一款产品,建立销售渠道,并创造一种我相信可以在长期内蓬勃发展的文化。
Observe 正在将自己定位为可观察性领域的新类别,整合日志、分析和监控功能。您如何看待这种方法与 Splunk 和 Datadog 等传统玩家相比?
传统工具面临的最大问题是它们不是为规模而设计的。在与客户的对话中,我们一次又一次地看到 Splunk 和 Datadog 随着遥测数据量的增长而变得成本高昂,这本质上是传统工具架构的问题。
Observe 的不同之处在于,我们的平台建立在使用 Apache Iceberg 等开源格式的流数据湖架构之上。这意味着我们可以解耦计算和存储,弹性扩展,并以传统系统的零头成本提供可观察性。像 Splunk 这样的竞争对手仍然依赖于需要为峰值容量进行规划的单体架构,即使像 Datadog 这样的新工具也需要数据分层、重新水合和重新索引来控制成本。
我们还专注于统一的可观察性体验。日志、指标、跟踪和事件都位于同一个地方,具有单一的查询语言和自动映射服务、用户和事件之间关系的知识图。这种上下文使故障排除更快。相比之下,Splunk 和 Datadog 有单独的日志、指标和跟踪后端,导致分析速度更慢。
最后,我们在 AI 驱动的故障排除上投入了大量精力。我们的 O11y AI SRE™ 可以接受自然语言输入、生成假设并引导工程师完成事件解决,而不仅仅是提醒他们。这是建立在我们的知识图之上,以提供故障排除所需的上下文。这种能力超出了大多数竞争对手今天提供的异常检测或警报。
简单地说:我们具有成本效益、统一性和开放性。这些品质是客户一致告诉我们 Observe 与 Splunk 和 Datadog 等传统玩家相比的区别所在。
您曾监督过数十亿美元的运营,现在您正在运行一家初创公司。您从大型企业中学到的关于效率、敏捷性或创新的经验是什么?哪些经验不适用?
这似乎违反直觉,但成功的大公司只做少数事情,并且对每个细节都了如指掌。那些陷入困境的公司做得太多,导致一切都变得平庸。
在初创公司中,您一次专注于一件事,并且对每个细节都非常痴迷。没有足够的资金来做其他事情。因此,使初创公司如此激烈的原因是,如果您不能足够快地解决问题,您可能会破产。因此,您必须更快地做出决定、发布和失败,并且要在更少的人手下完成所有这些事情。
然而,初创公司最令人解放的一方面是,您没有既定的产品、商业模式或市场途径。这意味着您可以对所有这些事情做出新的假设。这种情况在大公司中是不可能的。例如,您不能用新颖的产品打破商业模式。即使从技术上讲您可以构建它,但 CFO 和华尔街也不会让您最大限度地发挥其潜力。这就是为什么初创公司通常会赢,即使从理论上讲它们没有任何机会。
您还曾担任 Snowflake 董事会成员近十年。您从 Snowflake 的旅程中学到了什么,这些经验如何影响您的 Observe 战略?
Snowflake 攻击了一个古老的问题,采用了新的架构。他们建立在一个简单但强大的想法之上,扰乱了一个被传统供应商阻塞的巨大市场。这里有几个经验教训:在巨大的市场中竞争,您可以建立一家巨大的公司。此外,您必须与现有公司有着根本不同的方法,这样客户就可以看到在转向新技术时可以获得巨大的好处。
我们正在攻击的可观察性市场是巨大的,价值 300 亿美元,并且正在增长。我们以一种独特的方式解决了可观察性问题:利用数据湖基础、弹性计算和开源格式。这承诺为客户提供故障排除速度和整体成本的数量级改进。
您深入参与了产品开发、营销和大规模并购。这种广泛的背景如何影响您在 Observe 中优先考虑增长策略的方式?
在初创公司的早期,事情很简单:您构建一个伟大的产品并尝试出售它。这就是增长策略。鉴于我的职业生涯偏向于企业软件和为大型企业解决复杂问题,所以 Observe 正面向这一领域的关注并不是什么令人惊讶的事情!
根据我的经验,我相信要建立一家大型可观察性公司,您必须为世界上最大的公司解决问题。这些问题包括处理数百万字节的数据、数千名用户和数千个应用程序。有很多可观察性公司,但很少有公司能够在这种环境中获胜,我正在确保 Observe 能够做到这一点。
可观察性已经变得至关重要,因为现代分布式应用程序变得越来越复杂。您认为在未来 3-5 年内,企业面临的最大挑战和机遇在哪里?
今天最大的挑战是规模。Kubernetes、微服务和现在的 AI 工作负载正在产生传统工具难以应对的数据量。这些工具的可靠性随着成本的飙升而直线下降,这根本不可持续;需要新的架构。
更糟糕的是,在接下来的几年里,我们将看到有史以来最多的代码编写,得益于 AI 编码工具。这些代码不会完美无缺,某个时候它们会失败。增长的领域在于问自己:如何排除没有人编写的代码的故障?或者,当代码生成工具可以查看代码并修复 bug 时,它们是否可以真正查看应用程序在生产中的行为并找到有问题的代码?这是未来可观察性供应商的一个巨大机会。
许多团队在处理日志、指标和跟踪的单独系统时苦苦挣扎。Observe 如何简化工程和 DevOps 团队的体验?
与其使用三四个工具,Observe 为客户提供了一个单一的平台。公司的日志、指标、跟踪和警报都位于同一个系统中,并通过知识图联系在一起。知识图提供了上下文,允许用户跨日志、指标和跟踪无缝地进行钻取和旋转,以加速故障排除。这减少了他们在平台之间跳转所花费的时间,而是允许他们在无需数据导出或上下文切换的情况下发现问题。
您能否分享一个具体的例子,说明 Observe 如何帮助客户解决一个重大的问题,这些问题使用传统的可观察性工具可能很难或不可能解决?
Capital One 使用 Observe 来显示关键客户旅程的状态,方法是关联和丰富遥测数据以获得相关的业务上下文。他们每天处理数百万字节的遥测数据,包括日志、指标、跟踪、更改记录、VPC 流日志和 AWS 配置数据。Observe 为 Capital One 提供了一个统一的平台,用于端到端的可观察性,因此开发人员和 SRE 可以执行交互式事件响应和调试。
机器学习或 AI 在 Observe 背景下扮演什么角色,它如何帮助客户更快地发现洞察力或自动检测问题?
机器学习在可观察性方面有着复杂的历史,因为企业环境本质上是嘈杂的,很难产生一个不会导致成千上万个异常的模型。生成式 AI 是一种非常不同的技术,它将对可观察性产生更深远的影响。
我们相信 AI 将改变工程师与可观察性工具的交互方式。首先,他们将能够直接用自然语言与可观察性数据交谈,同时坐在他们的 IDE 中,未来的用户中可能有一半永远不会登录或学习 Observe!其次,AI 代理将在“和平时期”扫描遥测数据以查找可能最终导致事件的潜在问题。AI 代理不会感到疲倦或无聊,并且可以执行人类无法完成的任务。最后,在“战争时期”,AI 代理将在事件解决过程中协助工程师和 SRE,并指导他们采取什么行动来解决问题。
您的以一级方程式为灵感的领导风格强调了精神韧性和从错误中吸取教训的重要性。这种观点如何塑造您在 Observe 中的建设和领导团队的方式,无论是胜利还是挑战?
一级方程式赛车的成功是通过使用数据来指导未来的决策来实现的,无论是对于驾驶员还是汽车。到赛季结束时,F1 车的 90% 的零件都被更换了,它在赛道上也快了 2 秒钟。
在 Observe,我们必须拥有同样的心态才能成功。我们发布、衡量、倾听、快速适应。我想象我们的产品中有 90% 的内容与几年前相比已经不同。这种方法需要大量的纪律和谦逊,这并不容易,因为您一次又一次地听到坏消息。然而,如果您对足够多的坏消息做出反应,它最终会转变为好消息,ARR 也会加速。这不是魔法,这是逻辑!
感谢这次精彩的采访,希望了解更多的读者可以访问 Observe。












