Connect with us

访谈

Mathis Joffre,Blaxel 联合创始人兼工程负责人 – 采访系列

mm

Mathis Joffre, Blaxel 联合创始人兼工程负责人,是一位经验丰富的基础设施工程师,他之前曾帮助欧洲最大的云平台之一 OVHcloud 进行扩展。在 Blaxel,他领导了低延迟、可扩展系统的开发,这些系统专为 AI 代理而设计,并且是公司开源工具的关键贡献者,这些工具支持性能驱动的部署。

Blaxel 是一个专为自主 AI 代理而设计的计算平台,允许开发人员构建、测试和运行代理工作流,而无需管理基础设施。其架构包括超快微虚拟机、批处理作业执行和全局网关用于路由和故障转移。Blaxel 优先考虑安全沙箱、实时可观察性和无缝可扩展性,以支持生产级代理部署。

您在 OVHcloud 花了三年的时间从事 AI 和数据基础设施的研发——是什么关键时刻或洞察力激发您构建 Blaxel 作为专为 AI 代理的云平台?

我意识到,在 OVHcloud 的 AI 终端(OVHcloud 的旗舰 AI 产品)上工作时,下一代云架构和 AI 用例将变得多么复杂。我们正在从传统的聊天机器人转向完全自主的系统。这场代理革命不仅仅是关于更智能的应用程序;它迫使我们重新思考从软件栈到数据中心架构的所有事情。这种认识促使我构建 Blaxel。

回顾您的早期工程路径——从 Orange Business 建立网络工具到在 OVHcloud 定义堆栈——这种经验如何影响 Blaxel 的架构和哲学?

我会说:保持脚踏实地。尽管这场革命可能感觉像假设或被过度炒作,但使其成为现实的唯一方法是专注于具体的用例并将其解决得很好。这种心态从一开始就塑造了 Blaxel ——我们围绕客户的实际需求构建了它,从代码生成到视频分析。我们不追逐潮流,而是希望提供一个专为代理而设计的平台,给予代理运行所需的所有功能。

您能否带我们了解模型上下文协议(MCP)和多区域模型网关的作用?它如何增强代理的容错性和可扩展性?

代理的所有内容都与上下文有关——代理访问相关信息的能力是其有效运行的关键。MCP 服务作为我们将代理与基础设施集成的主要接口,因为它解决了这个挑战。就像开发人员使用 REST API 将 SaaS 世界中的应用程序连接起来一样,他们现在将使用模型上下文协议为其代理提供特定的、可处理的上下文。

但上下文本身是不够的——代理还依赖于 LLMs,例如 OpenAI 或 Anthropic 提供的。考虑到日益增长的需求,这些提供商的服务器偶尔会因流量而不堪重负。这就是多区域模型网关的用途。

模型网关允许将流量动态地重定向到最近的可用 LLM 端点(从延迟方面来说),无论是 OpenAI、Anthropic 还是其他提供商。这不仅可以提高响应时间,还可以确保容错性(通过故障转移到替代提供商)和可扩展性(通过在多个区域和模型中分配负载)。

Blaxel 支持代理可以调用的开发人员工具——是什么激发了您设计可供代理消费的 API 而不是供人类消费的 API?您如何看待这一趋势的演变?

对我来说,OpenAI 发布的 Operator 是一个启示——它让我意识到未来将涉及代理直接消费基础设施。代理从分析历史数据和回答问题开始。然后他们转向生成代码。下一个逻辑步骤是让他们自主部署代码。

这就是为什么我们相信代理需要自己的云——专门为代理的理念而设计的云,未来 IT 操作将由自主代理驱动。

反思现有的云提供商和代理托管平台(如 Modal、RunPod、Replicate 等),您在代理大规模部署时看到最常见的缺口在哪里?

今天的大多数平台都不是为持久、有状态、自主代理而设计的——它们是为无状态作业或推理 API 而设计的。因此,您最终会以不适合支持具有内存、反馈循环和复杂 I/O 的长期过程的方式将计算、内存、存储和网络拼凑在一起。结果要么是脆弱的系统,要么是高运营开销。这种差距在于我们需要基础设施,使代理成为第一类公民,而不是事后补充。

您看到最常见的反模式是什么——以及构建者在将自主代理部署到生产环境中与开发/测试环境中会遇到什么样的问题?
最常见的错误是将代理视为函数——调用、执行,然后忘记。在生产环境中,代理需要保持上下文、管理工具,并有时需要实时对外部信号做出反应。人们经常低估现实世界环境的混乱程度:不稳定的 API、不一致的数据、意外的状态转换。构建者经常在理想条件下进行测试,但生产现实需要强大的可观察性、沙箱和恢复策略。

您的路线图包括快照分叉、自动故障转移和更深入的计算优化等功能。您认为哪一个对代理优先系统最具变革性?

快照分叉,毫无疑问。它解锁了调试、实验和并行推理模式,这些模式在传统云环境中是不可能的。想象一个代理到达决策点——它将沙箱分叉成多个分支,并行探索不同的结果,然后选择最佳路径。这种分支逻辑是代理工作流的本质,但对于传统云运行时来说是完全陌生的。它从根本上改变了我们对自主性和控制流的思考方式。

Gartner 预测,到 2028 年,75% 的应用程序将使用 AI 代理——您预计 Blaxel 将如何随着 AI 代理在各个行业中变得无处不在而演变?
随着代理变得主流,我们预计 Blaxel 将从“代理的基础设施”演变为“代理依赖的操作层”——处理生命周期、协调,甚至市场交互。您不仅会在 Blaxel 上部署代理——您还会组合它们、监视它们,并拥有管理其他代理的代理。我们已经看到用例在金融、安全和企业自动化领域出现,这些领域都指向了这一方向。

您是否设想一个未来,代理不仅运行应用程序,还可以自主管理和重新配置基础设施?这种转变的文化和安全影响是什么?
是的,这既令人兴奋又令人不安。从技术上来说,这是有意义的——代理可以监视系统运行状况、应用补丁、优化工作负载。但从文化上来说,这挑战了我们对控制和信任在运营中的思考方式。从安全方面来说,这意味着重新思考权限模型:不仅仅是谁可以采取行动,还有 代理可以成为什么。我们将需要新的抽象来实现可验证的自主性和受限的自我改进。

关于代理本地基础设施的独特之处,您认为最大的误解是什么?
它只是关于更多的 GPU 或更长的运行时间。代理本地基础设施是关于行为上的便利性——为代理提供记住、探索、适应和恢复的能力。这需要在整个堆栈中进行更改:跟踪不断演变的状态的存储、支持并发和分支的执行模型、针对推理而非延迟进行优化的可观察性。它是一种思维方式的转变,而不仅仅是资源的提升。

您在 OVHcloud 时期最后悔的技术遗憾或限制是什么,您现在在 Blaxel 最高兴能解决它?

在 OVHcloud,我所构建的很多东西都受到传统抽象的限制——虚拟机、容器、网络——这些都是为人类驱动的工作负载而优化的。我们无法轻松地摆脱这些范式。在 Blaxel,我们从头开始。没有必要假装代理是一个批处理作业或微服务。我们可以直接将内存、工具和目标构建到运行时中——这解锁了一个全新的设计空间。

感谢这次精彩的采访,希望了解更多的读者可以访问 Blaxel

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。