访谈

彼得·庞(Peter Pang),CREAO 联合创始人兼 CTO – 采访系列

mm

彼得·庞(Peter Pang),CREAO 联合创始人兼 CTO,拥有深厚的背景人工智能研究和机器学习基础设施,在新兴的智能 AI 领域。 在 2025 年推出 CREAO 之前,庞在 Meta 公司担任研究科学家,工作于 LLaMA 基础模型相关的生成人工智能计划,包括用于数据注释和合成数据生成的 LLM 智能系统。 之前,他曾在苹果公司担任机器学习工程师,专注于自然语言处理、迁移学习、深度学习和预测系统,而他早年在 布鲁克黑文国家实验室 的工作使他接触到了先进的科学研究和实验系统。 他在人工智能研究、机器学习和自主系统方面的经验现在塑造了 CREAO 的技术愿景,即建设能够持续执行、记忆和工作流程自动化的人工智能代理。

CREAO 是一个面向个人的 AI 原生平台,旨在帮助个人和企业通过自然语言而不是传统编码创建自主人工智能代理和工作流程。 该公司将其“超级代理”定位为一个持续的人工智能系统,不仅可以生成输出,还可以将成功的任务转换为可重用的代理,这些代理可以持续运行,具有记忆、调度和与外部工具和 API 的集成。 CREAO 的平台支持包括 OpenAI、Anthropic、谷歌等在内的主要前沿人工智能模型,同时强调以人工智能为中心的运营模式,即代理越来越多地处理运营执行,而不是作为一次性的助手。 CREAO 总部位于帕洛阿尔托,专注于推进智能人工智能工作流程、无代码自动化和可扩展的人工智能编排,以满足企业和独立专业人士的需求。

您在 Meta 公司工作了近六年,参与了 LLaMA 基础模型和用于合成数据生成的智能系统的开发。 什么让您相信现在是联合创立 Creao AI 的合适时机? 您认为现有的 AI 平台仍然存在哪些问题?

在 Meta 公司,我亲眼目睹了模型能力的巨大进步。 我曾参与过 LLaMA 的开发,亲眼见证了这些模型在受控环境下的能力。 随着每一代模型的推出,模型的能力都有了显著的提高。 不过,问题不在于模型的能力,而在于人们实际从中获得的东西。

每个平台都提供相同的界面:聊天窗口。 您提出问题,它会回答,然后您进行工作。 人工智能就像一个忘记一切的合同工。 您明天再次运行它,系统就不会有任何学习。 您的业务保持不变。

这是问题所在。 不是模型的智能,而是执行力。 没有人在建立一个系统,使人工智能可以从对话到执行的整个过程中持续运行并重复执行,而无需人工干预。

我的物理学背景教会了我如何思考系统,而不是组件。 在布鲁克黑文国家实验室和斯托尼布鲁克大学攻读博士学位期间,我花了几年时间建立实验管道,其中仪器、数据采集和分析必须作为一个闭环工作,否则结果将毫无意义。 在苹果公司,我曾从事多模态模型的开发,并看到了同样的模式:没有系统的原始能力就不会产生复合效果。

当凯和我开始讨论 CREAO 时,我们的论点很明确:该行业不需要另一个聊天机器人。 它需要一个闭环——人工智能可以建立工具、运行它们并随着时间的推移而改进。 模型终于足够好了。 没有人在建立这个闭环。

CREAO 将自己描述为一个平台,人工智能既可以构建工具,也可以自主执行工作。 您如何定义真正的“闭环”人工智能系统与当前市场上的人工智能协同工具之间的区别?

协同工具坐在您旁边。 您驾驶,协同工具建议。 如果您睡觉,协同工具什么也不做。

一个闭环系统完成整个周期:观察、行动、学习、改进。 人类定义结果。 系统处理执行、持续性和迭代。

在 CREAO,我们将其视为一个马具系统。 一个代理可以草拟电子邮件、整理错误或总结报告。 但是,一个代理不会产生复合效果。 它运行、产生输出并停止。 一个马具系统包围代理,将它们从一次性工具转变为自我改进的引擎。 它遵循一个循环:连接、审计、解决方案、构建、自我改进。 系统连接到您的真实数据源——您的存储库、错误日志、广告账户。 它评估当前状态。 它提出修复方案。 代理被构建来执行这些修复方案。 输出反馈到系统中。 审计的新一轮开始。 循环收紧。

这在结构上与“我有一个可以做 X 的代理”不同。 这是一个发现 X 应该是什么、构建 X、衡量 X 并在没有人告诉它的情况下改进 X 的系统。

大多数协同工具都是人工智能辅助的。 一个闭环是人工智能操作的。 这是区分线。

您最近关于“马具工程”和以人工智能为中心的组织的帖子在网上引起了巨大的关注。 您最惊讶的是什么,CREAO 现在有 99% 的生产代码是由人工智能编写的?

帖子获得了 180 万的浏览量。 我最初是为团队写的文档——记录我们如何重组以及我们学到了什么。 我没想到它会有这么大的影响。

让我惊讶的是反应的分歧。 一些人说这是不负责任的,不能相信人工智能生成的代码在生产环境中使用。 另一些人说:“我们也看到同样的情况,但没人谈论它。”

后者告诉我一件重要的事情。 行业中有很多团队正在悄悄地经历这种转变。 一位记者告诉我,她与五个人讨论过这个话题。 她说我们比任何人都走得更远:“我不认为任何人完全重建了整个工作流程,就像我们一样。”

99% 的数字听起来很有争议,但这只是消除了人为瓶颈的结果。 当您设计架构时,代理可以看到整个代码库——我们将一切统一到一个单一的 monorepo 中,以便人工智能可以看到一切——您的 CI/CD 管道有六个确定的阶段,并且有三个并行的人工智能审查过程捕获每个 PR 的质量、安全性和依赖项问题,并且您的自我修复循环检测错误、整理它们并自动验证修复。 代码量自然而然地产生。

最让我惊讶的是,更多的 CTO 没有公开说这件事。 我认为很多人都在做这件事,但他们害怕这种看法。

在您的文章中,您认为大多数公司仍然是“人工智能辅助”的,而不是真正的“人工智能优先”。 您认为领导团队在认为自己已经是人工智能原生组织时存在的最大误解是什么?

我看到团队声称自己是人工智能优先,但仍然使用相同的冲刺周期、相同的 Jira 板、相同的周会、相同的 QA 签署。 他们在循环中添加了人工智能。 他们没有重新设计循环。

最大的误解是:“我们使用人工智能工具,因此我们是人工智能优先的。” 一名工程师打开 Cursor。 一名产品经理使用 ChatGPT 编写规格。 QA 使用人工智能测试生成。 工作流程保持不变。 效率提高了 10% 到 20%。 没有什么结构上的改变。 这是人工智能辅助的。

这里有一个测试:如果您明天删除所有人工智能工具,流程需要改变,还是只需要更换工具? 如果流程保持不变,则您不是人工智能优先的。

第二个误解是,人工智能优先是工程决策。 如果工程团队以小时为单位发布功能,但营销团队需要一周时间来宣布它们,那么营销团队就是瓶颈。 如果产品团队仍然运行每月规划周期,那么规划就是瓶颈。 在 CREAO,我们将人工智能原生运营推广到每个职能:从更改日志中生成的发布说明、由人工智能创建的功能介绍视频、由人工智能编排和自动发布的社交媒体、从生产数据库中生成的健康报告。 工程、产品、营销和增长都运行在一个人工智能原生的工作流程中。 如果一个职能运行在代理速度,而另一个运行在人类速度,人类速度的职能会限制一切。

第三个误解是,这种转变可以是渐进的。 一个常见的版本是人们所说的“氛围编码”。 打开 Cursor,直到它有效,然后提交,重复。 这会产生原型。 一个生产系统需要稳定性、可靠性和安全性。 您需要一个保证这些属性的系统,即使人工智能编写代码。 您需要构建系统。 提示是可以丢弃的。

您写道,真正的突破出现在 CREAO 将整个工程工作流程重新设计为围绕人工智能代理,而不是简单地将人工智能工具添加到现有流程中。 这种转变对团队来说最困难的部分是什么?

两者都很困难,但它们是不同类型的困难。

从运营的角度来看,最困难的决定是统一代码库。 我们的旧架构分散在多个独立系统中。 一个单一的更改可能需要修改三个或四个存储库。 从人类工程师的角度来看,这是可以管理的。 从人工智能代理的角度来看,这是模糊的。 代理无法看到整个图景。 它无法推理跨服务的影响。 它无法在本地运行集成测试。

我花了一周时间设计新的系统,另一周时间重构整个代码库,使用代理。 这是一个大胆的决定。 如果失败,我们将拥有一个破碎的 monorepo 和一个破碎的多存储库设置。 但是,原则很明确:您将系统拉入代理可以检查、验证和修改的形式时,您会获得更多的杠杆。 一个分散的代码库对代理来说是不可见的。 一个统一的代码库是可读的。

从文化的角度来看,最困难的部分是身份。 工程师从编写代码中找到价值。 当人工智能编写 99% 的代码时,问题变成了:我的工作现在是什么? 这不是一个流程问题。 这是一个存在问题。

我不会假装每个人都很高兴。 当我停止每天与人们交谈,因为我的管理时间从 60% 降低到不到 10% 时,一些团队成员感到不确定。 什么是 CTO 不再与我交谈的含义? 什么是我的价值在这个新世界中的含义? 这些都是合理的担忧。 一些人花更多时间辩论人工智能是否可以做他们的工作,而不是做这项工作。

但是,一旦人们体验到新的工作流程——他们的工作从编写代码转变为设计系统、定义 SOP、构建反馈循环——大多数人发现它更具有智力上的吸引力。 最难适应的工程师是那些将自己的身份与编写代码紧密联系在一起的人。 那些适应最快的人将自己视为问题解决者,而不是编码者。

您的一篇文章中更令人意外的观察是,初级工程师比高级工程师更快地适应了新的环境。 您认为为什么在以人工智能为中心的工程团队中,适应性比积累的技术经验更重要?

我注意到一个我没想到的模式。 拥有较少传统实践经验的初级工程师感到赋权。 他们拥有可以放大他们影响力的工具。 他们没有十年的习惯需要去掉。

拥有强大传统实践经验的高级工程师面临最大的挑战。 他们两个月的工作可以在一个小时内由人工智能完成。 对于那些花了多年时间打造稀有技能的人来说,这是一个很难接受的事情。

原因在于结构。 高级工程师的专业知识存在于代码的机械执行中——在复杂系统中导航、编写优化的实现、进行彻底的审查。 这些技能是在多年实践中磨练出来的,并且是真实的。 但是,在以人工智能为中心的环境中,编写代码的机械技能是被自动化的部分。 剩下的部分——也是最有价值的部分——是能够评估、批评和指导人工智能的能力。

我拥有物理学博士学位。 我的博士学位最有用的东西是教会我如何质疑假设、压力测试论点和寻找缺失的东西。 批评人工智能的能力比编写代码的能力更有价值。 您能否查看架构提议并发现代理忽略的故障模式? 您能否查看生成的 UI 并在用户告诉您之前知道它是错误的?

初级工程师从来没有深厚的机械专业知识可以放弃。 他们只是学习了新东西。

我不是在做判断。 我只是描述我观察到的情况。 高级性仍然是一个优势——深厚的建筑思维、系统设计的直觉——但只有当高级工程师愿意在不同的高度运作时。 在这次转变中,适应性比积累的技能更重要。

CREAO 重建了其基础设施,采用了 monorepo、自动化的 CI/CD 管道、人工智能审查系统和自我修复循环,集成了 CloudWatch、Sentry、Linear 和 Claude 等工具。 我们离软件系统基本上可以自我维护和自我修复的未来有多远?

我们在生产环境中运行一个自我修复循环。 让我描述它实际上做了什么。

每天早上 9:00 UTC,一个自动化的健康工作流程运行。 Claude Sonnet 查询 CloudWatch,分析所有服务中的错误模式,并为团队生成一个执行摘要。 没有人要求它。 一小时后,错误整理引擎从 CloudWatch 和 Sentry 中聚类生产错误,根据九个严重性维度对每个集群进行评分——用户影响、速度、爆炸半径、业务关键性和其他五个维度——并在 Linear 中自动生成带有示例日志、受影响的端点和建议的调查路径的调查票。

当工程师推送一个修复时,同样的管道处理它。 三个 Claude 审查过程评估 PR——代码质量、安全性和依赖项扫描。 CI 通过六个阶段的管道进行验证。 部署后,错误整理引擎重新检查。 如果原始错误得到解决,票自行关闭。

在此基础上,我们构建了代理马具。 一个三人评审小组——一个 Anthropic 评审员、一个 OpenAI 评审员、一个谷歌评审员——评分每个实时代理响应。 当评分下降时,一个六作业的工程管道将低评分转换为 Linear 票、草稿 PR 和经过验证的修复。 对于重大更改,人工智能门控灰度发布将 10% 的流量路由到新变体,并仅当评分保持时才通过 20%、50%、100%。

我们没有 QA 团队。 我们没有预生产环境。 没有人手动阅读记录并手动评分代理回复。

那么,我们有多接近? 比大多数人认为的更近,尤其是在受限领域——已知的错误模式、回归、配置漂移。 我会说 70% 到 80% 的生产维护可以以这种方式运行,具备合适的基础设施。仍需要人类的部分是模糊的故障,可能需要对架构本身进行理解,或者需要对业务决策的理解,这些决策尚未编码到系统中。

实际的收获是,您不需要等待完美。 即使是部分自我修复也会显著改变团队动态。

您已经描述了一个未来,“单人公司”将变得普遍,因为人工智能代理将取代大型运营团队。 您认为哪些公司或行业将最先感受到这种转变?

那些运营开销与核心价值创造比率最高的公司。

我相信单人公司将变得普遍。 如果一个建筑师和代理可以完成 100 个人才能做的工作,那么许多公司就不需要第二个员工。 模型能力是推动这一切的时钟。 我将 CREAO 的整个转变归功于过去两个月。 Opus 4.5 无法做到 Opus 4.6 能做的事情。 下一代模型将进一步加速这一进程。

这种转变首先影响那些工作是数字化的、可重复的,并且反馈循环清晰的领域。 内容制作、营销运营、电子商务、开发者工具、数字代理商。 如果您的业务本质上是获取信息、转换信息并分发信息,那么一个马具系统可以处理大部分循环。

我们在自己的平台上看到这一点。 我们在工作中描述特定的用例:一个独自的创始人连接 GitHub、Sentry 和 CloudWatch。 系统审计错误日志、部署频率和基础设施健康状况。 从该审计中,它构建了一个错误整理代理、一个功能发现代理、一个内容生成管道、一个基础设施优化循环。 每个代理运行、产生输出并改变状态。 下一个循环,审计看到不同的图景。 系统找到了新解决方案。 创始人没有计划它们。

在 CREAO,我们按照这种方式运行自己的运营。 一个代理取代了一个三人 SEO 工作流程,仅仅过了一夜。 另一个代理运行了两个内容管道的内容,两天后才有人检查输出。 输出是垃圾,我们杀死了它。 两者都发生在同一周。 我们称自己为未来的工作方式的碰撞测试假体。

感受到这种转变较晚的行业:医疗保健、重型制造、法律——任何工作是物理的、受到严格监管的,或者需要每个决定中的人类判断。 但是,即使在这些领域,行政层也会收缩。

CREAO 最近获得了由沙特阿美子公司 Prosperity7 Ventures 领投的 1000 万美元融资。 除了融资本身之外,这次合作为公司打开了哪些战略机会,尤其是当自主人工智能代理变得更加面向企业时?

Prosperity7 管理着一个 30 亿美元的多元化基金,在硅谷、中东和亚洲运营。 他们建立了一个涵盖企业人工智能基础设施的投资组合,包括 Arcee AI、Spirit AI 等。 战略契合点超出了资本。

他们的论点与我们的相符。 正如他们的执行董事 Raed Twaily 公开表示的那样:“随着人工智能的采用成熟,焦点正在从模型转向执行。 Creao AI 正在构建允许代理自主、可靠、持续运行的基础设施层。” 这正是我们所相信的。 人工智能代理市场预计到 2030 年将达到 520 亿美元。 捕获真正价值的公司将不是拥有最佳模型的公司,而是拥有最佳执行层的公司。

实际上,1000 万美元——将我们的总金额提高到一年内三轮融资的 2500 万美元——加速了三件事。 首先,工程深度。 我们正在扩大团队以处理企业级集成和代理到代理的协作。 自我修复的马具、评分面板、人工智能门控发布——这些都需要在企业规模上运行,而不仅仅是为 25 人的团队。 其次,地理范围。 Prosperity7 在中东和亚洲的存在为我们打开了市场,在那里,自主人工智能的采用速度比硅谷大多数人意识到的更快。 第三,机构信誉。 当您要求企业相信代理将持续运行他们的运营时,背书很重要。

我们在不到一年的时间内,以零营销预算,仅通过有机采用,获得了 2500 万美元的融资,并拥有 20 万用户。 这种速度反映了市场对执行层是下一个战场的信念。

展望未来,CREAO 在接下来的几年内会取得什么样的成功? 您的长期愿景是构建更好的人工智能代理,还是最终重新定义公司的结构和运营方式?

两者都有。 它们是不可分割的。

近期,成功意味着在规模上证明闭环模型的有效性。 我们拥有 20 万名用户,他们通过有机采用自 2025 年 9 月的推出以来到来。 我们每天将代码发布到生产环境三到八次。 我们在马具上运行自己的工程、营销和运营。 下一步是证明企业和个人都可以以这种方式运行。

但是,更好的代理并不是最终目标。 最终目标是马具——围绕代理的系统。

一个代理是一个工具。 一个马具系统是一个飞轮。 它运行得越多,就越紧凑。 它看到的数据越多,审计就越好。 审计越好,解决方案就越尖锐。 解决方案越尖锐,代理就越有影响力。 代理越有影响力,数据就越改变。 循环继续。

20 世纪的公司模型是人类分层为部门,每个部门都有经理和为人类吞吐量设计的流程。 当代理可以可靠地执行大部分运营工作时,这个模型不仅变得更高效——它开始变得不必要。

每个人都知道人工智能承诺带来生产力的爆发。 但是,该行业陷入了两个陷阱。 如果人类仍然一步一步地操作人工智能工具,生产力就会达到天花板。 而如果人类仍然是唯一构建工具的人,真正的革命还没有开始。 我们正在构建一个系统,人工智能既可以构建工具,也可以运行工具。

大多数我交谈的创始人仍然按照传统的方式运作。 一些人思考如何进行转变。 很少有人已经做到了。 工具对于任何团队来说都是可用的。 我们的技术栈中没有什么是专有的。 竞争优势是围绕这些工具重新设计一切的决心,以及愿意承担成本。

我们构建了一个代理平台。 代理重建了它。 这是设计原则。 马具每天都在收紧。

感谢您进行了这次精彩的采访,希望阅读本文的读者可以访问 CREAO 以了解更多信息。

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。