思想领袖

新的10倍工程师并不编写10倍的代码,他们构建能够编写代码的系统

mm
A cinematic, wide-angle shot of a technical professional sitting at a futuristic curved workstation in a dark data center, orchestrating a complex digital workflow displayed on glowing holographic glass panels.

十倍工程师已经成为硅谷的神话,拥有数十年的历史。独自工作的天才,戴着耳机,以超人的速度生产优雅的代码。我们一直在争论他们是否存在,争论如何聘用他们,并对任何声称自己是十倍工程师的人感到怨恨。

但是在通往以人工智能为首的未来途中发生了一件有趣的事情:十倍工程师成为了现实。他们只是与我们想象的完全不同。

OpenAI最近分享了一个三人团队如何使用Codex提交1500个拉取请求和大约一百万行代码,而无需手动编写一行代码。三个工程师,零手写代码。一个由数百名内部用户使用的生产产品。

这不是十倍的生产力,而是更接近于100倍。使其成为可能的技能不是输入速度更快或知道更多算法,而是构建使人工智能代理高效的系统:工作流程、防护栏、验证循环、代理插入和人类审查的接口。

我相信这是工程组织中新出现的关键功能。我称之为人工智能编排工程。

三个学科走进站立会议

如果你仔细观察人工智能编排工程师实际做什么,你会认识到三个熟悉的学科融合成一个。

最明显的成分是DevOps。DevOps集中了部署管道。一个团队配置了每个工程师在提交代码时使用的CI/CD工作流程。人工智能编排工程做同样的事情,但适用于代理工作流程。它定义了如何将任务分配给代理,如何验证输出,如何重试和回退。它是代理运行的共享基础设施。

然后是架构,它与DevOps的重叠比你想象的要多。架构师决定哪些接口被锁定,哪些模式被强制执行,哪些边界不能被跨越。在代理优先的世界中,这更为重要。代理需要干净、文档齐全的代码库和清晰的合同。人工智能编排工程师定义这些约束,不仅仅是为了人类的可读性,也是为了代理的理解。一个混乱的仓库不再只是技术债务,它是每个接触它的代理的生产力上限。

最不被理解的部分是人工智能特有的层。提示工程、上下文管理、模型选择、代理配置。今天,大多数工程师以分散的、任务为导向的方式执行这些操作。每个人都为自己找到自己的提示风格、代理设置和变通方法。人工智能编排工程师集中了这些工作。他们建立共享的剧本、可重用的配置、跨模型和使用场景的组织知识,关于什么有效、什么无效。

单独来看,这三个功能在今天的大多数工程组织中都存在。论点是,将它们集中到一个单一的角色中,会产生质的变化。

剧组负责人隐喻

电影导演不操作相机、不出演场景、不编辑镜头。但每一帧都反映了他们的决定。

他们选择镜头构图、节奏、基调。他们决定何时推进、 何时拉远。他们设置环境(灯光、布景、阻挡),以便每个演员在一个连贯的愿景中发挥出最佳水平。剧组很有才华,但没有协调,他们会陷入混乱,永远无法交付成果。

人工智能编排工程按照同样的方式运作。代理是有能力的,模型是强大的。但是,没有人设计一个协调它们的系统,定义约束,建立反馈循环,构建工作流程,你就会得到我们都经历过的结果:不一致的输出、浪费的计算资源、代理工作不一致、工程师花费更多时间修复人工智能生成的代码,而不是自己编写代码。

导演让电影变得比其各部分之和更伟大。人工智能编排工程师为代理舰队做同样的事情。

为什么大多数组织投资不足

我在整个行业中看到的情况是:公司在人工智能工具上投入了大量资金,但在周围的系统上投入的资金还不够。

工程师可以使用Copilot、Claude、Codex等工具。他们个人进行实验。有些人成为高级用户。大多数人停留在“花哨的自动补全”阶段。研究报告的20%的生产力提升,这是工具级别的采用,而不是系统级别的思考的症状。

那些突破的组织,那些报告2倍或更高的生产力的组织,有一个共同点。他们集中了编排工作。某个人(或某个团队)拥有代理工作流程、仓库准备、验证基础设施、每个代理可以访问的共享上下文的所有权。

这个角色实际上是什么样子

人工智能编排工程师的日常工作可能包括:

  • 设计代理工作流程:定义如何将功能请求转化为规范、计划、并行代理任务、审查和合并代码。
  • 构建验证基础设施:自动化测试、linting规则、安全扫描和评估框架,代理必须通过这些才能将其工作合并到主分支中。
  • 维护仓库健康状况以供代理使用:文档、清晰的接口、依赖项管理和代码库简化,所有这些都是针对代理理解而优化的,而不仅仅是人类的可读性。
  • 集中提示和上下文策略:共享系统提示、检索管道、模型路由决策和配置模板,整个团队都使用这些。
  • 监控和改进代理性能:跟踪成功率、故障模式、每任务成本和合并时间,整个代理舰队都在使用这些数据来调整系统。

这个人处于平台工程、软件架构和人工智能专业知识的交叉点。他们不编写功能代码。他们构建使功能交付快速、可靠和可扩展的系统。

历史模式

在云计算的早期,部署是每个工程师的副业。每个团队都有自己的脚本、服务器配置和将代码部署到生产环境的方法。DevOps出现了,以集中这一工作,平台工程演变为将其构建为共享的自助服务基础设施。

人工智能正在遵循相同的轨迹。目前,代理的使用是每个工程师的副业。每个人都有自己的提示风格、工具偏好和对人工智能何时有帮助、 何时无帮助的精神模型。集中这一工作的组织,将代理使用视为基础设施,而不是个人实验,将会像拥有成熟的DevOps实践的组织超越那些没有DevOps实践的组织一样领先。

区别在于速度。DevOps转型花了十年。人工智能转型可能只需要几个季度,尽管我会承认,这个预测假设组织比平常更快地认识到这种模式。

前进之路

如果你是一名工程领导者,我建议你这样做,尽管你的里程可能会根据你的团队已经取得的进步而有所不同。

  1. 找出谁已经在非正式地做这项工作。每个组织都有人已经弄清楚了代理工作流程,其他工程师会去寻求他们关于提示或工具设置的建议。这个人就是你的原型人工智能编排工程师。
  2. 使其正式化。给这个职能一个名称、一个使命和资源。不要让它作为某人的“真正”工作的副业。
  3. 从仓库准备开始。确保在投资复杂的代理工作流程之前,代码库是代理可以实际导航的东西。清晰的接口、良好的文档、综合测试和简化的架构。
  4. 集中有效的内容。有人发现了一种提示策略或工作流模式,可以显著提高代理输出时,捕获它。将其作为整个团队的默认设置,而不是锁在某个人的脑海中。
  5. 在系统级别衡量。不要仅仅跟踪个别工具的使用情况。跟踪代理完成的任务数量、审查和重做率、瓶颈所在的位置。

新的10倍

十倍工程师的神话一直是关于个人英雄主义的。一个人,通过纯粹的天才和咖啡因,超越了所有人。

人工智能时代十倍工程师的现实是关于系统思维的。那个让每个其他工程师(和每个代理)更高效的人,通过构建正确的基础设施、正确的工作流程、正确的约束。

他们不编写十倍的代码。他们构建能够编写代码的系统。

我不确定这个角色会不会完全按照我在这里描述的方式成型。但我相当确定,弄清楚编排层(无论他们最终如何称呼它)的组织,将会真正实现其他人只是谈论的生产力提升。

安德鲁·菲列夫(Andrew Filev)是Zencoder的创始人兼首席执行官。他通过创立Wrike(拥有20,000多个客户,出售价格为22.5亿美元)改变了协作工作管理的格局,并被福布斯和纽约时报报道,他对人工智能和创新技术的热情继续塑造着工作的未来。