思想领袖

维护陷阱：为什么 AI 振动测试是 QA 的未来

Published November 21, 2025

Updated May 17, 2026

Tal Barmeir, Co-Founder and CEO of BlinqIO

人工智能已经改变了软件创作的节奏。使用 GitHub Copilot 和 ChatGPT 等工具，代码可以在几分钟内生成，而不是几周，界面几乎每天都在演变。然而，在这种加速的同时，质量保证，这个原本应该保护可靠性的学科，已经成为行业中最关键的瓶颈。开发人员曾经称之为自动化的东西，现在看起来越来越像手动操作。测试失败不是因为应用程序崩溃，而是因为测试套件崩溃。

问题不在于我们的工具，而在于我们的假设。多年来，行业一直将 QA 视为一个程序化的练习，一系列的点击、检查和验证。这种思维方式在软件移动缓慢时是有意义的，但现在已经不再如此。新的开发速度要求测试能够像代码一样快速地适应。我称之为振动测试，这是一种理解意图、解释上下文和对变化做出反应而不是崩溃的质量保证。

数字凸显了紧迫性。全球软件测试市场 2023 年超过 518 亿美元，预计到 2032 年每年增长 7%。自动化测试市场单独 2023 年价值 281 亿美元，预计到 2028 年将达到 552 亿美元，复合年增长率为 14.5%。尽管有这些投资，QA 团队仍然陷入反应循环。自动化曾经承诺速度，但往往带来了脆弱性。麦肯锡公司注意到，虽然 AI 启用的软件开发从根本上改变了产品的构建方式，并提高了交付速度，但也给测试和质量实践带来了额外的压力，以跟上这种速度。

自动化的破碎承诺

在各个组织中，相同的模式重复出现。团队花费时间修复脆弱的脚本，这些脚本由于与产品质量无关的原因而失败。用户界面中单一的变化，例如重命名按钮、新的布局或添加步骤，可以破坏数百个测试。每个修复都会产生更多的维护。这导致自动化成为它试图消除的东西，即重复劳动。

程序化自动化是建立在界面保持稳定和用户旅程保持可预测的假设之上的。这个假设并没有幸存到持续部署、A/B 测试和实时个性化。现代系统的设计是流动的。QA 只有通过学习解释行为和意义而不是静态屏幕坐标才能跟上。

这是维护陷阱。自动化原本应该加速开发，但实际上却减慢了开发，因为维护开销的增长速度超过了交付的价值。这种悖论是现代软件工程的最大失败之一。

为什么生成式 AI 没有抓住重点

生成式 AI 的兴起让许多人在这个领域抱有希望，认为救星即将到来。如果 AI 可以编写代码，当然也可以测试它。但现实却更为谦逊。大多数所谓的“AI 测试”工具仍然依赖于脆弱的逻辑。它们比人类更快地生成脚本，但这些脚本仍然受到相同的选择器和依赖的束缚，这些选择器和依赖一直以来都失败了。因此，一项综合性的学术研究表明，尽管人们对 AI 启用的测试有广泛的兴趣，但测试团队中的实际采用仍然有限。

这些系统加速了编写测试的过程，但没有改变保证质量的过程。它们可以快速生成 Selenium 脚本，但当 UI 元素移动或变量名称更改时，它们仍然会崩溃。虽然 AI 测试工具存在，包括来自已经推动该领域发展的公司，但更广泛的行业转变尚未实现。大多数解决方案仍然专注于代码生成，而不是理解意图。

从脚本到语义

真正的转变需要理解为什么交互很重要的 AI 系统，而不仅仅是如何执行。振动测试超越了程序化的准确性，转向了体验式的理解。它不再验证“按钮 A 导致页面 B”，而是评估“用户是否实现了预期的结果，即使界面已经更改”。

当一个银行应用程序重新设计其登录流程时，传统的套件会崩溃，而振动测试系统会识别意图，然后找到新的路径，验证结果，并自主继续。这种差异决定了 QA 是否能够促进创新或阻碍创新。

这种方法减少了不稳定性，降低了维护开销，让 QA 团队专注于探索性测试和新功能，而不是修复破碎的脚本。在规模上，这不仅是一种技术转变，也是一种经济转变。

意图的经济学

在金融服务领域，监管更新不断，基于意图的测试使得验证合规性变得可扩展，而无需按比例扩大 QA 团队。Capgemini、Sogeti 和 OpenText 的世界质量报告描述了如何使用 AI 和更智能的自动化来跟上更快的交付周期和日益复杂的系统。

在电子商务领域，界面通过 A/B 实验和个性化不断演变，采用基于意图的方法的公司在三个月内将测试维护时间减少了大约 40%。管理多个部署环境的企业 SaaS 提供商正在使用相同的逻辑来维护所有变体的质量，而无需承担过高的开销。

这些模式表明，我们不是在谈论渐进式的改进，而是一种根本性的转变，这种转变使得 QA 中的某些事情在经济上变得可行。

自治未来的护栏

没有一个范式转变是没有警告的。自主重建和重构的系统仍然需要人类的监督。AI 可以误解领域逻辑，如果没有正确的上下文训练。QA 领导者必须保持严格的验证过程，特别是在监管领域，错误带来真正的风险。

可解释性和可追溯性也变得至关重要。随着 QA变得更加智能，每个测试必须记录它如何演变以及为什么通过或失败。在银行和保险领域，这种可审计性是监管要求。

智能系统擅长处理主要的用户流程，但可能会错过罕见或风险关键的案例。安全漏洞、合规场景和数据完整性边缘案例仍然依赖于人工编写的测试和深入的领域专业知识。文化抵抗仍然存在。深陷于 Selenium 或 Cypress 工作流程的团队不会在一夜之间转变。转变需要投资于培训、变革管理和明确的价值证明。

向自适应 QA 转变

最有效地采用振动测试的公司共享一个共同的模式。它们从小处开始，通常在传统套件旁边试验一个高变化的应用程序区域。它们仔细测量结果，跟踪维护时间和不稳定性率，只有在结果被证明是持久的之后才扩大。它们投资于帮助 QA 工程师从脚本编写者转变为意图模型和质量总监，而不是执行者。它们将自适应 AI 直接集成到 DevOps 流水线中，以便测试在代码更改时调整，而不是崩溃。

更大的教训是哲学和技术的结合。我们所实践的自动化试图通过控制来消除不确定性。振动测试接受变化是常态，并为此而设计。它将测试视为开发结束时的门槛，而不是代码、用户和系统之间的活跃对话。结果是软件在演变的同时保持完整性。

质量保证现在站在十字路口。一个道路通向维护陷阱的深处，脚本越来越多，创新停滞不前。另一个道路通向自适应、基于意图的测试，软件能够理解自己以验证自己的行为。选择将决定哪些组织能够跟上 AI 加速的未来，哪些组织将陷入调试过去的泥潭中。

未来十年的 QA 将不再由自动化程度来衡量，而是由我们对软件的理解程度来衡量。胜利者将是那些能够构建感知产品脉搏、即氛围，并相应地适应的系统的组织。

Tal Barmeir, Co-Founder and CEO of BlinqIO

Tal Barmeir 是 BlinqIO 的联合创始人和CEO，BlinqIO 是第一个为 Playwright 基础的自动化构建的 AI 测试工程师。它自动生成、运行和维护测试，引入 Vibe Testing —— 与其测试的软件同步演进的 AI 驱动验证。

她还联合创立并担任 Experitest 的 CEO，Experitest 是一家被 TPG (NASDAQ: TPG) 收购的 SaaS B2B DevOps 公司。在此之前，Tal 曾在 Accenture (伦敦，NYSE: ACN) 和 Comverse (以色列) 担任过各种领导职位，包括服务部门的市场营销负责人和高科技战略经理等。

Unite.AI