![]()
2024年,全球软件团队花在修复"假阳性测试失败"上的时间,足够让SpaceX再发射12次星舰。这不是玩笑——当你的按钮从左边移到右边,代码没变,功能没变,但自动化测试红了,整个CI/CD管道就得停下来等人修。
测试维护正在吃掉软件交付的速度。
传统QA自动化像是一份用摩斯电码写成的说明书:开发者必须精确指定"点击第3个div下的第2个span,它的class叫btn-primary"。产品经理用自然语言写需求,开发用代码实现,然后另一批人再用另一种代码把需求翻译成测试。三层翻译,三层失真,三层维护债务。
亚马逊云科技(AWS)的解法是把这层翻译彻底砍掉。2025年4月发布的Amazon Nova Act,核心就一句话:让AI像真人一样看屏幕、点鼠标,而不是像爬虫一样读代码。
从"找元素"到"看懂页面"
Nova Act的底层是一个计算机使用模型(Computer Use Model),它处理的是视觉输入和自然语言指令,而非DOM树或CSS选择器。你告诉它"点击登录按钮",它自己去找那个写着"登录"的矩形——无论这个按钮昨天是在导航栏还是今天被塞进了抽屉菜单。
这听起来简单,但技术路径完全换了赛道。传统自动化框架(如Selenium、Cypress)依赖的是实现细节(implementation details):元素ID、XPath、CSS选择器。这些是开发者的脚手架,不是用户的认知模型。当UI重构时,脚手架拆了,测试就塌了。
Nova Act的解耦在于:测试定义与UI实现解耦。测试用自然语言写,执行时由模型实时理解页面状态。UI变了,模型重新理解;功能没变,测试继续绿。
AWS为此配套推出了QA Studio——一个基于Nova Act的参考实现(reference solution)。它不是让你从零造轮子,而是给了一套可直接部署的Serverless架构:Web前端、API、CLI,全托管在AWS上,测试执行由Amazon Bedrock AgentCore Browser驱动。
QA Studio的完整工作流
![]()
实际用起来,流程分成四步:
第一步,用自然语言描述测试。比如:"打开官网,点击右上角登录,输入测试账号,验证进入个人中心后显示用户名。"不需要写代码,不需要录屏,不需要指定任何元素定位器。
第二步,QA Studio调用Amazon Bedrock,把你的描述转成结构化的测试步骤。这里用到了大语言模型的规划能力——它自己拆解动作序列:导航→等待页面加载→识别登录入口→输入凭证→验证断言。
第三步,Nova Act执行。它启动一个无头浏览器,逐帧理解页面视觉状态,执行点击、输入、滚动等操作。每一步都有截图和 reasoning trace,失败时你能看到AI"看到了什么"以及"为什么卡住了"。
第四步,结果回流。测试报告、执行日志、性能指标全部进Amazon S3,可对接CI/CD管道。AWS Secrets Manager处理敏感数据,测试账号密码不会硬编码在任何地方。
关键设计:测试即需求文档。产品经理写的用户故事(User Story),可以直接变成可执行的测试用例。需求变了,改一句话;测试自动同步,无需开发者介入。
Serverless架构的取舍
QA Studio的架构图很"AWS":前端用Amplify,API用API Gateway + Lambda,状态存DynamoDB,执行环境是ECS Fargate跑Bedrock AgentCore Browser。全托管,按调用付费,没有闲置成本。
但这里有个隐性成本:Nova Act的调用按token和步骤收费。简单表单测试可能几分钱,复杂多页流程可能几美元。对于高频回归测试(比如每次代码提交都跑全量),账单需要仔细建模。
AWS的推荐策略是分层:单元测试和API测试继续用传统框架,又快又便宜;UI端到端测试——尤其是那些容易因UI变动而碎掉的——迁移到Nova Act。不是全量替换,而是风险对冲。
![]()
另一个限制:Nova Act目前针对的是Web UI,移动端原生App的支持还在roadmap上。如果你的产品矩阵覆盖iOS/Android原生,现在还得维持Appium或XCUITest的存量。
谁该现在入场
三类团队值得优先评估:
第一,UI迭代频繁的消费级产品。电商、SaaS工具、内容平台,每周都在A/B测试、调整布局,传统测试维护成本爆炸的。
第二,QA与开发资源严重失衡的组织。产品经理或业务分析师想直接写测试,但不想学Python/Selenium的。
第三,已有AWS基础设施的团队。QA Studio是CloudFormation/Terraform一键部署,跨云迁移的摩擦成本不低。
反过来说,如果你的测试套件已经很稳定、UI变动极少、团队有专职SDET(软件开发工程师测试),迁移的ROI可能不够明显。新技术有学习曲线,也有供应商锁定风险。
AWS自己也在吃这碗饭。内部团队用Nova Act重构了部分关键业务的回归测试,维护工时下降了约80%——这个数字来自AWS官方博客,但具体样本量和业务场景未披露,建议作为方向性参考而非承诺。
更务实的验证方式:QA Studio是开源参考实现,GitHub上有完整代码。花一个下午部署到测试环境,用自己的产品跑一轮真实用例,比任何benchmark都准。
软件交付的速度,最终由反馈循环的长度决定。从代码提交到"确认没坏"的时间越短,团队才敢越频繁地发布。Nova Act赌的是:把测试维护从"开发者的苦役"变成"自然语言的对话",能把这个循环再压缩一个数量级。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.