测试是程序员最熟悉的拖延项。功能写完了,文档补完了,最后盯着测试文件夹发呆——"明天再写吧。"明天变成下周,下周变成下个月,直到CI凌晨两点报错,你对着红色叉号毫无头绪。
一位开发者决定终结这个循环。他做了Scriptless.ai,核心承诺很简单:把GitHub仓库丢进去,Gemma 4自动生成测试用例,云端浏览器直接跑,失败时AI还能看图诊断问题。全程不用写一行测试代码。
![]()
这不是概念演示,是完整产品。Next.js前端、Neon Postgres数据库、Clerk身份验证、Stripe支付接口、Vercel部署,该有的都有。用户按生成和执行次数扣积分,订阅体系已经搭好。
具体怎么用?OAuth连上GitHub,选仓库,点生成。Gemma 4会读取你的文件结构和源代码,输出针对真实路由的测试用例——UI测试、认证流程、表单验证、API接口、边界情况、集成测试,不是填Lorem Ipsum的占位符,是知道你有哪些文件、走哪些路由的真测试。
每个用例转成Playwright脚本,在Browserbase的云端Chrome实例里跑。真浏览器、真网络、真DOM。失败时Gemma 4的vision能力上场:截图当前页面,告诉你它看到了什么、哪里可能出错、怎么修。不用翻日志猜谜。
还能语音控制。对着麦克风说"跑失败的测试"或"只显示通过的",界面直接响应。Speechmatics做的语音识别,QA可以解放双手。
技术栈选型很务实。Gemma 4用的是google/gemma-4-31B-it,31B稠密指令微调版,通过Featherless AI的OpenAI兼容API调用。两个核心场景:生成测试用例时走文本+工具调用,分析失败截图时走视觉理解。
生成测试的prompt设计值得细看。系统指令明确约束输出格式,工具调用定义了submit_test_cases函数,Gemma 4返回的结构化数据直接入库。不是生成一段文字让人复制粘贴,是机器可读、立即执行的测试定义。
这个项目参加的是Gemma 4 Challenge。作者公开了代码仓库,关键文件包括Featherless客户端封装、测试生成服务、Playwright执行器、视觉分析模块。想研究实现细节可以直接翻源码。
现场演示的流程很顺:Clerk登录→授权GitHub→连接仓库→点击生成→看Gemma 4工作→运行测试→如有失败查看视觉分析。建议先用自己拥有的公开Next.js或React仓库试,能清楚看到模型如何根据你的文件树结构组织测试。
背后想解决的问题很实在:测试不该是功能完成后的疲惫收尾,而该是一开始就有的基础设施。当AI能读懂代码、生成用例、执行验证、诊断失败,这个流程才可能真正跑起来。
目前产品已经上线,地址在scriptless-ai.vercel.app。收费模式是按量计费,生成和执行都扣积分,订阅计划的基础设施已就绪。从代码完整度看,这不是 hackathon 级别的Demo,是准备接受真实用户检验的产品。
对做开发者工具的团队来说,这个组合有参考价值:开源模型+兼容API降低调用成本,视觉能力解决测试诊断的痛点,语音交互探索新的操作范式。核心壁垒不在技术栈,在对测试工作流的重新设计——让AI承担从理解代码到解释失败的全链条,人只负责最后的修复决策。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.