Stave的每个边界都有机器可验证的契约。这些契约最初是为单人开发者设计的,结果恰好满足了AI代理的需求。命令行工具变成了平台——这改变了谁能运行云安全项目。
我最初没想为代理构建云安全平台。目标只是做一个单人能维护的CLI工具。
![]()
后续决策——标准JSON Schema而非专有格式、退出码而非文字输出、确定性评估而非概率评分、小型可组合工具而非单体架构——都是为了人类生产力。一个人维护不了专有schema,调试不了非确定性输出,也维护不了单体系统。
![]()
14个月后,我做了五组独立测试。给代理一个推理规范和Stave的数据导出,没有实现代码,没有文档,没有提示。五个不同推理引擎——Z3(数学证明)、Soufflé(爆炸半径枚举)、Clingo(违规检测)、Prolog(证明树)、PRISM(风险概率)——都输出了正确的安全裁决。
其中两组测试是完全盲测:全新代理,零上下文。两组都通过了。
我从第一天就没瞄准代理支持。是架构自然产生了这个结果。
什么是"以代理为中心"
每个安全厂商都在加AI。副驾驶总结发现、聊天机器人回答安全态势问题、大模型建议修复步骤。这些功能有用,但只是现有架构上的装饰。
"以代理为中心"意味着代理能构建管道——而不只是回答关于管道的问题。区别在于:一个是有AI的工具,一个是代理能基于其开发的工具。
![]()
测试很简单:一个从未见过你源代码的代理,仅凭你发布的契约就能产出正确结果吗?能,就是以代理为中心。需要实现代码、内部文档或人工指导,就是AI功能硬塞到依赖人的架构上。
Stave通过了测试。五次。两次盲测。
让这一切运转的契约
管道每个边界有三个属性:
1. 机器可读规范。不是文档——是JSON Schema或YAML文件,代理能解析、理解并生成符合要求的输出。
2. 二元断言。步骤要么成功要么失败。stave validate --strict退出0或非0。stave apply产出发现或不产出。没有主观质量判断,没有"这看起来对吗?"。代理写代码是概率性的,但它瞄准的契约是确定性的。平台提供严格反馈循环:代理迭代直到命中契约定义的"成功"状态。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.