网易首页 > 网易号 > 正文 申请入驻

他用6个AI互相检查,45分钟搭完地震地图

0
分享至


去年这时候,我还在"写代码→测试→骂AI→重写"的死循环里打转。直到发现一组数据:让AI自己检查AI,关键缺陷拦截率能提到传统流程的3倍以上。

这不是理论。日本工程师Takahashi用这套方法,45分钟搭完一个功能完整的地震地图站点,其中只有10分钟需要人工介入。剩下的时间,6个AI代理在互相掐架——不是内耗,是质检。

AI写代码的陷阱:一个人干所有活

传统AI编程的问题很隐蔽。你让ChatGPT写功能,测出bug再扔回去修,修完再测——表面是人机协作,实际是AI在单打独斗。

Takahashi在实践里发现,这和人类团队的老毛病一模一样。一个人包干设计、编码、测试,质量必然塌方。AI不会累,但会幻觉,会固执地重复同一种错误。

他的解法很直接:把软件生命周期拆成6个独立阶段,每个阶段配一个专职AI代理。需求代理写规格,设计代理出方案,编码代理动手,然后三个检查代理轮番上阵——静态分析、测试生成、最终验收。

关键设计在这里:阶段之间设硬闸门。检查代理用IEEE 1028标准的正式审查流程,带检查清单、严重等级、通过/失败标准。Critical或High级别问题没清零,下一阶段门都不让进。

这不是"看看代码行不行",这是工厂流水线的来料检验。

规格是地基,但人类那套AI用不了

SDD(规格驱动开发)的核心是"规格先行"。但Takahashi踩的第一个坑,是直接把人类用了几十年的IEEE 830模板塞给AI。


这套标准给人类读的,章节结构太重,粒度飘忽。喂给AI等于开幻觉工厂——同一句话,每次解析结果都不一样。

他重新设计了ANMS(AI原生最小规格模板)。结构上偷师Clean Architecture的稳定依赖原则:上层(目的、需求)尽量不动,下层(设计、测试)随便改。AI读得懂,改起来不炸。

但规格本身也有写法讲究。Takahashi举了个典型翻车案例:

需求写"按地震大小改标记颜色"。AI懵了:什么叫"大小"?震级还是烈度?阈值多少?颜色具体哪个色值?每次生成都随机发挥。

换EARS(简易需求语法)重写:

「FR-05: 系统应以震级决定标记颜色:3.0以下绿色,3.0-5.0黄色,5.0-7.0橙色,7.0及以上红色。」

主语、动词、条件、阈值全锁死。AI没有自由发挥空间,输出稳定性从抽奖变成 clockwork。

45分钟实战:10分钟人工,35分钟AI互掐

Takahashi开源了实现这套流程的框架gr-sw-maker。他用地震地图项目做了计时演示:

0-5分钟:人类用ANMS模板写核心需求。不是写文档,是填结构化字段——AI能直接解析的格式。


5-15分钟:需求代理扩写完整规格,设计代理同步产出技术方案。人类只审不操刀。

15-35分钟:编码代理动手,静态分析代理实时扫描。发现一处潜在空指针,当场打回重修。

35-45分钟:测试代理生成用例,验收代理做最终检查。绿灯全亮,自动部署。

全程人类干预两次:确认需求字段,批准最终设计。其余时间在看AI互相挑刺。

这套流程的隐藏成本是前期规格时间。Takahashi承认,头几次用ANMS,写需求比直接让AI coding慢得多。但第三次之后,返工率断崖下跌,总耗时开始碾压传统模式。

当AI开始管AI,人的角色怎么摆

A-SDLC(代理式软件生命周期)有个反直觉的设定:人类从执行者变成法官。不写代码,不写测试,只写规格和拍板。

Takahashi把这比作飞机驾驶舱。AI是自动驾驶系统,处理90%的常规操作。人类盯着仪表盘,在异常情况下接管。区别是,这里的"异常"不是引擎起火,是规格模糊导致的AI集体跑偏。

他的经验是,AI代理越专业,人对规格的要求越高。因为AI执行太忠实,规格里的漏洞会被放大而不是掩盖。

gr-sw-maker目前在GitHub开源,Star数刚过千。Takahashi在文档里埋了个细节:框架默认的检查清单,是他从自己过去一年AI编程翻车记录里一条条抠出来的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
前国脚王永珀现状:在美国踢野球,开豪车住豪宅,两个女儿很可爱

前国脚王永珀现状:在美国踢野球,开豪车住豪宅,两个女儿很可爱

秋姐居
2026-04-13 19:51:03
中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

中国跳水队公布世界杯总决赛名单:陈芋汐、陈艺文在列

懂球帝
2026-04-13 22:48:15
黄健翔回应争议:我主要是解读技战术,什么时候该说话有规矩

黄健翔回应争议:我主要是解读技战术,什么时候该说话有规矩

懂球帝
2026-04-13 15:04:20
曝《寂静岭》等大作将被国内禁售!全平台下架封禁

曝《寂静岭》等大作将被国内禁售!全平台下架封禁

游民星空
2026-04-13 11:12:18
道指跳水400点 美军封锁伊朗 全境海岸线

道指跳水400点 美军封锁伊朗 全境海岸线

每日经济新闻
2026-04-13 21:52:41
李少芬入选中国篮球名人堂,丈夫钟南山为她穿上名人西装

李少芬入选中国篮球名人堂,丈夫钟南山为她穿上名人西装

大象新闻
2026-04-13 13:01:11
在欧尔班惨败,马扎尔获胜后,俄罗斯称匈牙利为“不友好国家”

在欧尔班惨败,马扎尔获胜后,俄罗斯称匈牙利为“不友好国家”

山河路口
2026-04-13 23:57:05
64岁陈庭威:没老婆没孩子,定居广东住豪宅,不服老打球很精彩

64岁陈庭威:没老婆没孩子,定居广东住豪宅,不服老打球很精彩

白面书誏
2026-04-13 19:08:56
特朗普:伊朗致电美方说希望达成协议

特朗普:伊朗致电美方说希望达成协议

财联社
2026-04-14 01:08:23
梦龙广告被部分网友吐槽“不适”,冲上热搜

梦龙广告被部分网友吐槽“不适”,冲上热搜

南方都市报
2026-04-13 23:28:05
8.03亿欧!若热刺降级将打破英超降级球队最高德转身价纪录

8.03亿欧!若热刺降级将打破英超降级球队最高德转身价纪录

懂球帝
2026-04-13 19:39:06
美军封锁线已生效

美军封锁线已生效

界面新闻
2026-04-13 22:38:05
CBA最新排名乱了:三甲易主,辽宁创纪录,无缘季后赛第2队诞生!

CBA最新排名乱了:三甲易主,辽宁创纪录,无缘季后赛第2队诞生!

大秦壁虎白话体育
2026-04-13 23:19:45
金孙落地,这对父子的关系也缓和了

金孙落地,这对父子的关系也缓和了

BenSir本色说
2026-04-13 22:05:07
新iPhone 最新曝光,首次采用新设计

新iPhone 最新曝光,首次采用新设计

科技堡垒
2026-04-13 11:39:06
宝马炮轰比亚迪背后真相:如果闪充不伤电池,就不需要固态电池了

宝马炮轰比亚迪背后真相:如果闪充不伤电池,就不需要固态电池了

王新喜
2026-04-13 10:45:56
科大讯飞员工中1500万彩票火速离职,网友:羡慕了

科大讯飞员工中1500万彩票火速离职,网友:羡慕了

鞭牛士
2026-04-13 09:48:14
小米汽车市场危机,开始公开化

小米汽车市场危机,开始公开化

浙江车网
2026-04-13 09:15:19
上海地铁9号线上,男子携带拉杆箱咋有“血”渗出来? 地铁回应:装有冷冻食品鸭血,时间长融化了

上海地铁9号线上,男子携带拉杆箱咋有“血”渗出来? 地铁回应:装有冷冻食品鸭血,时间长融化了

大风新闻
2026-04-13 19:00:06
暴跌!价格几乎腰斩!一女子连吃两天,剧烈腹痛胃底被堵死!很多人爱吃

暴跌!价格几乎腰斩!一女子连吃两天,剧烈腹痛胃底被堵死!很多人爱吃

南方都市报
2026-04-13 16:44:33
2026-04-14 07:24:49
报错免疫体
报错免疫体
一名在需求评审和数据异常中反复横跳的产品运营。
1305文章数 13关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

家居
亲子
艺术
公开课
军事航空

家居要闻

复古风格 自然简约

亲子要闻

孕妇买200元水果被丈夫骂后续:已去医院终止妊娠,坦言及时止损

艺术要闻

华嵒画竹,俊逸脱俗

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版