网易首页 > 网易号 > 正文 申请入驻

Andrej发明"氛围编程"3个月后,19%开发者反而更慢了

0
分享至


2025年初,Andrej Karpathy把一句话丢进技术圈:"vibe coding(氛围编程)"——对着AI打几个字,它出啥你用啥,完事。当时像给所有人发了把枪,觉得 coding 的门槛终于要被踏平了。三个月后数据回来:用AI工具的资深开发者,在真实代码库里的效率反而掉了19%,AI联名的PR(Pull Request,代码合并请求)重大问题多了1.7倍。按键更快了,软件更烂了。

模型一直在进化,但生成质量提升解决不了意图错位,也拦不住后续设计决策的连锁崩塌。这就是autospec要切的问题。

「氛围编程」的甜蜜陷阱

Karpathy的提法戳中了痛点。以前写代码要查文档、搭环境、debug到半夜,现在Claude、GPT、Gemini能直接吐出一整段能跑的逻辑。对新手尤其诱人——不用懂底层,不用理架构,prompt(提示词)写对就能出活。

但"能跑"和"该这么跑"是两件事。你敲下"add user auth(添加用户认证)",模型开始猜:OAuth还是邮箱密码?Session还是JWT(JSON Web Token,一种令牌格式)?中间件放哪?错误返回什么格式?它猜完就写,你写完才发现猜错了。这就是misalignment(意图错位)——模型从没真正拥有你的意图,再聪明也白搭。

更麻烦的是连锁反应。一个错位的地基上,每一层后续决策都在放大偏差。等到测试崩了、安全审计挂了、用户数据泄露了,你回头找根因,发现源头只是当初那个prompt太模糊。

数据不会骗人。19%的效率下滑发生在"资深开发者"身上,恰恰说明问题不是AI不够强,是人机协作的接口设计错了。氛围编程把工程师变成审核员,而审核比亲手写更耗认知——你得先理解AI为什么这样写,才能判断它对不对。

spec驱动:从"猜你想写"到"先对齐再动手"

autospec的解法是把流程倒过来:spec(规格说明书)→ plan(计划)→ tasks(任务)→ implement(实现)。不是直接跳代码,第一步先生成spec.yaml——一个结构化产物,包含需求、验收标准、边界情况、约束条件,全部由你项目的constitution.yaml(项目宪法)塑形。

constitution.yaml是什么?项目的"非 negotiable(可谈判)"规则——质量标准、架构约束、安全要求,带明确的优先级和强制执行机制。autospec会从你的代码库推断初始原则(Makefile目标、CI配置、README),你再手工精修。此后每个命令都在这些约束下运行。


spec.yaml生成后,你可以手工编辑,也可以用autospec clarify开启交互会话,和AI一起精修范围、消除歧义、收紧需求,直到spec真正捕获你的意图。这时候才进入规划和实现,把对齐状态一路传递下去。

一个典型的constitution.yaml长这样:

preamble(序言)里写明项目定位;principles(原则)列表里,每条有ID、优先级(NON-NEGOTIABLE/MUST/SHOULD)、描述、执行机制、例外情况。比如"测试先行"是NON-NEGOTIABLE(不可谈判),CI流水线强制执行,除非显式标记为原型代码。

这不是文档洁癖。优先级标签直接决定AI的决策权重——当两个原则冲突时,NON-NEGOTIABLE压倒一切。你不需要在每次prompt里重复"记得写测试",constitution已经内嵌进工作流。

autospec的运作细节

autospec本身是一个Go写的CLI(命令行工具),编排Claude Code和/或OpenCode agent(智能体)。核心命令就几条:

autospec init——扫描现有代码库,生成初始constitution和目录结构。它会读你的Makefile、CI配置、依赖文件,推断技术栈和既有约定。

autospec spec——从自然语言需求生成spec.yaml。这里的关键是"结构化":不是直接出代码,而是出一份人可读、机器可解析的规格,包含背景、目标、非目标、验收标准、边界情况、依赖项。

autospec clarify——交互式精修spec。AI会针对模糊点提问,你回答后它更新文档,循环直到双方满意。这一步解决的是"你以为你说明白了"的问题。

autospec plan——spec定稿后,拆解成可执行的任务列表,带依赖关系和验收条件。


autospec implement——实际编码阶段,AI agent在constitution约束下逐任务实现,每步可验证。

整个流程的咬合点是:spec作为单一事实源,plan和implement只负责执行,不参与意图解释。意图的解释权完全留在人类这边,通过spec.yaml和constitution.yaml显式固化。

对比:两种工作流的认知负荷

氛围编程的认知模型是"说→看→改"。你说"加用户认证",AI出代码,你发现不对再改prompt,循环。每次迭代都在重新建立上下文,模型对"为什么上次错了"只有隐式记忆,没有显式追踪。

spec驱动的认知模型是"说→澄清→固化→执行"。前期投入更高,但spec一旦定稿,后续阶段是纯粹的执行问题。plan阶段拆任务时,AI不需要再猜"用户要的是哪种认证",它只读spec.yaml里的"采用JWT、无状态、支持刷新令牌"。

这种区分对团队尤其重要。个人开发者可以靠短期记忆维持上下文,但多人协作时,"为什么这样设计"必须外化为文档。spec.yaml就是那份可版本控制、可diff、可review的设计意图。

autospec的开源仓库里有个细节:spec.yaml的schema(模式)被设计为可扩展。你可以为特定领域添加字段——比如机器学习项目加"数据隐私合规检查",金融项目加"审计日志要求"。constitution同理,支持自定义enforcement mechanism(执行机制)。这不是一个封闭的最佳实践清单,而是一个元框架,让团队把自己的约束编码进去。

谁该用,谁还不该用

项目维护者在README里写得很直白:autospec是给"professional(专业开发者)"的。如果你还在学Go的goroutine怎么用,或者第一次搭Web服务,这个工具会增加而非减少摩擦。spec驱动的前提是你知道"好"长什么样,能把质量标准写成可执行的规则。

但对已经踩过坑的团队,autospec解决的是规模化问题。当代码库超过10万行、贡献者超过10人、CI流水线超过5条时,"氛围"就是债务。每个新功能都需要和既有架构对齐,每个PR都需要符合安全基线,这些检查自动化不了,但可以用constitution和spec结构化。

一个值得观察的指标:autospec的issue列表里,关于"AI生成spec质量不够高"的反馈很少,大部分讨论集中在"如何让constitution更好地继承现有代码库的隐式约定"。这说明工具的定位被理解了——它不替你做设计决策,只确保你的决策被忠实执行。

最后留个开放问题:当你的团队开始用AI写代码,你们是把"审核AI产出"当成新工种,还是愿意前期多花30%时间把意图写清楚?两种选择没有绝对对错,但19%的效率数据和1.7倍的问题率已经摆在那了——你选哪边?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
单依纯的舅舅是天龙人!?

单依纯的舅舅是天龙人!?

八卦疯叔
2026-03-31 10:49:19
美航母燃烧30小时成废铁,5700人被扣,福建舰成全球唯一

美航母燃烧30小时成废铁,5700人被扣,福建舰成全球唯一

看尽人间百态
2026-04-03 00:19:29
伊朗下死手!18家美国科技巨头中东设施遭锁定,这波打击太精准

伊朗下死手!18家美国科技巨头中东设施遭锁定,这波打击太精准

Thurman在昆明
2026-04-02 19:56:35
深夜,美股、黄金暴力拉升,油价应声急挫!特朗普白天砸盘后,伊朗放出好消息:和霍尔木兹海峡通航有关

深夜,美股、黄金暴力拉升,油价应声急挫!特朗普白天砸盘后,伊朗放出好消息:和霍尔木兹海峡通航有关

每日经济新闻
2026-04-03 00:11:53
乒坛战报8强出炉!王楚钦最大对手逆转晋级,国乒新星1:4出局

乒坛战报8强出炉!王楚钦最大对手逆转晋级,国乒新星1:4出局

去山野间追风
2026-04-02 20:05:59
56岁大妈心梗离世,医生:吃他汀时除了牛奶,这6种食物尽量少碰

56岁大妈心梗离世,医生:吃他汀时除了牛奶,这6种食物尽量少碰

岐黄传人孙大夫
2026-02-28 22:15:03
日媒反复强调“风险上升企业撤退”,在中国工作的日企员工坦言:感受不到反日情绪

日媒反复强调“风险上升企业撤退”,在中国工作的日企员工坦言:感受不到反日情绪

日本物语
2026-04-02 20:40:56
1982年,老戏骨仲星火,女儿霸占他的住处,他无奈4年搬了8次家

1982年,老戏骨仲星火,女儿霸占他的住处,他无奈4年搬了8次家

磊子讲史
2026-01-20 14:17:51
一个被低估的抗衰老方法:多做抗阻力训练

一个被低估的抗衰老方法:多做抗阻力训练

增肌减脂
2026-04-02 12:33:17
《冬去春来》大结局:冉冉和楚才远离婚,庄庄母亲惨死,胜利赢麻

《冬去春来》大结局:冉冉和楚才远离婚,庄庄母亲惨死,胜利赢麻

手工制作阿歼
2026-04-03 00:36:58
64年毛主席给钱学森递烟,他刚要接时,主席却突然收回:自力更生

64年毛主席给钱学森递烟,他刚要接时,主席却突然收回:自力更生

冰语历史
2026-04-02 14:36:06
娜扎真空上阵上海活动,梳丸子头步步生莲冠压群芳,才懂性感尤物

娜扎真空上阵上海活动,梳丸子头步步生莲冠压群芳,才懂性感尤物

八斗小先生
2026-03-31 10:38:39
6500万英超盘带王愿加盟,曼联是其梦想球队!红魔签新边锋二选一

6500万英超盘带王愿加盟,曼联是其梦想球队!红魔签新边锋二选一

罗米的曼联博客
2026-04-02 11:38:16
中年返贫的三道坎,劝你一个都别碰

中年返贫的三道坎,劝你一个都别碰

言叔财经视角
2026-04-01 22:01:17
绵阳“知名小学”就在旁边孩子却不能入读,教体局:将优化

绵阳“知名小学”就在旁边孩子却不能入读,教体局:将优化

绵学堂
2026-04-02 19:37:20
民主党议员退出政坛,斥责党背离其信仰:我不为疯狂之举背书

民主党议员退出政坛,斥责党背离其信仰:我不为疯狂之举背书

爱下厨的阿酾
2026-04-02 14:23:48
中国脑梗人数全球第一:肉吃得越少,血管就越通,真的吗?

中国脑梗人数全球第一:肉吃得越少,血管就越通,真的吗?

蜉蝣说
2026-03-24 10:00:57
绕过霍尔木兹!海湾国家“不惜下血本”:考虑修建新输油管道

绕过霍尔木兹!海湾国家“不惜下血本”:考虑修建新输油管道

财联社
2026-04-02 14:48:21
以色列总理称伊朗已不构成生存威胁

以色列总理称伊朗已不构成生存威胁

界面新闻
2026-04-01 12:25:32
原来他俩认识!张雪曾给“救火骑士”龙麻子送“战车”当新婚礼物

原来他俩认识!张雪曾给“救火骑士”龙麻子送“战车”当新婚礼物

封面新闻
2026-04-02 13:04:45
2026-04-03 03:39:00
固件更新中
固件更新中
有态度网友ytd
1068文章数 7关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

北京89岁奶奶困屋内从27层翻窗下爬 爬到21层吓坏邻居

头条要闻

北京89岁奶奶困屋内从27层翻窗下爬 爬到21层吓坏邻居

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

《浪姐》人气榜出炉!曾沛慈断层第一

财经要闻

市场被特朗普一句话打醒 滞胀交易回归

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

手机
数码
游戏
艺术
家居

手机要闻

安卓性能榜定出炉:骁龙霸榜旗舰榜单,联发科占据次旗舰榜单!

数码要闻

跨界者大疆:不折腾才是扫地机的终极形态

上线9周年后,《PUBG》新地图把“大逃杀”老本行扔了?

艺术要闻

全球第6高的废弃建筑!泰国“幽灵塔”,鬼都绕着走?

家居要闻

岁月静好 典雅新章

无障碍浏览 进入关怀版