网易首页 > 网易号 > 正文 申请入驻

Karpathy 2025年埋下的1个暗线

0
分享至

2025年初,Andrej Karpathy 用"vibe coding"这个词给开发者画了一张饼:你动嘴,AI动手。但半年过去,大多数人发现这张饼硌牙——AI确实能写代码,但让它独立完成一个功能?它会在第17步忘记第3步要干嘛

Ralph Loop 就是冲着这个痛点来的。它不是新模型,也不是新IDE,而是一套"套索"机制:把AI代理从"对话模式"强行拽进"任务模式"。

从" vibe "到" loop ":为什么你的AI代理总在最后一步翻车

vibe coding 的核心假设是:人类负责意图,AI负责实现。但实践中,AI代理的上下文窗口像漏勺——代码写到200行,它开始重复造轮子;测试失败3次,它陷入死循环改同一个bug。

Karpathy 自己提过这个困境:AI能生成代码片段,但缺乏"工程纪律"。Ralph Loop 的解法很粗暴:把一个大任务切成固定长度的循环,每轮循环必须产出可验证的工件

具体怎么切?想象你让AI做一个登录功能。传统流程是:写代码→写测试→跑测试→改bug→再跑……直到崩溃。Ralph Loop 强制规定:每轮最多生成50行代码,必须附带单元测试,测试通过才能进下一轮。没过?回滚,重来。

3个设计细节,把"概率生成"变成"确定性交付"

第一,状态冻结。每轮循环结束时,当前代码库状态被锁定为"检查点"。AI代理不能随意覆盖,必须显式申请修改权限。这防止了那种"越修越烂"的螺旋下坠。

第二,测试即契约。不是跑完测试就完事,而是把测试用例提前写给AI看。代理在写代码之前,先复述一遍"我要满足这些条件"。这招降低了幻觉率——它至少知道自己该证明什么。

第三,人工闸门。Ralph Loop 不追求全自动。关键检查点必须等人点确认,但人可以批量预审:把接下来5轮的测试用例一次性看完,没问题就放行。这种"半自动"反而比全自动更快,因为减少了返工。

谁在用,以及为什么现在才火

这套机制最早出现在2024年底的实验性项目里,但真正跑通是在2025年Q1——刚好赶上 vibe coding 的概念爆发。目前采用者主要是中小团队的"一人全栈"场景:产品经理兼工程师,晚上丢需求给AI,早上收PR。

有个细节很有意思:Ralph Loop 对提示词工程的要求反而更低了。因为循环结构本身在约束行为,你不需要写"请记得检查边界条件"这种废话。框架替你做了纪律。

当然,它也有硬边界。涉及多服务架构、需要人工审核的合规代码、或者强依赖领域知识的业务逻辑——这些场景下,Ralph Loop 的循环会频繁触发人工闸门,效率优势被稀释。

但如果你经常让AI写那种"独立模块、测试明确、边界清晰"的功能,这套机制能把成功率从"碰运气"拉到"可预期"。

现在的问题是:当AI代理的上下文窗口从128K飙到1M,甚至能记住整个代码库的历史,Ralph Loop 这种"强制分段"的设计会不会变成累赘?还是说,工程纪律永远比内存容量更重要?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
49岁翁帆高调露面!换造型惊艳全场,一句话让英国定居传闻破灭

49岁翁帆高调露面!换造型惊艳全场,一句话让英国定居传闻破灭

一盅情怀
2026-03-16 16:58:07
不登岛不轰炸!美国深夜一招绝杀:伊朗一天损失2亿,彻底扛不住

不登岛不轰炸!美国深夜一招绝杀:伊朗一天损失2亿,彻底扛不住

乐天闲聊
2026-04-14 00:23:20
广西4名学生溺亡,发生了什么?

广西4名学生溺亡,发生了什么?

中国新闻周刊
2026-04-13 18:56:28
下令全面封锁伊朗后,特朗普转身喊话中国,就怕中国“忍无可忍”

下令全面封锁伊朗后,特朗普转身喊话中国,就怕中国“忍无可忍”

阿凫爱吐槽
2026-04-14 01:13:40
兵分四路打响总攻!世界第二大军事集团归来,美媒:以色列犯大错

兵分四路打响总攻!世界第二大军事集团归来,美媒:以色列犯大错

百科密码
2026-04-13 17:23:37
马航回应男乘客“拍打空姐被带离机舱”:正全面调查此事

马航回应男乘客“拍打空姐被带离机舱”:正全面调查此事

南方都市报
2026-04-13 15:40:23
多家寺庙陆续宣布关门,并非维修也非装修,知情人透露真实原因!

多家寺庙陆续宣布关门,并非维修也非装修,知情人透露真实原因!

娱乐洞察点点
2026-04-13 12:16:41
大摩:美股处于调整最后阶段 投资者应准备好增加风险敞口

大摩:美股处于调整最后阶段 投资者应准备好增加风险敞口

财联社
2026-04-13 22:03:06
芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

小徐讲八卦
2026-04-12 06:23:01
美国《洛杉矶时报》:电池霸权!四川宜宾逼停欧洲电池巨头

美国《洛杉矶时报》:电池霸权!四川宜宾逼停欧洲电池巨头

华庭讲美食
2026-04-13 03:11:54
23秒守住638场全勤!职业生涯没缺席过!你是真牛!

23秒守住638场全勤!职业生涯没缺席过!你是真牛!

柚子说球
2026-04-13 17:56:33
前国脚王永珀现状:在美国踢野球,开豪车住豪宅,两个女儿很可爱

前国脚王永珀现状:在美国踢野球,开豪车住豪宅,两个女儿很可爱

秋姐居
2026-04-13 19:51:03
补齐中国空军短板!国产运-30首飞,外媒:或打破美国60年垄断

补齐中国空军短板!国产运-30首飞,外媒:或打破美国60年垄断

大卫聊科技
2026-04-13 13:13:24
崩盘!切尔西 8000 万巨星彻底拉跨,球迷怒斥:一文不值,赶紧卖

崩盘!切尔西 8000 万巨星彻底拉跨,球迷怒斥:一文不值,赶紧卖

澜归序
2026-04-13 05:51:02
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
西班牙首相桑切斯在清华大学演讲:西方用旧地图怎能看清新世界,中国注定要在世界扮演关键角色

西班牙首相桑切斯在清华大学演讲:西方用旧地图怎能看清新世界,中国注定要在世界扮演关键角色

都市快报橙柿互动
2026-04-13 19:28:23
伊朗军方:若伊朗港口受威胁 波斯湾任何港口都不安全

伊朗军方:若伊朗港口受威胁 波斯湾任何港口都不安全

财联社
2026-04-13 15:20:49
刚刚,马扎尔确认匈牙利不会阻止欧盟向乌克兰发放900亿欧元贷款

刚刚,马扎尔确认匈牙利不会阻止欧盟向乌克兰发放900亿欧元贷款

山河路口
2026-04-13 23:56:05
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
美官员称美伊双方在伊斯兰堡会谈后继续保持接触

美官员称美伊双方在伊斯兰堡会谈后继续保持接触

财联社
2026-04-14 01:54:06
2026-04-14 02:16:49
像素与芯片
像素与芯片
有态度网友ytd
1649文章数 9关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

时尚
艺术
家居
公开课
军事航空

今年春夏一定要拥有的4条裙子,这样穿减龄又好看!

艺术要闻

你绝对想不到!这位美女画家的夏天竟如此梦幻!

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版