网易首页 > 网易号 > 正文 申请入驻

程序员不许写代码!OpenAI硬核实验:3人指挥AI,5个月造出百万行

0
分享至

来源:市场资讯

(来源:新智元)


新智元报道

编辑:元宇

【新智元导读】在OpenAI一项内部实验中,一个最初仅3人的团队、5个月、从零到一造出「百万行代码产品」,没有一行代码是人类程序员完成的,而不手工写代码,也是该项目的一条铁律。

这一次,人类软件工程被「倒过来」做了!

刚刚,OpenAI官博曝光了他们的一次内部实验:

一支最初3人的工程师团队,利用Codex智能体在5个月内从零造出了一个「百万行代码产品」。

在整个过程中,人类不写手工代码,而是把精力集中在「想清楚要什么、把规则立起来」,其余的一切交给AI。

每人每天平均能推进3.5个PR(Pull Request,代码合并请求),而PR的执行环节(实现、测试、文档、CI配置)全程由智能体代劳。

OpenAI为这套工作流赋予了一个十分形象的名字:「驾驭工程(Harness Engineering)」。


https://openai.com/index/harness-engineering/

在实验里,程序员不再是那个熬夜写Bug,再熬夜修Bug的「码农」,而是原来的「执行者」变为「驾驭者」。

这不止是10倍效率提升的「生产力革命」,而是一次对「软件工程」定义的颠覆,直接宣告了人类「手工代码时代」的终结。

改变

从一个空的git仓库开始

这次实验从AI的第一次提交开始。

2025年8月下旬,当空仓库里落下第一个commit(提交)时,它就已经不是人类写的——当时没有任何既有人类代码可以充当「锚点」。

更魔幻的:连那个用来指导AI怎么干活的说明书AGENTS.md,第一版也是AI自己写的。

从第一天起,这个仓库就是由智能体塑造的。人类不许写代码,成了这个项目的一条不可逾越的铁律。

这不是为了偷懒,而是一种近乎自虐的「刻意练习」,只有切断了人类「亲自上手」的退路,才能倒逼团队去破解那个在完全无人情况下构建代码的终极问题。

于是,这个3人小团队(后扩展到7人),一下子好像成了拿着鞭子的牧羊人,驱赶着一群不知疲倦的Codex智能体在代码草原上狂奔。

结果令人震撼:5个月,一百万行代码。

重新定义工程师的角色

这项实验的早期进展,比OpenAI的研究人员预想得要慢。

不是因为Codex不行,而是因为环境定义得不够清晰:智能体缺少实现高层目标所需的工具、抽象和内部结构。

于是,OpenAI工程团队的主要工作变成了一件事:让智能体有能力完成有价值的工作。

他们把大目标拆成更小的构建块(设计、编码、评审、测试等),提示智能体把这些块搭起来,再用它们去解锁更复杂的任务。

当事情失败时,答案几乎从来不是「再试一次」,这里唯一的推进方式就是让Codex去完成工作,人类工程师通常会退一步问自己:

到底缺了什么能力?怎样把它变得对智能体既清晰可见,又可以被强制执行?

整个过程中,人类几乎完全通过提示词与系统交互:工程师描述任务,运行智能体,让它发起一个PR。

为了推进PR完成,研究人员会让Codex在本地自审改动,请求额外的本地和云端智能体评审,回应人类或智能体的反馈,然后在一个循环里不断迭代,直到所有智能体评审者都满意。

随着时间推移,几乎所有评审工作都移交给了「智能体对智能体」。

提升应用程序的可读性

随着代码吞吐量的增加,OpenAI发现:AI编码的瓶颈变成了人工质量检查(QA)的能力。

于是,人类的时间和注意力成了真正的约束。

为了突破这一瓶颈,OpenAI的办法是让Codex能够直接读取应用程序的用户界面、日志以及应用指标等内容。

他们将Chrome DevTools协议接入了智能体运行时,并开发了处理DOM快照、截图和导航的技能。


于是,Codex可以自己复现bug、验证修复、推理UI行为。

OpenAI对可观测性工具也采取了同样的做法。

日志、指标、追踪通过本地可观测性栈暴露给Codex,并且对每个worktree(工作区)都是隔离、临时的环境。

任务完成后,这套环境就会被销毁。

智能体可以用LogQ查日志,用PromQL查指标。

于是,「确保服务启动在800ms内完成」或者「这四条关键用户路径里没有任何一个span超过两秒」这样的提示,就变得真正可执行。

做了这些之后,OpenAI研究人员经常看到Codex一次运行连续工作六个小时以上,通常还是在人类睡觉的时候。


给Codex一张地图

而不是一本1000页的说明书

让智能体处理大型复杂任务时,上下文管理是最大的挑战之一。

OpenAI研究人员早期学到的一个简单经验就是:

给Codex一张地图,而不是一本1000页的说明书。

一开始,团队试图写一个超大的AGENTS.md文件,把所有规则、逻辑、注意事项都塞进去。结果,这成了一场灾难。

因为AI的注意力也是稀缺资源。

给它一本1000页的说明书,它会迷失在细节里,漏掉关键约束,或者把目标搞错。

而且,这种单体大文档维护起来简直是噩梦,很快就会变成「陈旧规则的坟场」。

于是,团队迅速调整策略,他们把AGENTS.md变成了一张「寻宝地图」。

这个文件只有大约100行,它不包含具体知识,只是一个目录,就像一个导航地图,指向仓库深处更深层的真实来源。

设计文档被编目并索引,包括验证状态以及一套定义「以智能体为先」操作原则的核心信念。

真正的知识库在结构化的docs/目录里,是系统的唯一事实来源。

这就是「渐进式披露」:智能体从一个小而稳定的入口开始,被教会下一步去哪找,而不是一开始就被信息淹没。

OpenAI的研究人员还用工具强制执行这一点。

通过专门的lint和CI任务校验知识库是否最新、是否交叉链接、结构是否正确。

架构文档给出领域划分和包分层的顶层视图。质量文档为每个产品领域和架构层打分,持续追踪差距。

为了保证AI不读到过时的信息,团队甚至专门安排了一个「文档园丁」智能体。

它的工作只有一个:定期扫描文档,发现那些与代码实现不一致的陈旧描述,然后自动发起修复PR。

让智能体「看得懂」

既然仓库完全由智能体生成,OpenAI研究人员的一个目标,就是让智能体只靠仓库本身,就能理解完整业务领域。

从智能体视角看,任何它在运行时上下文中访问不到的知识,都等于不存在。

比如放在Google Docs、聊天记录、人类大脑的知识,对系统来说都是不可见的。

它能看到的只有仓库里版本化的工件,如代码、Markdown、schema、可执行计划。

如果智能体找不到这些上下文知识,它们就会和刚入职的新同事一样,对于实际业务进展一无所知。


因此,必须把越来越多的上下文推回仓库。

当然,给Codex更多上下文,并不是要塞给它更多零散指令,而是把信息组织好、结构化,让它可以推理。

自动化围栏

让程序员成为代码世界的「牧羊人」

光有文档,还不足以让一个完全由智能体生成的代码库保持一致。

AI毕竟是概率模型,它会产生幻觉,会偷懒,会写出「看似能跑实则一团糟」的代码。

怎么解决?

智能体在边界清晰、结构可预测的环境中效率最高。

OpenAI通过强制执行「不变量」,而不是微观管理实现细节,让智能体可以高速前进而不破坏基础。

这就好比为Codex这样日行千里的AI烈马,套上了缰绳和马鞍。

OpenAI围绕一个严格的架构模型构建系统。每个业务领域都有固定层级,并且依赖方向被严格验证,只允许有限的合法边界。

规则很简单:在每个业务领域内(如App Settings),代码只能沿着固定层级「向前」依赖:

Types→Config→Repo→Service→Runtime→UI

横切关注点(认证、连接器、遥测、功能开关等)只能通过一个显式接口:Providers。

其他依赖一律禁止,并通过自定义lint(也是Codex生成)和结构测试强制执行。


这种架构通常是公司规模到几百人时才会认真设计的。但在有编码智能体的情况下,这是前提条件。

此外,OpenAI的研究人员还定义了一组「品味不变量」,如:

在这个过程中,必须明确区分的是哪些地方必须严格,哪些地方可以放权。

这好比管理一个大型工程平台:边界集中管控,内部高度自治。

AI生成的代码未必符合人类审美,但只要正确、可维护、对智能体可读,就OK。

在这个过程中,人类的品味不会消失,而是被持续「编码」进系统。

评审意见、重构PR、用户bug都会转化为文档更新,或直接升格为工具规则。

当文档不够用时,就需要把规则写进代码。

扔掉键盘

勇敢去驾驭AI

OpenAI的这项实验宣告了:大量以CRUD为主的岗位,正在被重塑。

如果一个从零开始的系统,可以在5个月内,由3个人(不写一行代码)构建出百万行规模,传统软件公司里那些庞大的开发团队,还有存在的必要吗?

在这个即将到来的新时代,工程师的定义将被彻底改写。

你需要的是强大的「架构能力」,能够定义系统的边界,设计模块之间的约束,构建那个让AI不跑偏的「围栏」。

同时,你还需要精准的「表达能力」,学会用最清晰的语言(无论是自然语言还是结构化文档)向AI描述你的意图。

拒绝AI编程,坚持手搓代码的人终将被浪潮吞没,只有那些懂得驾驭AI的程序员,才有可能成为AI时代的赢家。

参考资料:

https://openai.com/index/harness-engineering/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
43岁香港过气艳星官宣生子!嫁山东农村小伙,提前俩月回香港生娃

43岁香港过气艳星官宣生子!嫁山东农村小伙,提前俩月回香港生娃

嫹笔牂牂
2026-01-30 07:31:14
李子柒回应账号断更:看到大家对非遗越来越重视,我有更多的时间继续去做一些想做的事,这两年更重要的是多陪奶奶

李子柒回应账号断更:看到大家对非遗越来越重视,我有更多的时间继续去做一些想做的事,这两年更重要的是多陪奶奶

潇湘晨报
2026-02-15 21:20:19
父亲给两个儿子取了同一个名字:博古之子秦刚传奇人生与时代印记

父亲给两个儿子取了同一个名字:博古之子秦刚传奇人生与时代印记

老籣说体育
2026-02-07 11:23:49
我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

我国崩塌最彻底的专业,从年薪20万到找不到工作,毕业即失业!

黯泉
2026-02-10 22:00:47
湘潭钢铁爆炸大火持续12小时:画面流出,伤亡情况披露,原因曝光

湘潭钢铁爆炸大火持续12小时:画面流出,伤亡情况披露,原因曝光

博士观察
2026-02-15 11:07:28
纳瓦尔尼死因正式确认:罕见箭毒蛙毒素致命,多国专家联合验证

纳瓦尔尼死因正式确认:罕见箭毒蛙毒素致命,多国专家联合验证

老马拉车莫少装
2026-02-15 00:01:07
海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

我心纵横天地间
2026-02-15 20:09:08
刘嘉玲曝为参加马年春晚,王菲推掉了很多活动,原因让人笑翻

刘嘉玲曝为参加马年春晚,王菲推掉了很多活动,原因让人笑翻

娱最资讯
2026-02-15 17:54:03
台湾政坛爆出大消息!傅崐萁直接对外宣布:蓝白合作彻底破局!

台湾政坛爆出大消息!傅崐萁直接对外宣布:蓝白合作彻底破局!

达文西看世界
2026-02-15 19:28:30
卧槽!第四巨头,哈登,要爽了

卧槽!第四巨头,哈登,要爽了

体育新角度
2026-02-15 18:51:44
大年初一开门,千万别早于这个点!老辈人:开对时辰,家宅旺一年

大年初一开门,千万别早于这个点!老辈人:开对时辰,家宅旺一年

小陆搞笑日常
2026-02-16 00:25:08
拾荒老人被踹后续:知情人曝光:“飞车党”作恶 ,结局大快人心

拾荒老人被踹后续:知情人曝光:“飞车党”作恶 ,结局大快人心

社会日日鲜
2026-02-15 08:13:12
网红幼虎去世后被“替身”直播,死亡7天后饲养员称“正晒太阳”;区政府成立调查组,信息上报、跨园转运真相成谜

网红幼虎去世后被“替身”直播,死亡7天后饲养员称“正晒太阳”;区政府成立调查组,信息上报、跨园转运真相成谜

大风新闻
2026-02-15 18:00:11
全球另一个“中国”:不仅说汉语花人民币,而且连教材都如出一辙

全球另一个“中国”:不仅说汉语花人民币,而且连教材都如出一辙

瓜哥的动物日记
2026-02-15 20:14:28
特斯拉新春福利翻车!网友集体喊话陶琳:别送周边,我要EAP/FSD

特斯拉新春福利翻车!网友集体喊话陶琳:别送周边,我要EAP/FSD

雷科技
2026-02-15 13:50:13
不查不知道一查吓一跳,69岁"反派专业户"程煜,私下玩得这么壕

不查不知道一查吓一跳,69岁"反派专业户"程煜,私下玩得这么壕

冷紫葉
2026-01-26 00:35:15
没有硝烟却同样热血!立陶宛民众用双手撑起乌克兰士兵的战场希望

没有硝烟却同样热血!立陶宛民众用双手撑起乌克兰士兵的战场希望

老马拉车莫少装
2026-02-09 16:48:44
一位班主任的大实话:长大有本事的孩子,大多都出生在这些家庭

一位班主任的大实话:长大有本事的孩子,大多都出生在这些家庭

青苹果sht
2026-02-09 06:15:29
清华全球第三,北大全球第七,国内11所高校跻身全球前100

清华全球第三,北大全球第七,国内11所高校跻身全球前100

史海流年号
2026-02-13 11:13:26
确认是假货!涉及多个大牌,网友:天塌了,我说怎么那么便宜?

确认是假货!涉及多个大牌,网友:天塌了,我说怎么那么便宜?

浙江之声
2026-02-13 13:11:59
2026-02-16 08:27:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2222797文章数 5484关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

慕安会上美国角色历史性逆转 中国议题“打满全场”

头条要闻

慕安会上美国角色历史性逆转 中国议题“打满全场”

体育要闻

NBA三分大赛:利拉德带伤第三次夺冠

娱乐要闻

2026央视春晚最新剧透 重量级嘉宾登场

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

房产
时尚
本地
手机
教育

房产要闻

三亚新机场,又传出新消息!

多巴胺失宠了?过年这样穿彩色时髦又减龄

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

古尔曼:苹果iOS 27将整理系统代码,微调界面设计

教育要闻

重点中学校长提案取消高考,网友意见一致:请务必严查他

无障碍浏览 进入关怀版