网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GPT-5.2连肝7天，300万行代码造出Chrome级浏览器

2026-01-15 13:18:03　来源: 新智元

北京举报

0

分享至

　　新智元报道

　　编辑：定慧艾伦

　　【新智元导读】一个大模型持续写代码，能写多久？一小时？一天？还是像大部分AI编程工具那样，完成一个任务就结束对话？Cursor的CEO MichaelTruell决定搞一次极限压力测试！

　　Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。

　　不是一小时，不是一天，而是不眠不休，昼夜不停，168小时持续写代码。

　　结果？

　　300万行代码。数千个文件。

　　AI完全从零构建出一个全新浏览器。

　　而且，还是Chrome那种浏览器。

　　HTML解析、CSS布局、文本渲染、还有一个自研的JavaScript虚拟机——全是AI自己写的。

　　Michael Truell轻描淡写地发了条推文：它基本能跑！简单的网页能快速且正确地渲染出来。

　　一个模型究竟能跑多久

　　传统的AI编程工具，比如Github Copilot和早期的其他IDE，都是一问一答模式。

　　对话长度有限，上下文有限，任务复杂度有限。

　　后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务，读取文件、运行命令、修复错误。

　　这已经是很大的进步，但大多数情况下，任务仍然以分钟计算，最多几小时。

　　AI完成一个功能，人类review，然后继续下一个任务。

　　但没有人尝试过让一个模型连续跑一周。

　　直到GPT-5.2。

　　Cursor团队让GPT-5.2持续运行了整整一周，不是断断续续，而是连续工作。

　　在这一周里，它：

　　写下了超过300万行代码

　　创建了数千个文件

　　执行了数万亿个token

　　从零构建了一个完整的浏览器渲染引擎

　　一个模型究竟能运行多久？

　　答案是：理论上，可以无限。

　　只要基础设施稳定，只要任务足够明确，AI就能持续工作——不眠不休，不吃不喝，7×24小时全年无休。

　　就像澳洲的放羊大叔的「赛博黑工」。

　　但实际上，不同模型的「耐力」差异巨大。

　　上下文窗口是第一道门槛。

　　早期的GPT-3.5只有4K token上下文，意味着对话稍长就会失忆。

　　Claude 3推出了200K上下文，GPT-4 Turbo跟进128K，Gemini 1.5 Pro更是号称支持100万token。

　　但上下文长度只是理论值——真正考验的是模型在长任务中能否保持一致性、专注度和执行力。

　　Cursor团队在实验中发现了关键差异。

　　在Cursor这篇官方博客中，团队在实验中发现了关键差异：

　　GPT-5.2能长时间自主工作，遵循指令精准，保持专注不偏离；

　　Claude Opus 4.5倾向尽早结束，走捷径，频繁把控制权交还给用户；

　　GPT-5.1-Codex虽专为编码训练，但规划能力不如GPT-5.2，所以容易中断。

　　用更直白的话说：Opus像个急躁的实习生，干一会就想问「这样行不行？我先交了哈」；

　　而GPT-5.2像个老练的高级工程师，交代清楚任务就埋头干到底。

　　这也是为什么Cursor官方宣称：GPT-5.2是处理长期运行任务的前沿模型。

　　不止浏览器。

　　Cursor还透露了其他正在运行的实验项目：JavaLSP、Windows 7模拟器和Excel克隆。

　　数据都很夸张，AI自己不停地写了55万行代码、120万行代码和160万行代码。（话说，Excel代码比Windows还多点，因吹斯汀）

　　多智能体系统协作

　　一个模型在一周内写300万行代码，注意是不停的写，没有人类干预！

　　这显然不是一个模型「单打独斗」，怎么做到的？

　　Cursor团队透露了他们的秘密武器：多智能体系统（Multi-Agent System）。

　　最初，他们尝试让所有Agent平等协作，通过共享文件来同步状态。结果发现：

　　Agent会持有锁太久，或者干脆忘记释放锁。二十个Agent的速度下降到相当于两三个Agent的有效吞吐量。

　　这像极了人类团队中常见的问题：会议太多、沟通成本高、责任边界不清。

　　最终有效的方案是分层架构：

　　规划者（Planners）：持续探索代码库，创建任务，进行高层决策

　　执行者（Workers）：专注于完成具体任务，不关心全局，提交后继续下一个

　　评审（Agent）：判断每轮迭代是否合格，决定是否进入下一阶段

　　这几乎是人类软件公司的组织架构：产品经理/架构师负责规划，程序员负责执行，QA负责评审。

　　但区别在于——这是成百上千个Agent同时工作。

　　Cursor团队实现了上百个Agent可以在同一个代码库上协同工作数周，几乎没有代码冲突。

　　这意味着AI已经学会了人类团队需要多年才能磨合出的协作默契。

　　浏览器的「护城河」

　　比你想象的要深得多

　　如果听到「不就是个显示网页的软件吗」这种评价，所有做过浏览器内核的工程师大概都会苦笑。

　　在计算机科学的鄙视链里，手写浏览器内核的难度，仅次于手写一个操作系统。

　　为了让你对这300万行代码有个概念，我们需要看一眼谷歌的Chromium（Chrome的开源母体）。

　　作为人类软件工程的巅峰之一，Chromium的代码量早已突破3500万行。

　　它不仅仅是一个软件，本质上已经是一个「伪装成应用程序的操作系统」。

　　GPT-5.2挑战的究竟是什么？

　　首先是CSS的「混沌理论」。

　　网页排版从来不是简单的堆积木。

　　CSS标准里充满了各种历史遗留的怪癖、层叠规则（Cascade）和复杂的继承逻辑。

　　一位前火狐浏览器工程师曾打过比方：实现一个完美的CSS引擎，就像是在模拟一个物理法则随心所欲变化的宇宙。你改动一个父元素的属性，可能导致几千个子元素的布局瞬间崩塌。

　　其次是「虚拟机里的虚拟机」。

　　这次AI不仅写了界面，还写了一个JS虚拟机。

　　现代网页跑的JavaScript代码需要内存管理、垃圾回收（GC）和安全沙箱。

　　稍微处理不好，网页就会吃光你的内存，或者直接让黑客穿透浏览器接管电脑。

　　最要命的是，它选了Rust。

　　Rust这门语言以「绝不妥协的安全」著称，它的编译器就像一位极度神经质的考官。

　　人类工程师在写业务逻辑时，往往要花一半的时间和编译器「吵架」，处理借用检查（BorrowChecker）和生命周期问题。

　　AI不仅要懂业务，还得在几百万行代码的规模下，让这位「考官」挑不出毛病。

　　能在七天内把这些硬骨头啃下来，并且让它们协同工作，这已经不是简单的「写得快」了，这意味机器开始具备了顶级的架构掌控力。

　　当AI能够「忍受孤独」

　　但这则新闻真正的炸点，其实不在于浏览器本身，而在于那个「Uninterrupted」（无中断）。

　　这是AI进化的分水岭。

　　在此之前，我们熟悉的AI编程工具（比如早期的Copilot）的情况是：你写个函数头，它补全五行代码；你发个指令，它生成一个脚本。

　　它们的记忆是碎片化的，注意力是短暂的。

　　一旦任务稍微复杂一点，比如「重构这个模块」，它们往往会顾头不顾尾，改了这头坏了那头，最后还得人来擦屁股。

　　但这次不一样。这是一次「长时任务」的胜利。

　　这300万行代码分布在数千个文件里。

　　当AI写到第300万行时，它必须依然「记得」第1行代码里定下的架构规矩；

　　当渲染引擎和JS虚拟机打架时，它必须能回溯几万行代码去寻找Bug的源头。

　　这168个小时里，GPT-5.2肯定写出过Bug。

　　但它没有停下来报错等待人类投喂答案，而是自己读取错误日志，自己调试，自己重构，然后继续前行。

　　这种「编写-运行-修复」的自主闭环，曾经是我们人类工程师最引以为傲的护城河。

　　现在，这条护城河被填平了。

　　我们正在目睹AI从「聊天伴侣」向「数字劳工」的质变。

　　以前我们指挥AI做「任务」，比如「写个贪吃蛇」；

　　现在我们指挥AI做「项目」，比如「造个浏览器」。

　　沉默的螺旋

　　虽然这个AI版浏览器的成熟度距离Chrome还有很长的路要走，但它证明了路径的可行性。

　　当算力可以转化为极其复杂的工程实施能力时，软件开发的边际成本将趋近于零。

　　这场实验最令人震撼的，其实不是屏幕上那个渲染出的网页，而是那个在后台沉默运行了整整七天的进度条。

　　它不眠不休，不急不躁，以每秒数千字符的速度构建着数字世界的基石。

　　也许我们该重新审视「创造」的定义了。

　　只有当工具开始独自在深夜里解决问题时，我们才明白，它不再只是工具，而是我们的同行者。

　　从澳洲大叔的「赛博黑工」

　　到AI长时任务

　　用5行代码逼疯硅谷的澳洲放羊大叔，其实只做了一件事情，就是让AI不达目标不能停止。

　　至于Prompt.md写了什么命令，并不是重点。

　　就像今天Cursor CEO搞的这个极限压力测试一样，目标就是造一个Chrome、造一个Windows、开发一个Excel，只要没完成目标，AI就要一直运行下去。回到最开始那个问题：

　　一个AI究竟能自己干多久？

　　物理上的答案是无穷。只要你有足够的算力、稳定的基础设施、清晰的任务定义，AI可以无限运行下去。

　　但更重要的是，这改变了软件开发的经济学。

　　传统软件开发的主要成本是人力和时间。

　　一个10人团队开发一个复杂项目，可能需要6个月到数年。每个月的人力成本可能是几十万到上百万。

　　现在，AI可以在一周内完成原本需要数月的工作。

　　成本可能只是一些token费用，Emad Mostaque（Stability AI前CEO）猜测Cursor浏览器项目可能消耗了约30亿个token。

　　他还有一个想法：用多少token能够重写一套Windows级别的操作系统？成本如何？

　　Token是越来越便宜的，就像之前的水和电，最终基于token的算力也会变得极其廉价。

　　于是，软件经济学就被彻底颠覆。比如，软件按照授权付费的方式恐怕要消失了。

　　在2026年的今天，软件开发正在经历一场基因级别的变异。

　　从前，代码是人类一行一行敲出来的产物。

　　未来，代码可能只是人类意图的自动展开：你描述你想要什么，AI就能把它变成现实。

　　一个模型能跑多久？

　　只要你需要，它就能跑下去。

　　参考资料：

　　https://x.com/mntruell/status/2011562190286045552

　　https://x.com/leerob/status/2011565729838166269

　　https://cursor.com/cn/blog/scaling-agents

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

大厂AI入口大战升级，谁是最能干活的桌面Agent？

钛媒体APP 2026-07-22 12:05:43
0 跟贴 0
国内首个！GPT-5.6「删库跑路」，中国安全加强版Codex火速上线

新智元 2026-07-22 14:20:56
0 跟贴 0

AI御三家战争：革命、分裂与帝国反扑

钛媒体APP 2026-06-01 17:24:30
0 跟贴 0

还在手动抠图？这款AI工具一键制作爆款封面，效率翻倍

雷科技 2026-07-06 17:24:04
0 跟贴 0
Gemini三箭齐发！实测让人失望，但谷歌AI未来可期？

雷科技 2026-07-22 19:15:41
0 跟贴 0

全球最高自由度！他们把人类身体「像素级」复刻了

新智元 2026-07-22 23:46:48
0 跟贴 0

被嘲掉队的腾讯 AI，如今逆袭第一

互联网思维 2026-07-23 01:25:04
0 跟贴 0
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0

BrowserBC：克隆人类点击，让一次网页操作转化为所有Agent的能力

量子位 2026-06-27 20:34:19
27 跟贴 27
前端工程师最不想看到的开源项目出现了，一行命令克隆任意网站

量子位 2026-06-28 15:53:49
151 跟贴 151
用户诉状指出：丰田设置同意弹窗却没有真正尊重用户选择，已面临集体诉讼

像素与芯片 2026-07-21 18:48:16
3 跟贴 3
丰田被美国官网告了：弹窗拒绝按钮是假的点拒绝还偷用户数据

中国能源网 2026-07-21 22:26:07
11 跟贴 11
68万年终奖变成6千，我没闹，准时上下班，不维护公司程序半月后

巨海克 2026-07-22 06:54:31
0 跟贴 0
AI实时渲染的无限流可视化浏览器Flipbook

量子位 2026-05-02 18:24:35
0 跟贴 0
《纽约客》丨我的红色人生：巴黎遭遇红色警报热浪

邸报 2026-07-22 09:51:11
1 跟贴 1
自驾新能源汽车跨境突然遭远程锁车30多小时车主发声

封面新闻 2026-07-22 21:54:10
15587 跟贴 15587
女子与男友分手后，发现手机被装监控软件，细思背后极恐

小鬼侃剧 2026-07-20 21:49:17
1 跟贴 1
voices38大神以传统方式攻破《刺客信条：影》D加密

3DM游戏 2026-07-20 09:22:17
2 跟贴 2
佛山最新行政区划代码公布（截至6月30日）

新浪财经 2026-07-22 02:04:58
0 跟贴 0
手提包装满到鼓起来？印度女总统外访保镖紧跟身后走红毯，网友：包里装的应该不是文件

车马点兵V 2026-07-21 11:41:32
0 跟贴 0
杭州路边出现“胶囊小吃车”，需2万押金+每月1200多元租金，自带油烟机和空调，有夫妻摆摊4天每天近1000元流水

极目新闻 2026-07-22 10:40:59
8024 跟贴 8024
主管逼我背黑锅，三年后大股东竟起立，当众拉椅请我入座

牛魔王与芭蕉扇 2026-07-22 17:48:58
0 跟贴 0
茂名这个5.3亿项目发布终止公告：原因是

茂名油城圈 2026-07-23 01:44:27
0 跟贴 0
哈尔滨市城区供热起止时间拟调整｜征求意见中——

哈尔滨新闻网 2026-07-22 13:29:58
103 跟贴 103
今年上半年就业形势保持总体平稳

央视新闻客户端 2026-07-22 10:04:00
8429 跟贴 8429
女生取外卖时因起身太猛，晕倒在家门口：完全无意识也没有感觉

星视频 2026-07-22 16:14:29
34 跟贴 34
AI自己写代码，训出1B端侧「小钢炮」-1

机器之心Pro 2026-05-26 14:32:09
0 跟贴 0
《The Duskbloods》网络测试注册频频报错？你可能漏了这一步

浅遇时光 2026-07-23 00:26:17
0 跟贴 0
微软是如何穿越30年周期的

钛媒体APP 2026-04-18 20:29:35
2 跟贴 2
总裁故意让灰姑娘送文件，一招劝退相亲对象

辰晓星看剧 2026-07-20 11:51:19
1 跟贴 1
特斯拉公布夏季软件更新，Grok拓展车控能力、导航记忆偏好路线等

IT之家 2026-07-22 15:06:32
14 跟贴 14
中国算力的十万卡雄心

华商韬略 2026-07-21 10:29:09
0 跟贴 0
俄媒曝：在日俄罗斯公民被情报机构监控

参考消息 2026-07-22 18:39:11
463 跟贴 463
中国队将选派最佳阵容出战WTT中国大满贯赛

新华社 2026-07-22 17:54:17
12 跟贴 12
吴清：坚决维护资本市场平稳健康运行，稳步扩大高水平制度型开放

新京报 2026-07-22 17:08:27
219 跟贴 219
不费吹灰之力就拿到了绝密文件

虫虫看大剧 2026-07-20 13:53:26
1 跟贴 1
澳外长攻击指责中国外交部回应

新华社客户端 2026-07-22 15:26:50
35 跟贴 35
沃尔玛社区店在苏州加速推进首批门店落地

北京商报 2026-07-22 11:17:16
7 跟贴 7
资深Office用户：Excel里这个被忽视的函数，能把表格变成轻量应用

字节漫游指南 2026-07-21 18:48:44
0 跟贴 0
女生高考684分，称花3000元咨询高考规划师，被录进“双非”：至今仍是全校录取最高分，原计划上央财或上财

大风新闻 2026-07-22 08:36:03
1927 跟贴 1927

台湾精英称：郑丽文若2028当选地区领导人将改写教科书

台湾精英称：郑丽文若2028当选地区领导人将改写教科书

羽逸地之光

2026-07-15 03:16:45

斯诺克战报：8席正赛出炉！2场5-4，中国军团3胜2负，3冠军翻车！

斯诺克战报：8席正赛出炉！2场5-4，中国军团3胜2负，3冠军翻车！

刘姚尧的文字城堡

2026-07-22 21:42:59

连会场都进不去！王毅闪现马尼拉，中方特殊安排，日外相慢慢等吧

连会场都进不去！王毅闪现马尼拉，中方特殊安排，日外相慢慢等吧

短发过这夏

2026-07-22 03:37:43

阿根廷的亚军：单核足球的极限？

阿根廷的亚军：单核足球的极限？

张佳玮写字的地方

2026-07-22 14:21:35

大伯老炫耀儿子是公务员，我就说自己年薪60w，是他的10倍！结果大伯说：你深圳挣60w正常！但要论生活质量，肯定还是我儿子高！

大伯老炫耀儿子是公务员，我就说自己年薪60w，是他的10倍！结果大伯说：你深圳挣60w正常！但要论生活质量，肯定还是我儿子高！

谭老师地理大课堂

2026-05-04 00:06:09

打破百年惯例为乔治庆 13 岁生日，查尔斯释放清晰信号：梅根王妃梦难以成真！

打破百年惯例为乔治庆 13 岁生日，查尔斯释放清晰信号：梅根王妃梦难以成真！

小鱼爱鱼乐

2026-07-23 01:21:09

瞒不住了！谢贤死因曝光，火葬全程内情流出，难怪狄波拉哭到失态

瞒不住了！谢贤死因曝光，火葬全程内情流出，难怪狄波拉哭到失态

阿讯说天下

2026-07-21 11:31:47

张雪峰：如今最难找工作的，不是农民工，也不是大专生，更不是985、211毕业生，而是这群人

张雪峰：如今最难找工作的，不是农民工，也不是大专生，更不是985、211毕业生，而是这群人

二胡的岁月如歌

2026-07-01 15:28:51

300 万赎金仍撕票，刘某文潜逃两年终归案

300 万赎金仍撕票，刘某文潜逃两年终归案

慕容律师

2026-07-21 15:49:27

崩塌前58分钟受命疏散群众，26岁网格员龚宝冬回复"好的"

崩塌前58分钟受命疏散群众，26岁网格员龚宝冬回复"好的"

中国青年报

2026-07-19 19:24:16

卡里克截胡绝杀！曼联重磅报价，硬抢世界杯第一门神

卡里克截胡绝杀！曼联重磅报价，硬抢世界杯第一门神

奶盖熊本熊

2026-07-23 03:32:25

内行人：人口大迁徙正在开始？未来一半中国人，或会流入这些地方

内行人：人口大迁徙正在开始？未来一半中国人，或会流入这些地方

小谈食刻美食

2026-07-11 10:07:40

消息称OPPO、vivo拒绝三星存储报价：涨幅有限，手机厂不愿再为涨价买单

消息称OPPO、vivo拒绝三星存储报价：涨幅有限，手机厂不愿再为涨价买单

算力游侠

2026-07-22 15:08:31

大瓜！某投行的“刷牙门”

挖掘机007

2026-07-22 13:24:42

强降水+雷暴大风！江苏今夜起强降水持续

强降水+雷暴大风！江苏今夜起强降水持续

江苏警方

2026-07-22 21:20:11

太心酸了！42岁著名女歌手江苏走穴，宾客只顾吃席没人搭理

太心酸了！42岁著名女歌手江苏走穴，宾客只顾吃席没人搭理

小徐讲八卦

2026-02-12 12:13:20

真是毁三观！释永信21年前与刘立明在郑州发生关系的笔录曝光

真是毁三观！释永信21年前与刘立明在郑州发生关系的笔录曝光

魔都姐姐杂谈

2025-07-28 14:35:36

离婚第三天，前妻就和别人再婚了，我淡然出游，她突然打来电话

离婚第三天，前妻就和别人再婚了，我淡然出游，她突然打来电话

千秋文化

2026-07-07 19:56:21

今天才发现：用了多年的6样物品，竟然是“玻纤品”，真后怕

今天才发现：用了多年的6样物品，竟然是“玻纤品”，真后怕

Home范

2026-07-20 14:33:20

伊朗导弹击中美军基地瞬间画面公开，火光冲天多名美军阵亡

伊朗导弹击中美军基地瞬间画面公开，火光冲天多名美军阵亡

每日经济新闻

2026-07-22 13:16:23

AI产业主平台领航智能+时代

15760文章数 66965关注度

往期回顾全部

科技要闻

马斯克看笑了：谷歌什么都有偏偏没最强AI

头条要闻

舷窗炸裂头部被吸出飞机乘客首次露面：浑身都是血

头条要闻

舷窗炸裂头部被吸出飞机乘客首次露面：浑身都是血

体育要闻

阿根廷的亚军：单核足球的极限？

娱乐要闻

47岁汤唯宣布二胎产子大女儿10岁

财经要闻

宜家出售八城"蓝盒子" 30年大店逻辑生变

汽车要闻

智能舒适却依旧硬核泰钽700仍是台与众不同的硬派SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

房产

手机

游戏

公开课

他不是“族长”，是我们的青春

房产要闻

冲刺500亿美元IPO，海南又要迎来超级巨头！

手机要闻

14999元！三星Galaxy Z Fold8 Ultra图赏：薄至8.9mm 仅重215g

国行PS5 Pro售罄！索尼自家商城都卖完了至今无回应

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版