网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

刚刚，LeCun团队开源首款代码世界模型！能像程序员一样思考的LLM来了

2025-09-25 13:21:00　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：艾伦

【新智元导读】疯狂挖人的Meta，终于在今天发布了最新AI研发成果！代码世界模型CWM是本次发布的模型，创新性地将世界模型引入了代码生成任务中。这是否会成为编程模型新范式？

，终于把他们的AI研发新成果端上来了！

就在今天，Meta官宣发布了一款名为代码世界模型（Code World Model, CWM）的LLM，探索如何使用世界模型改进AI代码生成性能。

Yann LeCun也亲自下场转发撑场子了。

CWM究竟有哪些创新点？这个32B的参数相对较小的大模型，究竟有多强？

CWM创新点

本次发布的CWM，最大的创新点是，将世界模型引入了代码生成任务中。

简言之，该模型的核心正如Yann LeCun所言：生成代码时，通过提前预测即将生成的代码指令可能产生的效果，来更好地规划出能够满足人类期望达成的效果的代码，从而改进生成代码的质量。

当人类进行规划时，我们会设想不同行动可能产生的结果。

当人类思考代码时，会在脑海中模拟其部分执行过程。

而目前市面上的主流语言模型，还很难做到这一点。

专门训练一个代码世界模型，补足这一点，生成代码的效果会不会好很多，是Meta要通过本次发布的CWM验证的猜想。

CWM基于大量编程数据，加上专门定制的Python和Bash（Linux和macOS的命令行解释器脚本语言）的世界建模数据，进行该模型的训练。

通过这种训练，CWM能够模拟Python程序在Bash环境中的执行及与Agent之间的交互。

对于「数数strawberry中有多少个r」这个难倒无数大模型的问题，CWM也用类似pdb（Python Debug用的调试器）的形式演示了其工作流程：

CWM直接发布了3个不同的Checkpoint，用于不同目的。

CWM性能测试

「光说不练假把式」，我们直接看看这个32B的小参数大模型在各类编程基准测试中的表现如何。

SWE-bench Verified是一个真实开源项目修复的最常用的编程评测标准，让模型在真实的大型开源仓库里，根据 GitHub issue+failing tests，定位并修复缺陷，最终以自动化测试是否全部通过来判定是否解决。

在该项测试中，32B小参数的CWM成绩为65.8%，逊于Qwen3-Coder和Kimi-K2-Instruct，与闭源的Gemini-2.5-Thinking接近，属于开源阵营第一梯队了。

其他测试成绩Alexandr Wang也直接发出来了：

LiveCodeBench：68.6%

Math-500：96.6%

AIME 2024：76.0%

CWM模型算是Meta的一次概念验证，投入了不算多的算力训练这个小参数大模型，主要是为了检验将世界模型引入代码生成任务是否会显著提高生成代码质量。

换言之，我们今日看到的这个模型只能算Demo。大的还在后面？

参考资料：

https://ai.meta.com/research/publications/cwm-an-open-weights-llm-for-research-on-code-generation-with-world-models/

https://x.com/syhw/status/1970960837721653409

https://x.com/AIatMeta/status/1970963571753222319

https://x.com/ylecun/status/1970967341052854748

https://x.com/alexandr_wang/status/1970973317227225433

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

零基础科研逆袭！AI+Python 机器学习医疗数据分析实战营

医咖会 2025-07-21 20:02:55
0 跟贴 0
从风口黑马到“断供现场”，Trae背靠字节也挡不住“红线”锁喉

钛媒体APP 2025-11-05 17:53:06
64 跟贴 64

Codeforces难题不够刷？谢赛宁等造了AI出题机，能生成原创编程题

机器之心Pro 2025-10-20 14:17:05
0 跟贴 0

Meta华人太多了！外国员工崩溃：不懂中文就像局外人

新智元 2025-11-06 12:42:52
62 跟贴 62
世界模型==VQA？机器人不用想象画面，预测语义就够了

机器之心Pro 2025-10-28 10:14:22
1 跟贴 1

前Meta大佬推出智能戒指：内置聊天机器人，支持语音转写，不到2000元

智东西 2025-11-06 19:32:50
0 跟贴 0

智能体驱动：企业从“界面操作”到“智能助力”的必然路径

钛媒体APP 2025-10-20 16:40:12
0 跟贴 0
AI时代，努力没用了!「躺平」才是最赚钱的方式

新智元 2025-10-27 09:05:21
18 跟贴 18

LeCun爆料，机器人行业的惊天秘密！

机器之心Pro 2025-10-28 17:38:28
0 跟贴 0
苹果或引入谷歌AI技术明年春季推出新款Siri语音助手

界面新闻 2025-11-06 07:19:44
280 跟贴 280
AEPO：智能体熵平衡策略优化，让探索更稳，推理更深！

机器之心Pro 2025-11-04 13:44:22
0 跟贴 0
当AI学会作弊：比坏更可怕的是坏还聪明

机器之心Pro 2025-08-29 18:45:31
0 跟贴 0
RLinf上新πRL：在线强化学习微调π0和π0.5

机器之心Pro 2025-11-06 17:29:51
0 跟贴 0
机器人工业场景加速推进，测量机“卖爆了” 王兴兴现身谈具身智能的“ChatGPT”时刻

财联社 2025-11-06 23:33:38
0 跟贴 0
谷歌云发布最强自研TPU：十年研发结晶，性能四倍于前代

财联社 2025-11-06 23:50:07
0 跟贴 0
100行代码打造迷你编程Agent：修复65%真项目bug，适配所有大模型

量子位 2025-07-27 20:32:11
0 跟贴 0
大模型公司不搞浏览器搞Agent，实测找到原因了

量子位 2025-10-31 16:54:34
2 跟贴 2
“程序员状态管理”小调查｜你的大脑，该回血了！

36氪 2025-10-09 16:26:08
0 跟贴 0
程序员入职近三个月一个成果没有，种种表现却像是带薪干私活？

程序员古耕 2025-11-04 22:59:48
3 跟贴 3
穿搭和脸有没有关系，戴上头套一目了然，果然建模才是最重要的！

搞笑大蘑菇 2025-11-05 13:09:35
3 跟贴 3
Kimi K2思考模型来了！实测3分钟做精美网页，IMO数学题翻车

智东西 2025-11-06 20:43:49
0 跟贴 0
美国发射洲际弹道导弹俄方回应

央视新闻客户端 2025-11-06 05:35:52
18406 跟贴 18406
Claude Code 被任意代码执行攻击的视频演示

机器之心Pro 2025-09-23 10:44:09
0 跟贴 0
用口哨传递指令，被拦截了都不知道

北子影视菌 2025-11-05 16:17:02
1 跟贴 1
根系关系第2讲，求参数的值

大鹏老师讲数学 2025-11-04 05:07:00
0 跟贴 0
轻量高效，即插即用：Video-RAG为长视频理解带来新范式

机器之心Pro 2025-10-20 18:23:17
0 跟贴 0
1斤豆芽卖28.8元？网友直呼“吃不起”，知名餐饮品牌回应

都市快报橙柿互动 2025-11-02 16:20:16
8609 跟贴 8609
一把手的指令，不理解也要执行

乌鸦追剧 2025-11-04 11:35:49
1 跟贴 1
女生自信展示卸妆过程，看完后知道什么叫天生丽质。网友：建模怪觉得自己老有操作了

音乐下午茶官方 2025-11-05 20:23:08
10 跟贴 10
PS5系统代码泄露索尼或推PS/PC跨平台购买功能

3DM游戏 2025-11-05 11:18:05
21 跟贴 21
国务院公告后搜索暴涨3倍上海人立马出手：怕抢不到

极目新闻 2025-11-05 15:06:20
737 跟贴 737
3种“最助眠运动”被发现！跑步、撸铁，效果竟都不如它

唐山微科普 2025-11-05 19:22:54
0 跟贴 0
杭州女子全款买下1800万二手精装房搬家计划要泡汤了

极目新闻 2025-11-06 11:55:49
2600 跟贴 2600
从贝佐斯到马斯克，硅谷科技男都想变帅？各种打针开刀，也颜值焦虑上了

英国那些事儿 2025-10-31 23:31:40
17 跟贴 17
一张AI表格，接管2025年双11

虎嗅APP 2025-11-06 19:22:06
0 跟贴 0
不愧是北京来的大人物，一说指令，香港警察态度立马转变了

壹哥追剧 2025-11-03 19:33:09
1 跟贴 1
MPA要求Meta停止将“PG-13”术语用作Instagram新内容审核政策分类

cnBeta.COM 2025-11-06 13:56:08
0 跟贴 0
三亚海滩“长满”了俄罗斯人！网友调侃：我在这里反而成了“老外”

封面新闻 2025-11-02 12:57:02
148 跟贴 148
小学不会十字相乘法，不会方程，没关系，建模画图法依能解决

瓜田料下 2025-11-05 13:14:46
0 跟贴 0
重庆行政区划调整撤销江北区、渝北区

央视新闻客户端 2025-11-06 12:04:05
1331 跟贴 1331

H3N2甲流来袭！黄金48小时自救用药怎么选？

H3N2甲流来袭！黄金48小时自救用药怎么选？

齐鲁壹点

2025-11-05 06:04:08

雷军回应造车争议翻车，网友怒喷：标准雷不群说法

雷军回应造车争议翻车，网友怒喷：标准雷不群说法

公子麦少

2025-11-06 14:19:48

赖清德下令实弹备战，蒋万安向大陆表明立场，台独与外部势力暧昧

赖清德下令实弹备战，蒋万安向大陆表明立场，台独与外部势力暧昧

三石记

2025-11-05 21:09:52

1-0！女足世界杯奇迹：首次参赛小组第3出线+杀进决赛，创造历史

1-0！女足世界杯奇迹：首次参赛小组第3出线+杀进决赛，创造历史

侃球熊弟

2025-11-06 07:15:39

起风了！郑丽文第五波人事安排出炉！赵少康面临羁押，连忙求饶

起风了！郑丽文第五波人事安排出炉！赵少康面临羁押，连忙求饶

泠泠说史

2025-11-06 15:20:32

挂满彩旗，福建舰准备接受检阅

三叔的装备空间

2025-11-05 16:00:40

白宫这半旗降得是否慢半拍？算是没有破坏规矩？

白宫这半旗降得是否慢半拍？算是没有破坏规矩？

新民周刊

2025-11-06 09:03:12

只要和平，不谈统一，郑丽文让人失望了，蔡正元的话一针见血

只要和平，不谈统一，郑丽文让人失望了，蔡正元的话一针见血

现代小青青慕慕

2025-11-05 09:17:09

郑智接手邵佳一！离开多年重回中超，带黄博文一同执教青岛

郑智接手邵佳一！离开多年重回中超，带黄博文一同执教青岛

小金体坛大视野

2025-11-06 13:27:25

事实证明，“消失”多年的清华才女武亦姝，证实了董卿当年没说错

事实证明，“消失”多年的清华才女武亦姝，证实了董卿当年没说错

千言娱乐记

2025-09-25 20:27:56

5300亿巨头跌落神坛，海天酱油被消费者打回原形，还救得回来吗？

5300亿巨头跌落神坛，海天酱油被消费者打回原形，还救得回来吗？

法老不说教

2025-11-05 17:07:23

最新官宣：即将关闭改造！曾陪伴上海人超70年，满满的回忆！有人特地赶来逛最后一趟！

最新官宣：即将关闭改造！曾陪伴上海人超70年，满满的回忆！有人特地赶来逛最后一趟！

新民晚报

2025-11-06 09:56:33

还会跳下去吗？全红婵愣了好一会：再说吧，应该吧，现在还不知道

还会跳下去吗？全红婵愣了好一会：再说吧，应该吧，现在还不知道

风过乡

2025-11-06 22:09:03

一位姓袁的历史老师，为何能3次准确预言俄乌战争走向？

一位姓袁的历史老师，为何能3次准确预言俄乌战争走向？

猫智深

2025-11-04 20:10:12

“臀大腰粗”的女生怎么穿好看？吊带背心搭深灰瑜伽裤，高雅自信

“臀大腰粗”的女生怎么穿好看？吊带背心搭深灰瑜伽裤，高雅自信

小乔古装汉服

2025-09-29 07:55:03

匈奴一夜消失两千年，DNA结果震惊欧洲：我们祖上还有这层关系？

匈奴一夜消失两千年，DNA结果震惊欧洲：我们祖上还有这层关系？

历史有些冷

2025-11-05 21:40:03

354票赞成，15票弃权。泰国为泰党就这么选出了新老大。

354票赞成，15票弃权。泰国为泰党就这么选出了新老大。

百态人间

2025-11-06 05:50:03

0-1！欧冠首支出局队基本确定：换了主帅继续输！6连败近乎被淘汰

0-1！欧冠首支出局队基本确定：换了主帅继续输！6连败近乎被淘汰

球场没跑道

2025-11-06 11:21:21

云南曲靖一男子发布欲跳楼视频，万千网友在线劝阻，当地：已被消防员救下

云南曲靖一男子发布欲跳楼视频，万千网友在线劝阻，当地：已被消防员救下

极目新闻

2025-11-06 16:25:44

竞争对手爆发终结雷霆杨瀚森开拓者生涯提前结束

竞争对手爆发终结雷霆杨瀚森开拓者生涯提前结束

体坛周报

2025-11-06 14:46:33

AI产业主平台领航智能+时代

13804文章数 66237关注度

往期回顾全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

有报道称特朗普要求中方释放黎智英外交部回应

头条要闻

有报道称特朗普要求中方释放黎智英外交部回应

体育要闻

送走两位全明星，公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何谁给她的勇气？

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么？怎么大猩猩都来参加新车发布了？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

数码

家居

健康

公开课

教育要闻

期中考试期间应该吃什么

数码要闻

机械革命极光X游戏本上新酷睿i5 - 14450HX版本，售价6499元

家居要闻

别样府院畅享诗意生活

超声探头会加重受伤情况吗？

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版