网易首页 > 网易号 > 正文 申请入驻

LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局

0
分享至

鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

离职的LeCun,反手就给Meta一记重锤:差评如潮的Llama4真的作弊刷榜了!

  • 结果的确被篡改了一点。
    为了更好的结果,团队对不同基准测试使用了不同的模型



都说别惹离职er,不止LeCun,田渊栋也在个人年终总结中透露了一点内幕。

  • 明明是被拉来给Llama4救火的,事先预想了四种可能,结果小扎给了我第五种……

(扶额苦笑.jpg)



Anyway,至于离职后的打算,两位大神都不约而同地表示:

创业!



Llama4刷榜引发的离职潮

DeepSeek还是给小扎压力太大。

此前就有消息爆料,DeepSeek的横空出世,让Llama 4还没发布就被甩在身后,逼得小扎疯狂加码AI投资。

这一点也得到了LeCun的证实。

小扎确实慌了,对内push上强度,要求GenAI部门加速AI开发和部署,还拉来原FAIR团队的田渊栋救火。

结果就是,团队之间沟通直接破裂。LeCun他们想要做些新东西,但小扎更想要已经被验证过的、可以直接落地的技术。

真正的导火索则来自于Llama 4的惨败。



不仅输了,还因为排行榜造假名声大跌,于是小扎彻底对团队所有人失去了信心,并将他们全部边缘化。

这也直接导致Meta开启了团队大换血:一边天价从硅谷各个公司挖人,一边又大刀阔斧裁掉老员工们。

田渊栋及其团队则是被率先波及的一群人。

一月份被赶鸭子上架加入Llama 4,十月份Llama 4.5一训完就被卸磨杀驴。

这波田渊栋都得喊冤……

因为上头的压力,全组被迫放下手头正在做的工作,来Llama 4接烂摊子,距离发布ddl就剩2个月,还要处理所有dirty work。

为此,田渊栋那时还专门画了个2x2的回报矩阵,计算了下干这事的四种结局



但老板都发话了,不得不干啊,田渊栋想着那就但求尽力而为,问心无愧吧。

结果哼哧哼哧干了几个月,小扎一个都没选,给了Plan E:不问责负责人,转头把田渊栋和组员们一脚踢了出去。



难怪田渊栋复盘这段经历时,也要来一句:

  • 这也让我对这社会的复杂性有了更为深刻的认识。

不过好在田渊栋自己也想得开,他说自己已经待在Meta十多年了,最近几年更是抱着“公司快把我开了吧”的心态,所以也算是因祸得福吧,还给他接下来的小说创作提供了很多新素材(doge)。



(咳咳)言归正传,这几个月对于田渊栋来说,也不算一无所获,在强化学习训练的核心问题上他也有了些新的探索。

首先是大模型推理,继2024年底团队公开的连续隐空间推理(coconut)引发广泛关注后,团队继续通过理论工作Reasoning by Superposition进一步阐明了连续隐空间推理的优势所在。

与此同时,也分别从不同角度尝试提升模型推理效率:Token Assorted通过隐空间的离散token减少计算开销、DeepConf基于置信度提前终止推理、ThreadWeaver制造并行思维链加速推理,以及在不同规模模型中用RL学习推理能力。

可解释性方面,研究聚焦于Grokking(顿悟) 这一特征涌现现象,从记忆到泛化的突变过程入手,试图解释模型究竟学到了什么、和输入数据的关系、能达到怎样的泛化,也就是打开模型的黑箱。

简而言之,对于被拉来“背黑锅”这事,田渊栋对老东家还是手下留情了,虽然你不地道,但我已经Let it go~



不过紧随其后离职的LeCun就没那么心软了,直接痛批Meta内部对LLM上瘾过甚,尤其是那些新挖来的超级智能实验室成员。

他点名批评亚历山大王:年轻且缺乏经验。

虽然学得快,但压根不懂研究,不知道怎么做、也不知道如何和研究员们共处。

在LeCun面前,这个27岁的年轻人,简直像个little baby。

但大语言模型并非他们所想象的那样美好,LeCun直言,LLM有用但本质受限于语言,夸张一点说:

  • LLM是死胡同。

要实现人类水平智能,就必须了解物理世界的运作规律,也就是LeCun长期专注的世界模型,但Meta对此已经丧失了兴趣。

在研究路线上的分歧,也让LeCun不得不离开公司,开启自己人生的下一章——创业

离开Meta做点啥?创业

LeCun的新公司名为Advanced Machine Intelligence(AMI),做的还是他心心念念的世界模型,而且all in开源

不过据他自己透露,他只会担任新公司的执行主席而不是CEO。

  • 我是一名科学家,我能激励人们从事工作,以及猜测哪项技术会成功,但我不擅长组织管理,也实在太老了。

LeCun将拥有和之前在Meta相同的研究自由度,而负责带领AMI的将交给法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun。



他们将目光聚焦在V-JEPA架构上,试图通过学习视频和空间数据来理解物理世界,让AI完成规划、推理并拥有长期记忆,也就是他常说的高级机器智能。

LeCun预计将在12个月内,见证该项技术的初始版本诞生,并在最近几年内实现大规模进展,虽然它显然还远远称不上超级智能,但至少在通往AGI的道路上,它存在希望。



而作为LeCun的老下属,田渊栋也拒绝了大厂们纷纷为他抛来的橄榄枝,刚刚正式宣布创业!

具体细节暂时未表,但他表示:

  • 乘着自己还年轻,去当一家新初创公司的联合创始人。

不管怎样,先安静地忙活一阵。

参考链接:
[1]https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2
[2]https://zhuanlan.zhihu.com/p/1990809161458540818

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于轮到日本“强烈抗议”:130年了,日本从未像今天这样憋屈

终于轮到日本“强烈抗议”:130年了,日本从未像今天这样憋屈

小陈讲史
2026-01-08 11:57:03
李在明也没想到,访华仅3天,59岁妻子竟凭一个举动给他长脸了

李在明也没想到,访华仅3天,59岁妻子竟凭一个举动给他长脸了

丁丁鲤史纪
2026-01-07 11:35:05
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
从万亿总裁到变卑微舔狗!网友:王石在地产大佬,差不多活成笑话

从万亿总裁到变卑微舔狗!网友:王石在地产大佬,差不多活成笑话

火山詩话
2026-01-08 16:02:52
伊朗巨变前夜

伊朗巨变前夜

凤眼论
2026-01-08 10:31:08
外交部:美方在公海海域随意扣押他国船只严重违反国际法

外交部:美方在公海海域随意扣押他国船只严重违反国际法

澎湃新闻
2026-01-08 15:36:26
访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

访华第2天,李在明得偿所愿,不到24小时,高市对中国提出2个请求

近史博览
2026-01-08 09:36:51
吹杨被交易至奇才!掏出手机起身离场 落寞背影预示老鹰时代落幕

吹杨被交易至奇才!掏出手机起身离场 落寞背影预示老鹰时代落幕

颜小白的篮球梦
2026-01-08 10:44:54
阿里:加大投入淘宝闪购以达到市场绝对第一

阿里:加大投入淘宝闪购以达到市场绝对第一

第一财经资讯
2026-01-08 13:44:51
叛徒确定,取代马杜罗后还能拿5000万?数月前就已通过美国面试

叛徒确定,取代马杜罗后还能拿5000万?数月前就已通过美国面试

坠入二次元的海洋
2026-01-08 05:47:20
女首相被吓哭了!

女首相被吓哭了!

钧言堂
2026-01-07 12:36:38
新华社痛批!多地加油站疯狂作弊,网友:罚2000是在鼓励犯罪吗?

新华社痛批!多地加油站疯狂作弊,网友:罚2000是在鼓励犯罪吗?

徐德文科学频道
2026-01-08 15:05:15
东北暴雪预警!明天降雪最强

东北暴雪预警!明天降雪最强

鲁中晨报
2026-01-08 11:49:08
媒体终于报道伊朗了,但评论却是经过精心筛选的

媒体终于报道伊朗了,但评论却是经过精心筛选的

清书先生
2026-01-08 16:55:15
最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

叶公子
2026-01-06 20:02:45
突发!芯片三巨头集体“撤离”,中国厂商:这泼天的富贵必须抓住

突发!芯片三巨头集体“撤离”,中国厂商:这泼天的富贵必须抓住

科普100克克
2026-01-08 10:09:45
2026央视春晚彩排曝光,令人担心的事还是发生了:不该来的都来了

2026央视春晚彩排曝光,令人担心的事还是发生了:不该来的都来了

银河史记
2026-01-06 17:22:24
河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

六子吃凉粉
2026-01-08 08:39:04
新一代机皇!新机官宣:2月25日,正式首发

新一代机皇!新机官宣:2月25日,正式首发

科技堡垒
2026-01-08 12:17:30
7.99万元起!长安启源全新Q05欲戴王冠,能否过元UP这一关?

7.99万元起!长安启源全新Q05欲戴王冠,能否过元UP这一关?

车壹圈
2025-11-21 17:16:41
2026-01-08 21:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
11988文章数 176357关注度
往期回顾 全部

科技要闻

智谱拿下“全球大模型第一股”,凭什么

头条要闻

特朗普批准法案以阻止中国购买俄罗斯石油 外交部回应

头条要闻

特朗普批准法案以阻止中国购买俄罗斯石油 外交部回应

体育要闻

乒乓大白鹅:从摩尔多瓦地下室到世乒赛领奖台

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

本地
游戏
数码
旅游
公开课

本地新闻

1986-2026,一通电话的时空旅程

M站2025最佳PS游戏出炉!前三名都在XGP阵容中!

数码要闻

TRYX创氪星系水冷产品漏液包赔升级至全额赔付

旅游要闻

图可爱|圆明园8只圆滚滚黑天鹅幼崽萌翻游客

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版