网易首页 > 网易号 > 正文 申请入驻

LeCun 手撕 Meta:Llama 4 造假,小扎直接废掉整个 AI 团队,锐评 28 岁新上司:不懂研究还瞎指挥

0
分享至


整理|华卫

去年这个时候,外界普遍传言:图灵奖得主、Meta 前首席科学家 Yann LeCun 将主动离开 Meta,寻求新的研究机会。如今,LeCun 也已官宣离职开启创业之路。

而刚刚公开的一场对 LeCun 的专访,却呈现了另一番截然不同的故事。这场对话长达三小时,期间 LeCun 曝出了不少 Meta 的猛料,并勾勒出了这一残酷现状:组织运转失灵、基准测试结果造假,以及一位拒绝为自己认定存在科学缺陷的方案背书的研究员的出走。

1 篡改模型测试结果后,小扎边缘化所有参与员工

首先,LeCun 透露了一个 Meta 本不愿公之于众的惊人细节:Llama 4 的基准测试结果是人为操纵的。

“这些结果有几分掺假,”他解释道,工程师针对不同的基准测试采用了不同的模型变体,目的是优化分数,而非展示真实的能力。

这绝非一场单纯的产品失利。2022 年 11 月 ChatGPT 的问世打了 Meta 一个措手不及,公司领导层陷入慌乱。Meta 随即围绕生成式 AI 业务进行重组,相继推出了 Llama 2 和 Llama 3。Meta 将自身定位为开源领域的领军者,是对抗 OpenAI 封闭模式的一方。单看 Llama 3 的下载量和生态系统渗透率,Meta 的布局相当成功,这包含渠道分发、品牌塑造和生态引力所带来的效果。

这一系列势头最终促成了 2025 年 4 月 Llama 4 的发布。这款模型虽斩获亮眼的基准测试分数,却因实际表现问题饱受诟病。此前也有独立报道证实了 LeCun 所描述的“数据作弊”行为,针对不同测试,专门挑选对应的模型变体。

LeCun 在采访中表示,这一事件让 Mark Zuckerberg 对公司现有 AI 团队彻底失去了好感。

据称,这位首席执行官当时震怒不已,“基本上对所有参与此事的人都失去了信任”。“也正因为如此,整个生成式 AI 团队都被边缘化了。”LeCun 表示,“很多人已经离职,还有不少没走的人也即将离开。”

随后,Meta 针对 Llama 4 失利所做出的一系列应对举措,折射出其管理层当时的窘迫处境。据路透社报道,2025 年 6 月,该公司斥资约 150 亿美元收购了数据标注初创企业 Scale AI 的大量股份。与此同时,Meta 聘请了 Scale 年仅 28 岁的首席执行官 Alexandr Wang,牵头组建一个名为 TBD 实验室的全新研究部门,负责前沿 AI 模型的研发工作。

该公司还展开了声势浩大的挖人行动,据称向竞争对手旗下的顶尖研究员开出了 1 亿美元的签约奖金。

通常,健康的研究机构不会因为一次挫折就动辄斥资 150 亿美元收购初创企业的大量股份。这些举动,似乎亦在展露这家公司正面临战略押注摇摇欲坠的危机。

2 LeCun 锐评 Alexandr Wang:毫无经验、休想对我指手画脚

对 Wang 的任命,造成了公司架构上一次令人错愕的上下级反转。身为图灵奖得主、卷积神经网络发明者、深度学习革命联合发起人的 LeCun,如今竟要向一位主业为训练数据标注的人汇报工作。在任何一家研究机构,这样的身份倒置都堪称骇人。这位领域奠基人端坐会议桌前,听着一位年龄不及自己一半的后辈,为那些对方既未参与创造、也未完全理解的技术规划发展蓝图。

LeCun 在采访中直接表示,此人“毫无研究经验,既不懂研究该如何开展,也不知道研究该如何落地”。“他学得很快,也清楚自己的短板所在……但他毫无研究经验,既不懂研究该如何开展、如何落地,也不知道什么样的东西能吸引研究员,什么样的东西会让研究员反感。”LeCun 如此说道。

当就这一汇报层级向 LeCun 追问时,他的回应措辞谨慎却一针见血:“没人能对研究员指手画脚。尤其像我这样的研究员,更是绝无可能。”LeCun 表示,尽管在 Zuckerberg 主导的 AI 业务重组后,这位 28 岁的年轻人曾短暂担任自己的上司,但实际上并没有对他发号施令。

实际上,双方更深层的矛盾似乎并非源于层级,而是源于理念分歧。Wang 代表的是 Meta 押注语言模型规模化的战略方向,而 LeCun 则认为这一范式从根本上就误入了歧途。让奉行这一理念的人身居管理要职,让他的留任变得绝无可能。

“我敢肯定,Meta 内部有不少人,或许也包括 Alex,都巴不得我不要对外宣称,在通往超级智能的道路上,大语言模型本质上已是一条死胡同。”LeCun 强调,“但我不会因为某个家伙说我错了,就改变自己的想法。我没有错。作为一名科学家,我的职业操守不允许我做出这种违心之举。”

3 “语言模型已经达到瓶颈”

如今 Meta 的 AI 战略,核心是沿用 OpenAI 联合创始人声称已触及天花板的架构方案,与 OpenAI 展开竞争。

然而,作为这家公司最具声望的 AI 研究员,LeCun 认为,这种方案根本无法实现 Meta 宣称要追逐的智能目标。据其透露的内容,负责 Meta 旗舰模型的团队交出的成果可信度极低,致使管理层对整个团队都丧失了信任。

事实上,LeCun 对大型语言模型的批判,早已超越 Meta 此次的具体失利事件。LeCun 一直以来都在强调,大型语言模型的局限性过大,若要释放 AI 的真正潜力,必须另辟蹊径。

过去数年间,他在公开演讲与技术论文中阐释的核心论点,本质上是一个数学层面的结论:语言这一载体,对于培养真正的智能而言,存在着根本性的带宽不足问题。

参与 Lex Fridman 播客节目时,LeCun 曾测算过一组数据:若要通读互联网上的全部文本(体量约为 2×10¹³字节),人类需要耗费 17 万年的时间。而一个四岁孩童,单是通过视觉输入接收的信息体量就约达 10¹⁵字节。也就是说,在幼儿阶段,孩子吸收的信息量,就比大型语言模型从人类全部书面语料库中提取的内容多出 50 倍。

这一数据背后,潜藏着更为深刻的启示。训练大型语言模型,就如同试图通过阅读所有与木材相关的书籍来学习木工手艺:你自始至终都没有碰过一把锤子。诚然,你能掌握相关的专业词汇,但却无法真正理解背后的物理原理。LeCun 的判断很简单:要学好木工,你必须亲手挥起锤子。

这一点恰好解释了 AI 能力上长期存在的短板。青少年只需 20 小时就能学会开车,幼儿第一次尝试就能擦干净桌子,家猫能轻松穿梭于复杂的三维空间。然而,即便投入了数十亿美元的研究经费,在万亿级别的语料库上训练出来的 AI 系统,却在这些任务面前束手无策。

2025 年 11 月,OpenAI 前首席科学家、规模化范式的缔造者 Ilya Sutskever 在接受 Dwarkesh Patel 采访时也抛出了这样一个振聋发聩的观点。他表示,该领域正从“规模化时代”迈向“研究时代”,单纯依靠算力规模的扩张,只会产生边际效益递减的结果。

当这一范式的开创者都如此表态时,其分量不言而喻。ChatGPT 问世后形成的、围绕大语言模型规模化的行业共识正在瓦解。

4 新架构一年内有雏形?

在接受采访的午餐会上,LeCun 用一个具体的例子阐释了他提出的另一种技术路径。当他掐别人一下时,对方会感到疼痛,其心智模型随即发生更新,下次当他再抬手靠近时,对方会本能地退缩。这种基于预判产生的反应,以及随之触发的情绪,才构成了对因果关系的真正理解。而大型语言模型并不具备这样的机制。它们只是基于统计规律来预测语言符号,而非通过因果模型去判断行为会引发何种后果。

为此,LeCun 提出了一套名为联合嵌入预测架构(JEPA)的世界模型架构,以此弥补现有技术的缺陷。该架构通过对视频与空间数据进行训练,培养系统基于物理原理的认知能力。它让系统学习与行为相关的抽象表征,而非执着于符号层面的预测;同时,它还融入了能随经验不断进化的持久记忆,而非在每次对话时都重置记忆。

采访中,LeCun 给出了该架构的落地时间表:12 个月内推出雏形版本,数年内实现更大规模的部署应用。

据称,他创办的这家初创公司命名为“先进机器智能”,其技术路径正是他所主张的、比大型语言模型更具优势的方案。在这家新公司里,他将出任执行董事长,而非首席执行官。

“我是一名科学家,一个有远见的人。我能激励人们去做有趣的事情。我很擅长预测哪种技术会成功,哪种会失败。但我当不了 CEO。”LeCun 说,“我既太缺乏条理,也太老了!”

世界模型能否后来居上,目前尚无定论。LeCun 预测,具备动物级智能水平的 AI 将在五到七年内实现,而达到人类级智能则需要十年时间。

这位曾助力构建当前 AI 范式的领军人物,如今正孤注一掷地押注:要实现超越,必须依托截然不同的技术路径。绝非细枝末节的渐进式改良,而是彻底颠覆式的全新架构。

https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2

声明:本文为 InfoQ 整理,不代表平台观点,未经许可禁止转载。

技术人的年度仪式感! 年度盘点与趋势洞察 启动!

《2025 年度盘点与趋势洞察》由 InfoQ 技术编辑组策划。覆盖大模型、Agent、具身智能、AI Native 开发范式、AI 工具链与开发、AI+ 传统行业等方向,通过长期跟踪、与业内专家深度访谈等方式,对重点领域进行关键技术进展、核心事件和产业趋势的洞察盘点。

力求以体系化视角帮助读者理解年度技术演化的底层逻辑、创新方向与落地价值,并为新一年决策提供参考。内容将在 InfoQ 媒体矩阵陆续放出,欢迎大家持续关注。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马杜罗为何不慌?进了DEA“牢笼”,反而拿到了博弈主动权

马杜罗为何不慌?进了DEA“牢笼”,反而拿到了博弈主动权

回旋镖
2026-01-05 23:14:21
什么是低端家庭?去朋友家吃了一顿饭,我尴尬的想逃离

什么是低端家庭?去朋友家吃了一顿饭,我尴尬的想逃离

诗词中国
2026-01-05 20:10:45
美军如何进行电子压制,让委内瑞拉部署的中俄防空系统失效?

美军如何进行电子压制,让委内瑞拉部署的中俄防空系统失效?

兵国大事
2026-01-05 18:02:20
朴娜来「车上活春宫」!2经纪人开车被逼看全程 做一半还狂踢椅背

朴娜来「车上活春宫」!2经纪人开车被逼看全程 做一半还狂踢椅背

ETtoday星光云
2026-01-05 09:42:04
中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

史政先锋
2026-01-05 19:53:45
2026烟草新规落地!128元软中华成过去,买烟卖烟3大变化必看

2026烟草新规落地!128元软中华成过去,买烟卖烟3大变化必看

复转这些年
2026-01-05 23:50:45
法治在线丨网购虚假退货上万单 17岁少年被判刑六年

法治在线丨网购虚假退货上万单 17岁少年被判刑六年

北青网-北京青年报
2026-01-05 20:55:07
悲痛!又有几名学生跳楼!致家长:请不要再以各种名义给孩子配手机了!

悲痛!又有几名学生跳楼!致家长:请不要再以各种名义给孩子配手机了!

谭老师地理大课堂
2026-01-05 21:01:43
该反思了,国内军事专家预测不仅离谱,而且扯淡,别再纸上谈兵了

该反思了,国内军事专家预测不仅离谱,而且扯淡,别再纸上谈兵了

你食不食油饼
2026-01-04 18:19:10
欧盟惩罚来了,如果匈牙利被踢出欧盟,中国的1500亿投资怎么办?

欧盟惩罚来了,如果匈牙利被踢出欧盟,中国的1500亿投资怎么办?

丰谭笔录
2026-01-05 10:51:35
高中生扶老人被讹50万,15年后老人孙子考上清华,在校门口跪下求饶

高中生扶老人被讹50万,15年后老人孙子考上清华,在校门口跪下求饶

红豆讲堂
2025-07-14 17:21:43
马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

马杜罗被“绑架”到美国,彻底打脸国内的某些军事专家

微评社
2026-01-05 11:17:53
王石夫妇婚变风波大反转,最新后续来了

王石夫妇婚变风波大反转,最新后续来了

新浪财经
2026-01-05 19:57:13
雷军等小米高管评论区被冲后!徐洁云回应投放大熊:向米粉道歉…

雷军等小米高管评论区被冲后!徐洁云回应投放大熊:向米粉道歉…

柴狗夫斯基
2026-01-06 08:26:06
景区21辆车被扎胎后续!凶手正脸被扒,彻底社死,作案原因曝光

景区21辆车被扎胎后续!凶手正脸被扒,彻底社死,作案原因曝光

奇思妙想草叶君
2026-01-05 16:08:00
NBA官方:2026年10月火箭与独行侠将在中国澳门进行两场季前赛

NBA官方:2026年10月火箭与独行侠将在中国澳门进行两场季前赛

懂球帝
2026-01-05 22:09:45
广东惠州召开五千人干部警示教育大会后,5天内9名干部主动投案

广东惠州召开五千人干部警示教育大会后,5天内9名干部主动投案

澎湃新闻
2026-01-05 21:48:28
东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

东北丢不了孩子!男子街头捡迷路小女孩,路人互相紧盯:但凡把车开1米,会被直接截停

潇湘晨报
2026-01-05 16:58:18
国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

国外很豪放!穿连体衣下面不系扣,难道不好好穿衣就时髦?

章眽八卦
2026-01-05 12:28:44
23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

红星新闻
2026-01-05 23:27:24
2026-01-06 10:35:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
11908文章数 51682关注度
往期回顾 全部

科技要闻

性能涨5倍!黄仁勋CES秀肌肉 下代芯片来了

头条要闻

首次庭审细节披露:马杜罗声音洪亮 称自己是战争囚犯

头条要闻

首次庭审细节披露:马杜罗声音洪亮 称自己是战争囚犯

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

亲子
手机
教育
公开课
军事航空

亲子要闻

姜还是老的辣,亲子搞笑日常

手机要闻

科技昨夜今晨0106:vivo、小米、苹果拿下2025国内激活销量TOP3

教育要闻

问题征集,速速留言咯

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美称对“占领”委内瑞拉保留选择权

无障碍浏览 进入关怀版