网易首页 > 网易号 > 正文 申请入驻

Llama 4被图灵奖得主曝作弊刷榜,Meta开源AI帝国一夜倾覆

0
分享至

文 | 新质动能,作者|沛林,编辑|沐风

Llama 4真的作弊刷榜了!

Meta前首席科学家杨立昆(Yann LeCun)近日在采访中证实,团队为优化基准测试结果,对不同评测使用了不同版本的模型,“结果的确被篡改了一点”。

另一位被裁的FAIR原技术总监田渊栋,则直指Llama 4的研发是“外行领导内行”。

从Llama 3的“开源盟主”到Llama 4的口碑崩塌,不过一年时间。这背后,是Meta内部管理的混乱与技术路线的摇摆。

随着丑闻曝光与核心团队出走,扎克伯格正推动一场剧烈的转向:高薪挖人、换帅,并彻底放弃开源路线,转而打造闭源模型“Avocado”。

然而,这款被寄予厚望的新作,却深陷“借鉴”争议——它被曝使用通义千问优化,并试图融合谷歌、OpenAI等多方技术。

曾经的开源引领者,如今变为闭源的“集大成者”。

2026年,Meta的AI命运,几乎全部压在了这个拼凑而成的Avocado上。如果它再失败,Meta可能将在大模型的核心赛道上彻底掉队。

Llama 4 作弊了!

作为图灵奖得主‍、“卷积神经网络之父”与“深度学习三巨头”之一,杨立昆于2013年受邀加入Meta担任首席科学家,并成立了大名鼎鼎的人工智能研究院(FAIR)。多年来,杨立昆一直是Meta前沿研究的技术引领者与精神领袖。

当年扎克伯格为了请他出山,甚至不惜答应他不用搬去加州、不辞去教职且研究成果必须公开三项条件。

杨立昆已于2025年年底离职。双方的分道扬镳,本质是因为对技术路线无法达成一致:杨立昆瞧不上大语言模型路线,信奉世界模型,但扎克伯格却一心扑在大语言模型上。

在近期的采访中,杨立昆直言不讳地指出,外界关于Llama 4“刷榜作弊”的指控并非空穴来风。为了在基准测试中维持体面的排名,Meta的团队确实在测试结果上“美化”了不少。他提到,团队在不同的测试中甚至动用了不同的优化模型来专门刷分。

杨立昆痛批Meta内部对LLM上瘾过甚,尤其是那些新挖来的超级智能实验室成员。

他点名批评亚历山大王:年轻且缺乏经验。

虽然学得快,但压根不懂研究,不知道怎么做、也不懂如何和研究员们共处。

在他眼中,这个28岁的年轻人,就是个young boy。

如果杨立昆离开是因为不认同大语言模型路线,那FAIR前研究科学家技术总监田渊栋连同其团队整体被裁掉,就显得更加戏剧性。

刚刚被裁掉时,田渊栋在社交媒体上无奈的表示:当初是被拉来给Llama4救火,结果项目真正的负责人没有被问责,我们团队却被解雇了。

1月4日,田渊栋在社交媒体上对自己离开Meta这件事进一步做出说明:

“其实我也想过在公司十年多了,总有一天要离开,总不见得老死在公司里吧。”

甚至表示很长一段时间里心里都是希望“公司快把我开了吧”。

网友直呼,高级打工人吐槽起上班来,也没什么分别。

而对于Llama 4 的失败,田渊栋在后来的采访中透露的内容,却显示出Meta内部更大的问题。而这些问题,早在Llama 3受到追捧的时期,就已经埋下种子。

从封神到幻灭

回顾Llama系列的迭代史,也曾有过辉煌。Llama 2和Llama 3曾是Meta最值得骄傲的底牌。

2023年和2024年的Meta,凭借“免费又好用”的开源策略,在AI界成为受尊重的公司。

Llama 2证明了开源模型可以与闭源巨头叫板,而Llama 3则将这种性能推到了巅峰,在多项指标上甚至能与GPT-4打得有来有回,成为众多创业者借鉴、使用的开源大模型。

那时的Meta工程师们外出参加会议,脊梁骨都是硬的,他们自豪于自己在做一个有意义的、能改变行业格局的项目。

然而,到了Llama 4,故事急转直下,全面溃败。造成这一结局的核心原因,在于Meta高层对技术演进方向的战略误判。

根据Meta前技术员工爆料,从Llama 3末期开始,扎克伯格和Meta高层开始过度强调“技术产品化”,他们急于将AI整合进WhatsApp、Instagram和Facebook的每一个角落。

在这种“产品优先”的激进指令下,Llama4的研发工作由更擅长产品与工程的高层领导,团队将大量资源倾斜到了多模态和应用层面的适配,却严重忽视了AI最重要的底层能力——推理。

田渊栋对此直接吐槽为“让外行领导内行”。

就在Meta埋头卷规模、卷应用的时候,外部世界发生了翻天覆地的变化。

OpenAI推出了基于思维链的o1模型,彻底改变了推理游戏的规则;紧接着,来自中国的DeepSeek以震撼的MOE混合专家架构横空出世,不仅推理能力强悍,更以极低的成本撕碎了硅谷大厂引以为傲的成本壁垒。

管理层对底层技术理解的匮乏,直接导致了战略路线上极其离谱的“灯下黑”。其实早在ChatGPTo1发布前,田渊栋的FAIR团队就在研究思维链。

然而,因为此前FAIR与产品组之间没有良性互动,且高层痴迷于“技术产品化”,这些自研成果被彻底埋没。

DeepSeek的突袭让Meta内部彻底乱了阵脚,扎克伯格在全员大会上虽然表面淡定,背地里却开始下达“死命令”,要求不计代价追赶。并请来田渊栋带领的FAIR团队来“救火”。

田渊栋收到这一请求时,距离Llama 4定下的发布时间只剩2个月。明眼人都看得出来,这就是个烫手山芋,此时接手,只能尽力,很难善了。

在犹豫是否接手这一项目时,田渊栋还画了一个表格。


表格

田渊栋后来自嘲道:曾以为这件事最多就这四种结果,没想到最终扎克伯格给了他“被裁掉”这“第五种可能”,这让他“对这社会的复杂性有了更为深刻的认识”。

产品定于2个月后上线,这条死线直接导致了Llama 4研发流程的畸形,田渊栋的团队被迫在死线的倒逼下强行推进工作,结果的不尽如人意是可以预见的,最终只能依靠“刷榜”来维持脆弱的体面。

Llama4推出后,社区开发者很快在使用过程中发现问题,纷纷怀疑Meta宣称的性能靠“刷榜”取得。

Meta当时否认了这一质疑。但是Llama 4的表现让扎克伯格非常不满。很快,FAIR团队被裁,杨立昆出走。

扎克伯格亲手拆解了自己耗时十年建立的科研体系。

Meta孤注一掷

裁撤旧体系的同时,扎克伯格在重金请“外来和尚”。

2025年7月中旬,扎克伯格以约4年3亿美元的薪酬包与无限量GPU算力支持等顶级资源保证,挖来OpenAI研究员Jason Wei与Hyung Won Chung。其中,Jason Wei被认为是“思维链”开山论文的第一作者。

在管理层面,扎克伯格以143亿美元的惊人价格收购Scale AI49%的股权(无投票权),并扶持该公司创始人、28岁的Alexandr Wang成为Meta首席人工智能官,直接向扎克伯格汇报。

这位年轻的新帅成立TBD实验室,直接领导FAIR、产品与应用研究部与基础设施部。

Meta陷入一种“自家珍宝当草芥,重金求援买后悔药”的荒诞循环:一边裁掉自研尖兵,一边又急火攻心地花重金各种收购、招聘。

而在公司整体战略上,Meta正在经历一场极其痛苦且充满争议的“急转弯”。

随着Llama 4的溃败,扎克伯格已基本宣告放弃了长期坚持的开源战略,转向重新开发名为“Avocado”的闭源模型。

这款被寄予厚望的求生之作,放弃了纯粹的自研路径,转而试图融合谷歌Gemma、OpenAI的技术亮点,甚至被曝出正在使用阿里巴巴的通义千问(Qwen)来优化其模型。

这种“集百家之长”的策略背后,更像是Meta对此前All in元宇宙,数百亿美元投入却换不回商业利润的应激式焦虑。

现在的Meta,正处于从“理想主义开源先锋”向“务实闭源追随者”转型的阵痛期。它在行业中的位置已从引领者滑落为焦虑的追赶者,试图通过削减元宇宙预算、重组TBD实验室来孤注一掷。

Meta现状,已不再仅仅局限于一个Llama 4模型的得失,而是公司在AI这条路上调整方向后,是否真的能做成。

2026年春季Avocado的发布将是决定扎克伯格成败的关键注脚。如果这款“博采众长”的闭源模型无法实现性能突破,Meta不仅会丢失其曾引以为傲的开源生态,更可能在超级智能的竞赛中彻底掉队。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
无语了!王俊杰19分仅出手2次得3分2篮板,尽快转校吧!

无语了!王俊杰19分仅出手2次得3分2篮板,尽快转校吧!

篮球资讯达人
2026-03-01 15:08:36
总台现场直击丨迪拜机场酒店受波及 阿联酋拦截数百次导弹和无人机袭击

总台现场直击丨迪拜机场酒店受波及 阿联酋拦截数百次导弹和无人机袭击

国际在线
2026-03-01 12:04:25
活久见!网传上海一招聘保安广告,应聘不能有信贷逾期,引发热议

活久见!网传上海一招聘保安广告,应聘不能有信贷逾期,引发热议

火山詩话
2026-03-01 13:49:50
美封杀AI企业后用其工具袭击伊朗

美封杀AI企业后用其工具袭击伊朗

界面新闻
2026-03-01 16:02:17
伊朗革命卫队发布血性檄文:哈梅内伊殉难是胜利象征,复仇之手已张开

伊朗革命卫队发布血性檄文:哈梅内伊殉难是胜利象征,复仇之手已张开

健身狂人
2026-03-01 10:58:21
17天14跌!开普云暴跌54%,重组告吹股民深套

17天14跌!开普云暴跌54%,重组告吹股民深套

财经智多星
2026-03-01 11:15:50
哈梅内伊遇袭身亡,全球30%海运命悬一线,油价、黄金如何走?

哈梅内伊遇袭身亡,全球30%海运命悬一线,油价、黄金如何走?

雪球
2026-03-01 13:37:51
五角大楼怒了!F-35首席教官去中国打工,难怪我军总能逮个正着

五角大楼怒了!F-35首席教官去中国打工,难怪我军总能逮个正着

书纪文谭
2026-02-28 16:48:05
刚刚 | 退钱了!有人退了3万多!

刚刚 | 退钱了!有人退了3万多!

天津广播
2026-03-01 08:20:12
三节落后6分,中国男篮要悬了!内外线被打爆,郭士强用人被质疑

三节落后6分,中国男篮要悬了!内外线被打爆,郭士强用人被质疑

侃球熊弟
2026-03-01 17:19:54
中华人民共和国正式向全世界宣告两件大事:

中华人民共和国正式向全世界宣告两件大事:

百态人间
2026-02-28 15:25:01
推翻阿萨德一年后,叙利亚人后悔了吗?看看百年前的新疆就懂了

推翻阿萨德一年后,叙利亚人后悔了吗?看看百年前的新疆就懂了

知识TNT
2026-02-28 12:25:03
她在非诚勿扰上站五年,爆灯无数却不牵手,最终被主持人赶下台

她在非诚勿扰上站五年,爆灯无数却不牵手,最终被主持人赶下台

琴声飞扬
2026-02-22 15:21:45
国际快评:美国为何执意将战争准星瞄准伊朗?

国际快评:美国为何执意将战争准星瞄准伊朗?

中国青年报
2026-02-28 17:39:07
专家解读伊朗遭袭后的反应:核心目的是对内有交代对外立姿态

专家解读伊朗遭袭后的反应:核心目的是对内有交代对外立姿态

南方都市报
2026-02-28 21:04:55
耗资12亿建世界最高佛,如今水喝不起拜不起

耗资12亿建世界最高佛,如今水喝不起拜不起

时光流转追梦人
2026-02-20 13:09:13
苏翊鸣谷爱凌参加表彰大会彼此不熟,都挺疲惫,快睡着了眼皮耷拉

苏翊鸣谷爱凌参加表彰大会彼此不熟,都挺疲惫,快睡着了眼皮耷拉

乐悠悠娱乐
2026-03-01 10:23:24
男子爬到何仙姑雕像头顶拍照,山东蓬莱阁景区回应:“八仙过海”石雕属于公共区域无人值守,后续会加强巡逻

男子爬到何仙姑雕像头顶拍照,山东蓬莱阁景区回应:“八仙过海”石雕属于公共区域无人值守,后续会加强巡逻

三湘都市报
2026-02-28 13:37:39
“手机将全面涨价”,冲上热搜

“手机将全面涨价”,冲上热搜

南方都市报
2026-02-27 14:31:12
英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

英媒爆出猛料:中国或违反联合国规定,运送超高音速导弹给伊朗!

快看张同学
2026-02-26 14:22:43
2026-03-01 17:36:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
130065文章数 861838关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

艺术
亲子
房产
手机
公开课

艺术要闻

2025第四届“精神·图式”——中国写意油画双年展 | 入选油画选刊

亲子要闻

一起长大的岁月,我们是彼此最甜蜜的负担,也是最坚实的依靠

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

手机要闻

小米卢伟冰官宣明日直播

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版