网易首页 > 网易号 > 正文 申请入驻

拧巴的扎克伯格

0
分享至

出品 | 虎嗅科技组

作者 | 房晓楠

编辑 | 苗正卿

头图 | 视觉中国

无疑,这几天AI圈最大的流量都被Meta承包了。

先是4月6日,迟迟不出手的Meta终于亮相,一举扔出包括Llama 4 Scout(109B)、Llama 4 Maverick (400B)和Llama 4 Behemoth在内的Llama 4套餐,凭借“原生多模态MoE架构”“性能超越DeepSeek V3”“1000万token上下文”等亮点,一路高举高打。业界也是喜闻乐见,“开源之光依旧能打”等声音持续不断,Llama 4出道即巅峰。

但没想到,紧接着负面声音层出不穷。

一方面,开发者在实际测评时发现,Llama 4的性能并没有官方宣扬的那样强大,甚至在代码、逻辑推理方面,远不如GPT-4o、DeepSeek R1 、 Gemini 2.5 pro。

另一方面,有自称Meta内部员工的人员爆料,Llama 4存在造假嫌疑,为了“赶工期”,在后训练阶段中,将多个benchmark测试集混入训练数据,以提升基准分数。甚至,技术负责人看不过去这样的造假行为,递交辞职报告。传闻一出,立即发酵,Meta陷入舆论风波中,各种声讨声不断。

一位大模型从业者在朋友圈发文称,“Meta的‘作弊’行为,让他想到2023年百模大战时期。”另有业内人士认为大模型和芯片不一样,一味追求跑分榜单意义不大,大模型的核心能力还是要放到业务场景中实战。

而经过一夜的舆论发酵,目前,Meta官方已正式做出回应,Llama 4不存在造假、打榜等行为,模型质量表现不一,是有充足的理由可以解释的,即“我们在模型一准备好就立即发布了,所以预计在各个平台的公开实现需要几天时间才能完全稳定下来”。

之后,Meta首席AI科学家Yann LeCun也转发澄清贴,表明Meta并不存在造假行为。

但是这番解释并没有让大家信服,根据澄清文,紧跟而来的疑点是,“如果模型还没有稳定下来,Meta为何急着发布?”

其实,关于这一点,答案很明显,Meta急了。

在Llama 4发布之前,Meta上一次发布新品还是在去年7月,发布Llama 3.1 405B模型,彼时DeepSeek仍处于蛰伏期,Meta风光无限,CEO扎克伯格也高调预告着已经处于开发中的Llama 4。

只是没想到,今年年初,DeepSeek凭借强大的多场景理解与内容生成能力成功“出圈”,AI圈的竞争格局瞬间改变,压力给到一众大模型企业,Meta自然也不例外。有消息称,当时Meta就意识到,相较于DeepSeek-V3,研发中的Llama 4 在各项测试中都比不过前者,于是研发进程一再被打乱。

一位业内人士告诉虎嗅,相传DeepSeek出来后,Meta便在内部设置了四个作战室,天天研究DeepSeek,思考该如何复现其模型能力。另外,这次Meta首次在Llama系列模型中采用MoE架构,或许也是出于这一路径早已被DeepSeek验证过。

但显然,Llama 4的性能表现并没有达到预期,即便是大手笔地用了20万的显卡集群。

其实,或许Meta的压力要来得更早一些。

在Llama 4 造假传闻出来后,虎嗅在向业内人士求证的过程中,得到的反馈大都是,“这很正常,Meta被逼急了,就只能去作弊了。”

一位业内人士告诉虎嗅,Llama的危机感并不是完全是因为年初DeepSeek出现才有的,这只是加速了这一认知,其实早从去年下半年开始,在开源上,Llama系列模型的影响力就大不如前了,开发者早早就达成一致,转向性能表现更好的Qwen系列和DeepSeek。

所以,在这次Llama 4发布之际,大家更多是抱着Meta将带来怎样的提升与改进,并非期待它真的能够颠覆DeepSeek,重新翻盘。

只是没想到,Meta不仅没有让大家看到它的进步,更是因为一些“迷惑”操作,让自己深陷造假风波。

而最新消息是,目前在社区内还有一些开发者在继续试图找出Meta造假的证据。

其实,不管这次Meta造假与否,已经没那么重要了,重点是,Llama系列模型已经无法再现昔日荣光是真的,Meta面临着巨大的信任危机是真的。如果说之前,Meta的压力与挑战还在于如何应对DeepSeek和Qwen带来的冲击,那么现在,如何针对Llama 4 存在的性能缺陷,早点修复Bug,重新夺回起开发者的信任,才是更为迫切的难题。

原本,这只是AI圈一场事先张扬的新品发布,没想到却一波三折,最终演变成一场“闹剧”,可想而知,这早已背离Meta的初衷。

不知道看到这样的结果,Meta是否会后悔,反正已经晚了,又何必在乎再晚一点,面对DeepSeek这样横空出世的“大魔王”,焦虑是正常的,如果老老实实交出一份诚心之作,即便再不如意,也不会像如今这般“惨淡收场”。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4216259.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贺娇龙离世仅3天,知情人曝其丈夫如今状态,字字戳大众心窝

贺娇龙离世仅3天,知情人曝其丈夫如今状态,字字戳大众心窝

仁慈的视角
2026-01-17 10:04:58
热身赛:成都蓉城1-3巴库石油工人,徐虹破门

热身赛:成都蓉城1-3巴库石油工人,徐虹破门

懂球帝
2026-01-17 10:54:32
别羡慕“秒睡”的人!医生提醒:“倒头就睡”可能是身体在报警

别羡慕“秒睡”的人!医生提醒:“倒头就睡”可能是身体在报警

人民日报健康客户端
2026-01-03 15:33:43
苏林主导!越共十四大下周开幕,最高权力结构将被重塑?

苏林主导!越共十四大下周开幕,最高权力结构将被重塑?

40度观察
2026-01-16 16:32:00
限期15天!泰国副总理下令全面审查泰中高铁施工安全

限期15天!泰国副总理下令全面审查泰中高铁施工安全

聚焦真实瞬间
2026-01-17 08:01:35
笑死!老公好像谈恋爱了,网友:婚后睁一只眼闭一只眼

笑死!老公好像谈恋爱了,网友:婚后睁一只眼闭一只眼

夜深爱杂谈
2026-01-16 19:32:04
袁世凯明明只当了83天皇帝,哪来75亿枚袁大头?还用了37年打造?

袁世凯明明只当了83天皇帝,哪来75亿枚袁大头?还用了37年打造?

大千世界观
2026-01-16 19:34:47
整整180天,那个敢炮轰以色列,弹打美国航母的男人再没出现过。

整整180天,那个敢炮轰以色列,弹打美国航母的男人再没出现过。

安安说
2026-01-12 14:15:45
“最热闹的地方都不一定能赚到钱了”,茶饮离规模天花板还有多远?

“最热闹的地方都不一定能赚到钱了”,茶饮离规模天花板还有多远?

蓝鲸新闻
2026-01-16 17:59:00
免税结束,车市“凉凉”?

免税结束,车市“凉凉”?

汽车公社
2026-01-15 08:43:51
霍震霆小儿媳首度出席霍家活动,打扮朴实识大体,陪着霍启仁社交

霍震霆小儿媳首度出席霍家活动,打扮朴实识大体,陪着霍启仁社交

翰林涛涛
2026-01-17 11:14:53
俄乌战争,击碎了多少“神一样的存在”

俄乌战争,击碎了多少“神一样的存在”

望岳
2026-01-12 20:36:38
聂卫平一生的三个妻子:一个得到爱,一个得到钱,还有一个最特别

聂卫平一生的三个妻子:一个得到爱,一个得到钱,还有一个最特别

好贤观史记
2026-01-16 11:32:24
朱元璋出巡时,遇到当年的地主:当年到你家要饭,为何给我馊饭?

朱元璋出巡时,遇到当年的地主:当年到你家要饭,为何给我馊饭?

五元讲堂
2025-11-06 10:41:50
媒体:多国空军排队购买枭龙战机

媒体:多国空军排队购买枭龙战机

财联社
2026-01-14 17:33:05
年前一个月,提醒大家:少囤米面油,多囤这3样,比米面油更重要

年前一个月,提醒大家:少囤米面油,多囤这3样,比米面油更重要

江江食研社
2026-01-16 10:30:10
廖汉生:妻舅是元帅,大舅哥是国家主席,晚年他拒绝当国家副主席

廖汉生:妻舅是元帅,大舅哥是国家主席,晚年他拒绝当国家副主席

墨说古今
2026-01-16 23:24:12
49年毛主席关键抉择:为汉字文脉按下“暂停键”避免一场文字浩劫

49年毛主席关键抉择:为汉字文脉按下“暂停键”避免一场文字浩劫

顾史
2025-12-19 19:30:46
前TVB男星前女友宣布切除子宫:谢谢自己果断勇敢

前TVB男星前女友宣布切除子宫:谢谢自己果断勇敢

TVB剧评社
2026-01-17 10:13:13
罗永浩“我能忍尽量忍”冲上热搜!西贝关店,恩怨背后是信任裂痕

罗永浩“我能忍尽量忍”冲上热搜!西贝关店,恩怨背后是信任裂痕

爱看剧的阿峰
2026-01-17 04:59:54
2026-01-17 12:31:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25618文章数 687326关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

牛弹琴:欧洲勃然大怒"大军"兵发格陵兰岛 特朗普感叹

头条要闻

牛弹琴:欧洲勃然大怒"大军"兵发格陵兰岛 特朗普感叹

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

徐家还是爱孩子的,在马筱梅生产前选择和解

财经要闻

贾国龙、罗永浩均被禁言,微博CEO回应

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

房产
时尚
旅游
家居
教育

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

旅游要闻

福州闽侯:湖畔的诗和远方

家居要闻

岁月柔情 现代品质轻奢

教育要闻

女老师连续旷工超十五天被解聘!事件背后的隐忧是什么

无障碍浏览 进入关怀版