网易首页 > 网易号 > 正文 申请入驻

Meta新模型要来了,Llama 4锅谁来接?1300多位作者联合报告来了

0
分享至

编辑|Panda

路透社最新消息,Meta 新成立的 AI 团队本月已在内部交付了首批关键模型。据悉,该消息来自 Meta 公司的 CTO Andrew Bosworth,他表示该团队的 AI 模型「非常好」(very good)。

媒体在去年 12 月报道称,Meta 公司正在开发一款代号为Avocado的文本 AI 模型,计划于第一季度发布;同时还在开发一款代号为Mango的图像和视频 AI 模型。Bosworth 并未透露哪些模型已交付内部使用。

有意思的是,就在这篇报道的前些天,一篇技术报告《Llama 4 家族:架构、训练、评估和部署说明》在 arXiv 悄然上线,其中全面回顾了 Meta Llama 4 系列模型宣称的数据和技术成就。



  • 报告标题:The Llama 4 Herd: Architecture, Training, Evaluation, and Deployment Notes
  • 报告地址:https://arxiv.org/abs/2601.11659v1

需要说明,上传这篇报告的作者是 Meta 一位机器学习工程师 Arthur Hinsvark,但这篇报告却并未明确标识来自 Meta。



尽管如此,这篇报告还是将 Llama 4 项目的所有参与者都加入到了作者名单中 —— 超过 1300 名,足足 5 页!因此,我们可以大体上认为这份报告就是来自 Llama 4 团队,尽管其中不少人现在已经从 Meta 离职,比如前 Meta FAIR 团队研究总监田渊栋。

值得注意的是,这篇报告的引言有一段明确说明:「本文档是对公开材料的独立调查。报告的基准数值归因于模型卡,除非另有说明;应将它们视为开发者报告的结果,并对评估工具、提示工程和后处理持通常的保留态度。」

也就是说,这篇报告整体回顾了 Meta 公布的各种 Llama 4 相关材料,尤其是其宣称的一些数据。但没有明确解释其在实际应用中表现明显不及预期的原因。想要了解相关背景的读者可参阅:

  • Meta Llama 4 被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
  • Llama 4 在测试集上训练?内部员工、官方下场澄清,LeCun 转发

不过,该报告也不是完全没有提到相关原因,仔细阅读的话,我们能在行文中看到一些端倪,其中主要的讨论点集中在部署限制和榜单争议上:

  • 架构能力与实际部署的差距(尤其是上下文长度):论文反复强调了一个「经常出现的操作主题」:模型的架构支持能力与实际服务中提供的能力之间存在差距。虽然 Scout 在架构上设计为支持 10M 上下文长度,但在实际部署中(如 Cloudflare 或 AWS),由于显存和 KV 缓存的硬件成本限制,服务商往往将可用上下文限制在 128K 或 1M。这意味着用户在实际使用托管服务时,可能无法体验到模型宣称的全部长上下文能力。
  • 榜单成绩与发布版本的差异:论文提到了关于 LMArena 排行榜的争议。Meta 在榜单上提交的 Maverick「实验性聊天」变体与公开发布的版本不完全相同。这导致了外界批评其「操纵基准测试」(gaming AI benchmarks)。这也解释了为什么用户使用公开发布版本时的体验可能与某些榜单上的高分表现不一致。
  • 营销话术与技术指标的区别:论文明确指出,发布公告中的某些声称(例如 Scout 是「同类最佳」或强调性价比)属于「面向营销的主张」(marketing-facing claims),应当与严谨的模型卡基准测试结果分开解读。

这些细节似乎暗示了这份报告是 Meta Llama 团队对于 Llama 4 系列模型备受社区广泛批评(数据亮眼但能力很差)的最终回应。

对于这些说明,不知道你怎么看?

具体到内容上,这篇技术报告的内容仅有 15 页,其中 1300 多位作者的名单就足足占了 5 页,再去掉一页参考文献,实际内容仅有 9 页。其中,Meta Llama 团队总结了:

  • 已发布的模型变体(Scout 和 Maverick)以及更广泛的系列模型背景,包括预览版的 Behemoth 教师模型;



  • 超越高级 MoE 描述的架构特征,涵盖路由 / 共享专家结构、早期融合多模态,以及针对 Scout 报告的长上下文设计元素(iROPE 和长度泛化策略);
  • 训练披露,跨越预训练、用于长上下文扩展的中期训练(mid-training),以及发布材料中描述的后训练方法(轻量级 SFT、在线 RL 和轻量级 DPO);
  • 开发者报告的基础和指令微调检查点的基准测试结果;
  • 在主要服务环境中观察到的实际部署限制,包括特定于提供商的上下文限制和量化打包。

此外,这份报告还总结了「与再分发和衍生命名相关的许可义务,并回顾了公开描述的安全措施和评估实践。其目的是为需要关于 Llama 4 精确、有来源依据事实的研究人员和从业者提供一份紧凑的技术参考。」

更多详情请参阅原报告。

https://www.reuters.com/technology/metas-new-ai-team-has-delivered-first-key-models-internally-this-month-cto-says-2026-01-21/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
400亿!恒大“东方威尼斯”,10万人疯抢到无人问津!彻底凉了?

400亿!恒大“东方威尼斯”,10万人疯抢到无人问津!彻底凉了?

GA环球建筑
2026-01-24 18:20:09
突发!美联储,大消息!

突发!美联储,大消息!

魏家东
2026-01-25 14:29:25
上海过江隧道突遭超高运输车闯入!隧道因大型风机坠落、多种设备损坏连夜封闭!官方连发通报

上海过江隧道突遭超高运输车闯入!隧道因大型风机坠落、多种设备损坏连夜封闭!官方连发通报

环球网资讯
2026-01-25 19:08:15
赢得尊重!日本队为亚军中国队列队+鼓掌 随后中国队也为对方列队

赢得尊重!日本队为亚军中国队列队+鼓掌 随后中国队也为对方列队

风过乡
2026-01-25 01:46:28
预亏21亿,闭店381家!曾硬刚沃尔玛,毛利94.7%的超市一哥亏麻了

预亏21亿,闭店381家!曾硬刚沃尔玛,毛利94.7%的超市一哥亏麻了

财经八卦
2026-01-25 18:49:14
官方:山西外援迪亚洛因做侮辱性手势被罚款3万,潘江罚款1万

官方:山西外援迪亚洛因做侮辱性手势被罚款3万,潘江罚款1万

懂球帝
2026-01-25 20:05:10
株洲杀猪宴失控后:警方介入,涉事村庄被贴上标签,邻居再爆猛料

株洲杀猪宴失控后:警方介入,涉事村庄被贴上标签,邻居再爆猛料

青橘罐头
2026-01-25 08:51:55
警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

特约前排观众
2026-01-25 00:20:06
美军“林肯”号航母打击群已抵达印度洋,F-15E战斗机、C-17运输机正在集结!以色列也正伺机攻击;伊朗:已做好应对最坏情况的准备

美军“林肯”号航母打击群已抵达印度洋,F-15E战斗机、C-17运输机正在集结!以色列也正伺机攻击;伊朗:已做好应对最坏情况的准备

每日经济新闻
2026-01-25 00:43:52
中央明确养老金改革方向,2026年公平养老迈出关键一步

中央明确养老金改革方向,2026年公平养老迈出关键一步

轻拂两袖风尘终
2026-01-25 15:33:50
若发生战争,什么食物能储存超过10年?以往的战争经历已揭晓答案

若发生战争,什么食物能储存超过10年?以往的战争经历已揭晓答案

芳芳历史烩
2026-01-24 21:05:35
记者:徐彬与中国U23在吉达告别,已正式启程前往英国迎接新挑战

记者:徐彬与中国U23在吉达告别,已正式启程前往英国迎接新挑战

懂球帝
2026-01-25 16:26:22
安东尼奥即将成为国奥主帅,两年后将挑战40年魔咒

安东尼奥即将成为国奥主帅,两年后将挑战40年魔咒

澎湃新闻
2026-01-25 14:07:05
腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

每日经济新闻
2026-01-25 19:55:05
1月25日俄乌:乌克兰“以牙还牙”,对等反击

1月25日俄乌:乌克兰“以牙还牙”,对等反击

山河路口
2026-01-25 17:22:34
被丈夫和闺蜜背叛女子回应“一夜白头”:一年打了13个官司,太耗费心血;很后悔托举丈夫

被丈夫和闺蜜背叛女子回应“一夜白头”:一年打了13个官司,太耗费心血;很后悔托举丈夫

扬子晚报
2026-01-25 17:36:27
贾国龙最新发声!“将回归一线,不再打造个人IP”

贾国龙最新发声!“将回归一线,不再打造个人IP”

每日经济新闻
2026-01-25 22:13:09
雷军无奈宣布:全部下架!

雷军无奈宣布:全部下架!

电动知家
2026-01-25 15:31:25
李湘的事儿大吗?

李湘的事儿大吗?

奖一罚十
2026-01-23 21:25:51
知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

知名制片人姜莹莹被腾讯解聘,移送公安局,给出的原因太恶劣!

一盅情怀
2026-01-25 15:54:20
2026-01-25 22:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12179文章数 142549关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

格陵兰岛官员喊话美国:别碰我们的矿产

头条要闻

格陵兰岛官员喊话美国:别碰我们的矿产

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

本地
房产
时尚
教育
军事航空

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

房产要闻

正式官宣!三亚又一所名校要来了!

看了鲁豫对章小蕙的采访,最大感触是这一点

教育要闻

教师投诉成功,成都锦江教育局发布情况通报

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版