网易首页 > 网易号 > 正文 申请入驻

Meta 憋了 9 个月的大招揭晓了

0
分享至


出品|虎嗅科技组
作者|赵致格
编辑|苗正卿
头图|视觉中国

在大模型赛道沉寂已久的Meta终于冒头了。

4月9日,Meta旗下的超级智能实验室(Meta Superintelligence Labs, MSL)突然官宣了首款自研大模型Muse Spark。目前,这款模型已在meta.ai网站和Meta AI App上线,API预览版向部分用户开放。受到这一好消息的提振,Meta股价当日一度大涨近9%,创下自今年1月以来最大单日涨幅。截至收盘,Meta股价收涨6.5%。

Meta在博客文章中表示:“过去九个月,MSL从零重建了我们的 AI 技术体系,开发速度超越以往任何周期。这款初始模型设计小巧、运行高效,却足以推演科学、数学与健康领域的复杂问题。它是强大的基础,下一代模型已在研发中。”

一年之前,Meta的开源大模型Llama4一经发布就迅速陷入造假争议。网友实测后发现Llama4的性能远不如官方给出的数据。在几个月后离职的Meta前首席科学家杨立昆(LeCun)也对媒体曝光了内幕,称Llama4团队在不同测试中换上了不同版本的模型来凑数。

而被骗的扎克伯格则开始了对AI团队的大破大立,一边对原团队大幅度裁员,一边为新成立的超级智能实验室启动科技史上堪称最激进的人才招募计划,不惜一切代价挖掘行业领袖,收购技术精英团队。

其中最引人瞩目的一笔支出无疑是Meta斥资143亿美元收购数据标注公司Scale AI近49%股权,并任命其联合创始人汪滔(Alexandr Wang)为首席人工智能官,负责领导MSL的工作。

Meta在同时期延揽的技术精英还包括前苹果基础模型团队(AFM)负责人庞若明,来自OpenAI的大型语言模型专家Trapit Bansal、强化学习权威Shuchao Bi,从事多模态AI研发的Allan Jabri和Lu Liu;来自DeepMind的机器学习先驱Jack Rae和图像生成顶尖专家Huiwen Chang;还有Claude核心开发者Anton Bakhtin和推理系统专家Joel Pobar等等。

Meta显然是不差人也不差钱,但在此前的9个月里,Meta自研大模型的进度一直在云里雾里。只有在Meta财报会议和扎克伯格的部分采访中,人们才知道了这个代号牛油果的新模型的少量消息。今年3月,一度有传言称汪滔因为大模型进度迟缓而离职,但Meta很快进行了辟谣。

一边是其他科技大厂以稳健的姿态高频进行着大模型的版本更新,一边是MSL团队在长达9个月的时间里闭门炼丹,汪滔和他的团队显然承担了不小的压力。

随着Muse Spark的空降发布,汪滔看上去心情无比释放,先是在X上连发8条消息介绍Muse Spark,并将其在BenchMark上的各项分数置顶,随后又转发了50多条消息,其中有团队成员的感言,有科技媒体的报道,也有不少普通网友的夸赞。


如果要总结这个让Meta基本满意的新模型水平,可以说它终于摆脱了Llama4“遥遥落后”的局面,综合表现挤进了全球大模型的第一梯队。

第三方评测机构Artificial Analysis给Muse Spark综合智能指数的打分是52分,低于57分的Gemini3.1、57分的GPT5.4和53分的Claude Opus4.6,排名全球第四。而此前Llama4的评分仅为18分。


如果分开看Muse Spark在不同领域的评分,可以看出Muse Spark在考验高难度专业知识的Humanity’s Last Exam with tools(HLE,人类最后的考试)中分数仅为50.4,在五个主流前沿大模型中排名最末。

Muse Spark在考察AI的纯视觉抽象推理的ARC AGI 2中同样表现较差,分数为42.5,而在这一测试中表现最好的Gemini3.1Pro的分数为76.5,两者差距明显。

Muse Spark另一个相对而言的短板是编程能力,这一点Meta也在博客中承认,称Muse Spark在长时序agentic系统和编程工作流方面仍有差距”。在LiveCodeBench Pro中,Muse Spark 80分的成绩远低于GPT-6.4的87.5;在接近实战的Terminal-Bench 2.0(终端编程)中,Muse Spark 的59分低于GPT5.4的75.1。


Muse Spark也有一些优势明显的领域。在在HealthBench Hard(开放式健康问答)的测试中,Muse Spark得分42.8,大幅领先于GPT-5.4的40.1、Gemini 3.1 Pro的20.6和Opus 4.6的14.8。Meta在博文中也特意提到了其新模型在医疗领域具有较强应用潜力。Meta称自己与超过1000名医生合作,对模型进行训练以生成有关营养和运动等主题的更详细回答。可以说,健康是Meta AI团队当下押注的方向。

在CharXiv Reasoning(图表科学推理)测试中,Muse Spark以86.4分同样领先其他4位竞争对手,这显示其强大的多模态信息提取与逻辑推理能力,尤其擅长处理科学论文图表等复杂信息。

除了不错的综合表现,人们关注另一个点是,曾经把Llama系列向开发者全面开放的Meta此次选择了闭源。很多人评论称Meta已经背离了其“开放科学”的初衷。

汪滔在X上对此进行了回应,称“九个月前我们从零开始重写了AI技术栈,全新基础设施、全新架构、全新数据 pipeline……这只是第一步,更大模型已在研发中,未来版本计划开源。”

我们不知道汪滔承诺的“未来会开源”是否能兑现。但前期为大模型研发投入巨资的Meta显然已经在探索AI模型的营利方式了。

目前,仅未具名的“特定合作伙伴”可使用Muse Spark的“私有 API 预览版”,但Meta计划未来向更广泛用户提供付费 API 访问。此外,Meta称该模型是 “为全产品生态量身打造”,未来几周将接入Meta旗下的Facebook、Instagram、WhatsApp以及智能硬件。

此外,Meta 还宣布将会推出Muse Spark的购物模式,大模型可以根据用户在Instagram、Facebook上关注的内容和品牌偏好做个性化的购物推荐。

或许Meta当下的核心思路是,相较于开源赚的声誉,用大模型盈利以及用大模型更好地服务自己的30亿用户更重要。9个月前,Meta在MSL实验室成立时还在聊AGI的理想,现在的Meta更关心如何让大模型渗透进社交、购物、医疗、硬件等真实场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
断更三年!潘石屹突然发声:我命由我

断更三年!潘石屹突然发声:我命由我

新浪财经
2026-04-07 22:44:05
开药收15元挂号费引争议?卫健委明确:单纯开药别挂普通号!

开药收15元挂号费引争议?卫健委明确:单纯开药别挂普通号!

今朝牛马
2026-04-09 17:22:11
全球能源咽喉再关闭油轮紧急返航,美媒曝超级油轮过海峡需缴200万美元,伊朗每天允许不超过15艘船只通过霍尔木兹海峡

全球能源咽喉再关闭油轮紧急返航,美媒曝超级油轮过海峡需缴200万美元,伊朗每天允许不超过15艘船只通过霍尔木兹海峡

每日经济新闻
2026-04-09 23:24:00
美国FCC拟全面封杀中国实验室!中方回应

美国FCC拟全面封杀中国实验室!中方回应

芯智讯
2026-04-09 20:01:03
大疆创始人汪滔:脱离钱谈激励都是PUA 大疆离职潮几乎全部创业

大疆创始人汪滔:脱离钱谈激励都是PUA 大疆离职潮几乎全部创业

快科技
2026-04-09 16:58:10
15年后,全网封神的“犀利哥”程国荣,早已死在了那场流量狂欢里

15年后,全网封神的“犀利哥”程国荣,早已死在了那场流量狂欢里

杰丝聊古今
2026-04-05 18:52:02
0-3!1-3!意甲欧战或全军覆没 两队遭英超打爆 联赛国家队全崩塌

0-3!1-3!意甲欧战或全军覆没 两队遭英超打爆 联赛国家队全崩塌

我爱英超
2026-04-10 07:53:10
港媒关注辱骂全红婵聊天记录取证问题:群内牵涉人员均未作出回应

港媒关注辱骂全红婵聊天记录取证问题:群内牵涉人员均未作出回应

杨华评论
2026-04-09 17:10:05
长沙县城市管理局原副局长柳检军被查

长沙县城市管理局原副局长柳检军被查

三湘都市报
2026-04-09 17:20:13
SpaceX去年营收超185亿美元,亏损近50亿美元

SpaceX去年营收超185亿美元,亏损近50亿美元

界面新闻
2026-04-10 08:27:09
3-1!0-3!疯狂一夜,维拉掀翻博洛尼亚,塞尔塔惨败,波尔图战平

3-1!0-3!疯狂一夜,维拉掀翻博洛尼亚,塞尔塔惨败,波尔图战平

足球狗说
2026-04-10 05:10:46
1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

鉴史录
2026-04-09 20:22:15
条条大路通罗马!不当明星的文章,在上海开饭店,女儿也为他宣传

条条大路通罗马!不当明星的文章,在上海开饭店,女儿也为他宣传

揽星河的笔记
2026-04-09 17:36:27
广东3消息!赞助商力撑杜锋,跟队记者披露新大外,焦泊乔新进展

广东3消息!赞助商力撑杜锋,跟队记者披露新大外,焦泊乔新进展

多特体育说
2026-04-09 23:18:22
吃完了宴席,两岸在上海谈妥,对赖清德改了称呼,郑丽文一锤定音

吃完了宴席,两岸在上海谈妥,对赖清德改了称呼,郑丽文一锤定音

影孖看世界
2026-04-09 19:54:02
上海交大发现:不吃酱油和味精的人,血压马上就降低了?真的吗?

上海交大发现:不吃酱油和味精的人,血压马上就降低了?真的吗?

健康科普365
2026-04-07 09:16:10
女王刘诗诗深藏不露,居家瑜伽照,这腰臀比谁顶得住?

女王刘诗诗深藏不露,居家瑜伽照,这腰臀比谁顶得住?

娱乐领航家
2026-04-09 21:30:03
恭喜俄罗斯和乌克兰!打了1500天,终于打成全世界都喜欢的样子!

恭喜俄罗斯和乌克兰!打了1500天,终于打成全世界都喜欢的样子!

温读史
2026-04-08 17:38:05
陈丽华葬礼曝光!林大庆点破迟重瑞的真实处境,大儿子也在场送别

陈丽华葬礼曝光!林大庆点破迟重瑞的真实处境,大儿子也在场送别

糖逗在娱乐
2026-04-09 22:58:48
被打服就买他!皇马砸 1.6 亿欧强挖拜仁杀神,弗洛伦蒂诺钦点

被打服就买他!皇马砸 1.6 亿欧强挖拜仁杀神,弗洛伦蒂诺钦点

奶盖熊本熊
2026-04-10 05:33:07
2026-04-10 09:23:01
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
516文章数 8131关注度
往期回顾 全部

科技要闻

程序员惊喜,每月100美元!OpenAI推新套餐

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

AI短剧"买脸"成风 肖像生意成灰色产业

汽车要闻

文飞掌舵,给神行者带来了什么?

态度原创

时尚
本地
亲子
教育
公开课

越来越流行的松弛感穿搭,照着穿就很好看

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

亲子要闻

春季身高猛涨期,孩子必吃这十道菜!

教育要闻

时代已变,孩子学习不好,未来可能反而吃香

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版