网易首页 > 网易号 > 正文 申请入驻

Meta推出多模态推理模型Muse Spark,医疗问答能力领先同类产品

0
分享至


Meta Platforms今日发布了一款全新推理模型Muse Spark,该模型在回答健康类问题及分析多模态数据方面表现尤为出色。

未来几周内,Meta将把这一算法逐步部署至面向消费者的Meta AI服务中。与此同时,Muse Spark也将通过应用程序编程接口(API)向开发者开放,目前该API处于私有预览阶段。

Meta表示,Muse Spark在多项基准测试中的表现超越了Claude 4.6 Opus、Gemini 3.1 Pro和GPT 5.4。其中一项测试为HealthBench Hard,专门用于衡量AI模型回答医学问题的能力。Muse Spark的得分比排名第二的GPT 5.4高出逾2个百分点。

该模型的出色表现,部分源于Meta在逾1000名医生的协助下整理编制的临床训练数据集。这一数据集是公司对AI开发流程进行全面升级的重要成果之一。据这家Facebook母公司介绍,其工程师还对模型架构及训练后工作流程进行了优化改进。

Meta在今日发布的博客文章中表示:"与我们的上一代模型Llama 4 Maverick相比,我们仅需不到其十分之一的算力,便能达到相同的能力水平。这一进步也使Muse Spark相较于目前主要的可比基础模型,在效率上具备显著优势。"

科学图表分析是Muse Spark另一项领先竞品的能力。在CharXiv Reasoning这一由技术图表构成的基准数据集上,Muse Spark的表现超越了Opus 4.6及其他竞争模型。这种视觉推理能力同样适用于更广泛的应用场景——用户可以在Meta AI应用中上传一张超市货架的照片,并让模型估算每种食品的卡路里含量。

Meta还对Muse Spark进行了另外十余项基准测试。在许多测试中,其得分与Opus 4.6、Gemini 3.1 Pro和GPT 5.4相差无几,且在多项评估中均领先于至少一款竞争模型。这些基准测试涵盖代码生成、机器人导航和工具调用等多个应用场景。

Muse Spark还可通过开启"深思模式(Contemplating mode)"来提升输出质量。该功能会同时启动多个AI智能体,将任务分解为若干子步骤并行处理。Meta表示,这项技术使Muse Spark在HLE这一AI领域公认的最难基准测试之一上的得分提升了约8%。

Muse Spark是Meta规划中的系列多模态推理模型中的首款产品。Meta在今日的博客文章中写道:"我们正处于可预期且高效的规模扩展轨道上,期待很快向外界分享在通往个人超级智能道路上能力日益增强的系列模型。"

Q&A

Q1:Muse Spark在医疗健康方面有什么突出表现?

A:Muse Spark在HealthBench Hard基准测试中表现优异,该测试专门衡量AI模型回答医学问题的能力。Muse Spark的得分比排名第二的GPT 5.4高出逾2个百分点。这一成绩部分得益于Meta联合逾1000名医生共同编制的临床训练数据集,使模型在医疗问答领域具备较强的专业能力。

Q2:Muse Spark的"深思模式"是什么,有什么作用?

A:深思模式(Contemplating mode)是Muse Spark的一项可选功能,开启后会同时启动多个AI智能体,将复杂任务拆解为若干子步骤并行处理,从而提升输出质量。根据Meta的测试数据,该模式使Muse Spark在AI领域公认的高难度基准测试HLE上的得分提升了约8%,有效增强了模型面对复杂任务时的推理表现。

Q3:Muse Spark和上一代模型Llama 4 Maverick相比效率提升了多少?

A:根据Meta的官方说法,Muse Spark仅需Llama 4 Maverick不到十分之一的算力,便能达到相同的能力水平。这意味着在计算资源消耗方面实现了数量级的大幅降低,使Muse Spark相较于目前市场上主要的可比基础模型在运行效率上具备显著优势。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
凌晨紧急出面澄清!刘晓庆翻车真相终于藏不住了

凌晨紧急出面澄清!刘晓庆翻车真相终于藏不住了

科学发掘
2026-05-04 10:04:41
五一酒店,压不住的涨价潮?

五一酒店,压不住的涨价潮?

蓝鲸新闻
2026-05-03 20:29:35
一张生活照被盗篡改之后,“AI造黄”受害者如何维权?|封面深镜

一张生活照被盗篡改之后,“AI造黄”受害者如何维权?|封面深镜

封面新闻
2026-05-03 13:04:03
950公里!比亚迪“大块头”:25万起

950公里!比亚迪“大块头”:25万起

手机评测室
2026-05-04 11:49:50
吵了3天!刘晓庆凌晨紧急发文澄清,翻车真相藏不住了

吵了3天!刘晓庆凌晨紧急发文澄清,翻车真相藏不住了

小椰的奶奶
2026-05-04 14:29:44
女子因有洁癖,结婚19年没有和丈夫发生性关系,丈夫花钱让她怀孕

女子因有洁癖,结婚19年没有和丈夫发生性关系,丈夫花钱让她怀孕

西楼知趣杂谈
2026-04-30 11:07:08
上映仅一天丢掉冠军,观众口碑一般,《寒战1994》10亿票房梦碎了

上映仅一天丢掉冠军,观众口碑一般,《寒战1994》10亿票房梦碎了

影视高原说
2026-05-02 14:18:15
小米高端机清仓让路,16GB+512GB直降2410元,2K屏+徕卡+6100mAh

小米高端机清仓让路,16GB+512GB直降2410元,2K屏+徕卡+6100mAh

北境不忘
2026-05-04 14:02:37
1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

1976年播报毛主席讣告,播音员念完三遍后突然冒出一句话,全国都慌了

文史明鉴
2026-03-25 19:14:13
亚太股市全线上涨,港股大涨,韩国综指再创新高,美股期指拉升!

亚太股市全线上涨,港股大涨,韩国综指再创新高,美股期指拉升!

丁丁鲤史纪
2026-05-04 11:29:01
大小差不多,和车灯比圆,姐是不是太凶了?

大小差不多,和车灯比圆,姐是不是太凶了?

飛娱日记
2026-05-04 09:16:37
国产游戏《异环》被外媒喷太涩!玩家怒喷其双标

国产游戏《异环》被外媒喷太涩!玩家怒喷其双标

游民星空
2026-05-04 11:19:13
家花不如野花香?抛弃妻女娶小三,如今过成这样只能算他“该”

家花不如野花香?抛弃妻女娶小三,如今过成这样只能算他“该”

素衣读史
2026-05-03 20:17:16
有哪些东西,已经贵到不值得买了?网友评论:很炸裂!

有哪些东西,已经贵到不值得买了?网友评论:很炸裂!

荷兰豆爱健康
2026-05-04 09:56:22
沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

沉默45年,中国第二轮"严打"终于来了!目标改变总体战正式打响

细说职场
2026-05-03 15:37:43
医保人社合并,2026医院迎大变局

医保人社合并,2026医院迎大变局

朗威谈星座
2026-05-03 20:24:38
世乒赛|王楚钦空砍两分却难觅帮手,国乒男队遭遇连败,竟然沦为小组第三

世乒赛|王楚钦空砍两分却难觅帮手,国乒男队遭遇连败,竟然沦为小组第三

文汇报
2026-05-04 04:06:39
每年花15亿,才买了一张门票!赖清德皱巴的裤子,成国际笑话

每年花15亿,才买了一张门票!赖清德皱巴的裤子,成国际笑话

消失的电波
2026-05-03 18:14:18
双向奔赴!陕西一村免费摘樱桃,游客损坏村民物品主动赔偿 ,村里退款未果后送礼物

双向奔赴!陕西一村免费摘樱桃,游客损坏村民物品主动赔偿 ,村里退款未果后送礼物

潇湘晨报
2026-05-04 14:43:10
菲律宾:决定将副总统莎拉·杜特尔特弹劾案提交全体会议表决;此前海牙国际刑事法院称将以3项所谓“反人类罪”罪名对81岁杜特尔特进行审判

菲律宾:决定将副总统莎拉·杜特尔特弹劾案提交全体会议表决;此前海牙国际刑事法院称将以3项所谓“反人类罪”罪名对81岁杜特尔特进行审判

鲁中晨报
2026-05-04 14:49:12
2026-05-04 15:03:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
18162文章数 49702关注度
往期回顾 全部

科技要闻

OpenAI“复活”了QQ宠物,网友直接玩疯

头条要闻

媒体:见东南亚请求中国卖石油 日本罕见向俄罗斯购买

头条要闻

媒体:见东南亚请求中国卖石油 日本罕见向俄罗斯购买

体育要闻

骑士破猛龙:加雷特·阿伦的活力

娱乐要闻

严浩翔新歌,父母离婚17年矛盾升级

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

家居
数码
艺术
手机
公开课

家居要闻

灵动实用 生活艺术场

数码要闻

Steam 2026年4月软硬件调查报告发布:RTX 5050显卡首次单独列出

艺术要闻

奥托·冯·托伦:19世纪奥地利著名动物/风景画家

手机要闻

OPPO Reno16系列预热:新一代实况神机来了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版