网易首页 > 网易号 > 正文 申请入驻

720亿参数!华为首个开源大模型发布,用4000颗昇腾训练的

0
分享至


智东西
作者 李水青
编辑 云鹏

智东西6月30日报道,今日,华为首个开源大模型来了。70亿个参数的稠密模型“盘古Embedded 7B”、720亿个参数的混合专家模型“盘古Pro MoE”以及基于昇腾的模型推理技术,今日一齐开源。


基于4000颗昇腾NPU并行训练,激活参数量16B的盘古Pro MoE在MMLU、C-Eval、GSM8K等多种基准测试中,性能超越Qwen3-32B、GLM-Z1-32B等主流开源模型。其在昇腾800I A2上单卡推理吞吐性能可达1528 tokens/s,显著优于同等规模的320亿和720亿个参数的稠密模型。

目前,盘古Pro MoE 72B模型权重、基础推理码,以及基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。


▲盘古Pro MoE以及基于昇腾的模型推理技术的报告截图

技术报告地址:
https://arxiv.org/abs/2505.21411

模型下载地址:
https://gitcode.com/ascend-tribe/pangu-pro-moe-model

针对昇腾硬件优化的推理代码地址:
https://gitcode.com/ascend-tribe/ascend-inference-system

盘古Embedded 7B模型是一个引入“快思考”和“慢思考”双系统,简单问题用快速模式响应,复杂问题用深度模式推理,可自动切换。在数学、编程等多个基准测试中,盘古Embedded 7B性能超过了类似规模的Qwen3-8B、GLM4-9B等模型。

盘古7B相关模型权重与推理代码将于近期上线开源平台。


▲盘古Embedded 7B技术报告截图

技术报告地址:
https://arxiv.org/abs/2505.22375

此外,自5月19日起,华为分享了基于昇腾打造超大规模MoE模型推理部署最佳实践的技术报告,而从6月30日开始,这些技术报告相关的代码也会陆续开源出来。

一、盘古Pro MoE:基于昇腾NPU,16B激活参数比肩Qwen3-32B

混合专家模型(MoE)在大语言模型中逐渐兴起,但不同专家的激活频率在实际部署中存在严重的不均衡问题,导致系统效率低下。

为此,华为提出了如下新型的分组混合专家模型(Mixture of Grouped Experts, MoGE),它在专家选择阶段对专家进行分组,并约束token在每个组内激活等量专家,从而实现专家负载均衡,显著提升模型在昇腾平台的部署效率。

当模型执行分布在多个设备上时,这对于具有数百亿个参数的模型来说是必需的,MoGE架构设计可确保跨设备平衡的计算负载,从而显著提高吞吐量,尤其是在推理阶段。

基于MoGE架构,华为构建了总参数量720亿、激活参数量160亿的稀疏模型盘古Pro MoE模型,并针对昇腾300I Duo和800I A2平台进行系统优化。

在预训练阶段,华为使用了4000个昇腾NPU,在包含13万亿tokens的高质量语料库上进行预训练,分为通用、推理和退火三个阶段,逐步提升模型能力。

在后训练阶段,其通过监督微调(SFT)和强化学习(RL)进一步增强推理能力,还采用了检查点合并等技术优化模型。

最终,盘古Pro MoE在昇腾800I A2上实现了单卡1148 tokens/s的推理吞吐性能,并可进一步通过投机加速等技术提升至1528 tokens/s,显著优于同等规模的320亿和720亿个参数的稠密模型;在昇腾300I Duo推理服务器上,华为也实现了极具性价比的模型推理方案。

华为的研究表明,昇腾NPU能够支持盘古Pro MoE的大规模并行训练。多项公开基准测试结果表明,盘古Pro MoE在千亿内总参数模型中处于领先地位。

如下图所示,盘古Pro MoE在英语、中文及推理领域的多项能力测试中全面超越Gemma3-27B、Llama4-scout。在MMLU、C-Eval、GSM8K等多种基准测试中,盘古Pro MoE性能超越GLM-Z1-32B、Qwen3-32B等主流开源模型,展现了在多语言理解、推理等方面的领先能力。


二、盘古Embedded 7B:创新快慢思考双架构,测评超Qwen3-8B

当前,大语言模型普遍面临着巨大的计算成本和推理延迟挑战,这限制了它们的实际应用与部署。为此,华为推出盘古Embedded,一个在昇腾NPU上开发的开发的高效大语言模型推理器。

盘古Embedded的核心是一个具备“快思慢想”(fast and slow thinking)能力的双系统框架。该框架通过一个用于常规请求的“快思考”模式和一个用于复杂推理的“慢思考”模式,在延迟和推理深度之间实现了精妙的平衡。

此外,模型具备元认知能力,能够根据任务复杂度自动选择最优模式。华为通过一个创新的两阶段训练框架构建此模型,该框架融合了迭代蒸馏、模型合并以及由多源自适应奖励系统(MARS)引导的强化学习。

下图是Pangu Embedded训练管道的示意图。该管道包括两个主要阶段:第1阶段是基本推理器构建,第2阶段是在一个模型中实现快速和慢速思考。


基于该双系统框架,华为构建了盘古Embedded 7B模型,并在昇腾NPU平台上进行了深度系统优化。该模型在单一、统一的架构内实现了快速响应和高质量推理的灵活切换。

研究表明,仅有70亿个参数的盘古Embedded在AIME、GPQA等多个权威的复杂推理基准测试中,表现优于Qwen3-8B和GLM4-9B等规模相近的业界领先模型。这项工作展示了一条充满前景的技术路线:在保证模型推理能力达到业界顶尖水平的同时,实现其实用化、高效率的部署。


结语:基于自研昇腾NPU,创新大模型架构

华为在大模型领域的成果进展正在加快。此前6月20日,华为推出盘古大模型5.5系列五大基础模型,并推出医学、金融等五大盘古行业思考大模型;仅仅十天之后,华为又开源两款大模型。

盘古Pro MoE通过MoGE架构与昇腾NPU的协同设计,实现了高效的稀疏大语言模型训练与推理;盘古Embedded 7B则具备灵活切换快慢思考的能力,是大模型架构设计的创新。

此举是华为践行昇腾生态战略的又一关键举措,有望推动大模型技术的发展,也正改变大模型产业的开源格局。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全运会开幕!马琳担重任,樊振东陈梦孙颖莎登大屏,国乒迎大洗牌

全运会开幕!马琳担重任,樊振东陈梦孙颖莎登大屏,国乒迎大洗牌

小僫搞笑解说
2025-11-09 22:54:03
场均轰23分22板!女篮又杀出一超级内线:张子宇都被她抢了风头?

场均轰23分22板!女篮又杀出一超级内线:张子宇都被她抢了风头?

篮球快餐车
2025-11-09 06:41:19
国安解散中超脸往哪放?媒体人:只要很多人不希望它散,就不会散

国安解散中超脸往哪放?媒体人:只要很多人不希望它散,就不会散

茜子足球
2025-11-09 15:39:37
玄学提醒:转运的最好方式——避旧

玄学提醒:转运的最好方式——避旧

诗词中国
2025-11-06 19:39:48
詹姆斯·沃森去世,因发现“DNA双螺旋结构”享誉世界,晚年宣称“黑人因基因智力低”而饱受争议

詹姆斯·沃森去世,因发现“DNA双螺旋结构”享誉世界,晚年宣称“黑人因基因智力低”而饱受争议

生物世界
2025-11-08 08:11:39
十五运会广州限行适应期结束,首次违法不免罚!出行提醒公布

十五运会广州限行适应期结束,首次违法不免罚!出行提醒公布

南方都市报
2025-11-09 12:00:05
出卖1000多名同志,却活到74岁的蔡孝乾,为何至今没有被清算?

出卖1000多名同志,却活到74岁的蔡孝乾,为何至今没有被清算?

报君知史
2025-10-20 11:19:06
这两位少将任省委书记,被提拔到军委工作,主席:地方职务不能免

这两位少将任省委书记,被提拔到军委工作,主席:地方职务不能免

大运河时空
2025-11-09 12:00:03
人前光鲜人后心酸!深圳台主持董超49岁离职,如今转行当网红谋生

人前光鲜人后心酸!深圳台主持董超49岁离职,如今转行当网红谋生

揽星河的笔记
2025-11-07 20:16:16
周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

周末信息如何影响市场?明天是红色星期一?还是黑色星期一?

春江财富
2025-11-09 09:23:07
东莞全面整治违法停车,最高罚款200元!

东莞全面整治违法停车,最高罚款200元!

刘哥谈体育
2025-11-07 02:26:11
被特朗普逼到墙角!泰国国王动身访华,柬埔寨把黄金大批运来深圳

被特朗普逼到墙角!泰国国王动身访华,柬埔寨把黄金大批运来深圳

白浅娱乐聊
2025-11-09 09:24:10
德约官宣退出年终总决赛:连续两年因伤缺席 刚夺生涯第101冠

德约官宣退出年终总决赛:连续两年因伤缺席 刚夺生涯第101冠

醉卧浮生
2025-11-09 09:27:21
张国荣真正死因曝光!向太:根本没抑郁症,本来能活,男友不让救

张国荣真正死因曝光!向太:根本没抑郁症,本来能活,男友不让救

八斗小先生
2025-09-08 14:05:28
董璇一家三口与关悦一家三口合影,网友:佟丽娅儿子有竞争对手了

董璇一家三口与关悦一家三口合影,网友:佟丽娅儿子有竞争对手了

鑫鑫说说
2025-11-08 11:43:50
吊打一众大陆旅美球员!中国台湾后卫NCAA首秀爆砍29分!

吊打一众大陆旅美球员!中国台湾后卫NCAA首秀爆砍29分!

田先生篮球
2025-11-09 18:31:17
特朗普:中国有一个就够了,我绝不允许有人将纽约变成另一个!

特朗普:中国有一个就够了,我绝不允许有人将纽约变成另一个!

基斯默默
2025-11-09 19:05:20
二叔欺压了我父母一辈子,当他去医院透析想暂住我家时,被我拒绝

二叔欺压了我父母一辈子,当他去医院透析想暂住我家时,被我拒绝

荷兰豆爱健康
2025-11-09 12:25:35
靠关系的人睡不着了!翻旧账倒查20年,该给市场重新立规矩了!

靠关系的人睡不着了!翻旧账倒查20年,该给市场重新立规矩了!

夜深爱杂谈
2025-11-08 22:34:17
换了领导人,就马上跟美国签署“毒丸条约”,中马关系翻天巨变!

换了领导人,就马上跟美国签署“毒丸条约”,中马关系翻天巨变!

南宫一二
2025-11-09 15:38:50
2025-11-10 01:00:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10714文章数 116894关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

游戏
手机
教育
艺术
家居

尺度太大被迫降级16+?灵笼团队做了款剧情演出降维打击的二游

手机要闻

曝直板iPhone手机屏下摄像头规划2027年上线,预计采用3D屏下人脸识别

教育要闻

收藏!2026艺术类文化课录取分数线要求

艺术要闻

探索风情万种的高级美,优雅与野性并存!

家居要闻

现代自由 功能美学居所

无障碍浏览 进入关怀版