网易首页 > 网易号 > 正文 申请入驻

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载

0
分享至

IT之家 10 月 16 日消息,今年 9 月,华为盘古 718B 大模型凭借不堆数据、专注思考的训练哲学,在 SuperCLUE 榜单中一举冲至开源模型第三,成为业界焦点。

华为官方昨日宣布,openPangu-Ultra-MoE-718B-V1.1 正式在 GitCode 平台开源,模型权重与技术细节全面公开。

  • 硬件要求:Atlas 800T A2 (64GB,>=32 卡),支持裸机或 Docker 部署。
  • 特色功能:通过 / no_think 标记切换快慢思考模式,支持多轮工具调用。

华为官方介绍称,openPangu-Ultra-MoE-718B-V1.1 是基于昇腾 NPU 训练的大规模混合专家(MoE)语言模型,总参数规模达 718B,激活参数量为 39B。该模型在同一架构下融合了“快思考”与“慢思考”两种能力,实现更高效、更智能的推理与决策。

在 9 月最新 SuperCLUE 榜单中,openPangu-718B 稳居开源模型总榜第三,在数学推理、科学推理、代码生成等六大核心维度均表现优异。尤其值得关注的是,其幻觉控制项得分高达 81.28,甚至超过部分闭源巨头,凸显出其在输出可靠性上的技术优势。

相比上一版本 openPangu-Ultra-MoE-718B-V1.0,V1.1 在 Agent 工具调用能力上显著增强,幻觉率进一步降低,模型的综合表现与稳定性也全面提升。

华为采用了业界先进的 Multi-head Latent Attention(MLA)、Multi-Token Prediction (MTP) 以及高稀疏比混合专家架构,并在此基础上引入多项创新设计,以实现更优的性能与训练效率:

  • Depth-Scaled Sandwich-Norm 与 TinyInit:通过改进层归一化结构和参数初始化方式,显著提升模型训练的稳定性与收敛速度。
  • 基于 EP-Group 的负载均衡策略:优化负载均衡损失函数,有效增强专家路由的分布均衡性,提升专家特化与协同能力。

本次开源的 V1.1 版本在多个关键维度实现显著提升:

  • 综合能力优化:在 MMLU-Pro、GPQA 等高难度测评中,快慢思考双模式成绩全面超越 V1.0;
  • 幻觉率大幅降低:通过“批判内化”机制,幻觉率从 V1.0 的 10.11% 降至 3.85%(快思考模式);
  • 工具调用能力增强:升级 ToolACE 框架,在 Tau-Bench 等多工具协同任务中表现亮眼;
  • 首推 Int8 量化版本:显存占用减少约一半,吞吐提升 20%,精度损失不足 1%。

IT之家附官方地址:

  • 模型地址:https://ai.gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1
  • Int8 量化版本:https://gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1-Int8

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
袁立,早日康复!

袁立,早日康复!

胖胖说他不胖
2026-05-24 20:30:58
美防长注定无功而返,中国防长缺席香会,中国要让美明白一个道理

美防长注定无功而返,中国防长缺席香会,中国要让美明白一个道理

九天揽月1
2026-05-31 07:24:56
真要退出?曝怀特塞德缺席剩余总决赛,名记给出原因,G3或见分晓

真要退出?曝怀特塞德缺席剩余总决赛,名记给出原因,G3或见分晓

萌兰聊个球
2026-05-30 11:27:36
恩里克:我们可以谈论三连冠的话题,因为俱乐部配得上这一切

恩里克:我们可以谈论三连冠的话题,因为俱乐部配得上这一切

懂球帝
2026-05-31 06:05:08
如果不是秦八娃长得特别丑,我认定他就是《主角》作者陈彦本人

如果不是秦八娃长得特别丑,我认定他就是《主角》作者陈彦本人

周哥一影视
2026-05-30 14:59:42
中山大学通报处理两位杰青,期刊改革迫在眉睫

中山大学通报处理两位杰青,期刊改革迫在眉睫

手工制作阿爱
2026-05-31 00:42:56
真人秀女星自曝尴尬事:撞破15岁儿子初夜,还被男星装不认识

真人秀女星自曝尴尬事:撞破15岁儿子初夜,还被男星装不认识

追星雷达站
2026-05-30 00:38:44
人口告别世界第一?催生“二孩”无效后,国家终于向住房出手了!

人口告别世界第一?催生“二孩”无效后,国家终于向住房出手了!

乐天闲聊
2026-05-30 11:51:44
正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

健康科普365
2026-05-09 21:05:04
11连胜杀入总决赛,但史上最强?

11连胜杀入总决赛,但史上最强?

星河漫山野
2026-05-31 02:03:38
赖清德,极有可能是1949年以来,唯一在任上出事的台湾地区领导人

赖清德,极有可能是1949年以来,唯一在任上出事的台湾地区领导人

混沌录
2026-05-19 19:56:10
法网女单八强产生,Top10中三人出局,中国金花成黑马

法网女单八强产生,Top10中三人出局,中国金花成黑马

五姑娘说体育
2026-05-30 08:09:55
穆里尼奥第一把火!清洗皇马头号巨星 姆巴佩或转投英超豪门

穆里尼奥第一把火!清洗皇马头号巨星 姆巴佩或转投英超豪门

澜归序
2026-05-30 04:54:14
三小时鏖战,他把胜利献给天上的父亲

三小时鏖战,他把胜利献给天上的父亲

温柔且自由
2026-05-31 00:02:37
美国AI巨头叛变:Claude最新模型一开口:我是DeepSeek

美国AI巨头叛变:Claude最新模型一开口:我是DeepSeek

快科技
2026-05-29 19:34:12
震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

震惊!贵州大学招聘岗位限配偶条件,被质疑“萝卜岗”,评论炸锅

火山詩话
2026-05-28 15:07:01
厄德高:我们会陪着加布,没他和拉亚我们走不到今天这个位置

厄德高:我们会陪着加布,没他和拉亚我们走不到今天这个位置

懂球帝
2026-05-31 07:18:16
女子曝光公路上晒粮食,仅留中间小道通过,河南网友被骂惨了!

女子曝光公路上晒粮食,仅留中间小道通过,河南网友被骂惨了!

谭谈社会
2026-05-30 16:49:46
建议女人,吃好比穿好更重要,3种食物要常吃,内外状态好才漂亮

建议女人,吃好比穿好更重要,3种食物要常吃,内外状态好才漂亮

江江食研社
2026-05-30 06:30:12
演员林沐然中戏转入湖南艺术职业学院引热议,工作室:已全面停止

演员林沐然中戏转入湖南艺术职业学院引热议,工作室:已全面停止

韩小娱
2026-05-30 08:55:58
2026-05-31 08:51:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
347051文章数 607256关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

房主将住宅变"网约房"挂到网上接受预订 邻居不满起诉

头条要闻

房主将住宅变"网约房"挂到网上接受预订 邻居不满起诉

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

本地
家居
数码
公开课
军事航空

本地新闻

用剪纸的方式,打开江苏扬州

家居要闻

云栖 舒展如流云

数码要闻

vivo S60系列发布:2899元起 推出4K原生感Live

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美防长参加"香会" 就美中关系最新表态

无障碍浏览 进入关怀版