网易首页 > 网易号 > 正文 申请入驻

华为720亿参数大模型正式开源,4000颗昇腾训练,双架构设计太狠

0
分享至

720亿参数,不靠堆料也能赢?这次,华为开源大模型玩明白了

6月30日,华为出招了。一口气放出两款自研大模型:720亿参数的稀疏模型盘古Pro MoE,以及70亿参数的“快思慢想”结构模型盘古Embedded 7B。

不仅模型开源,连基于昇腾NPU的推理优化代码都一并公开,整得非常彻底。

不少人第一反应是:这是不是又一波“国产替代”的声音?但认真看完这些技术细节后,恐怕你会意识到,这次的重点,不是简单追量,而是华为在架构设计和算力调度上的“破局”。

盘古Pro MoE这个名字你可能还不熟,但它的底层技术真的不简单。

这不是单纯的“多专家模型”(MoE)那一套,而是华为自研的分组混合专家架构MoGE。

说人话就是:训练时智能分配任务、推理时均衡调用专家模块,不浪费算力还跑得快,特别适合像昇腾这种并行能力强但要求精细调度的NPU平台。

你没看错,盘古Pro MoE的训练用了4000颗昇腾芯片,在13万亿tokens级别的高质量语料上跑通,还分成通用、推理、退火三个阶段“按部就班”训练。

这种精细打磨后,推理速度达到单卡1528 tokens/s,不但超了自己上一代,还直接压过了GLM-Z1-32B、Qwen3-32B这些当下最热门的模型。

这意味着什么?

在大模型圈,性能不是光堆参数就行的,背后的调度逻辑、优化算法、硬件适配才是决定能否落地的关键。华为这次明确释放了一个信号:盘古Pro MoE不光能跑,还能快、省电、适配广。

而另一个主角——盘古Embedded 7B,则走的是“轻巧实用”路线。

70亿参数的体积在大模型里不算大,但它采用了一个很有意思的“快慢思考”架构,轻量时走快速响应通道,遇到复杂问题再触发深度推理,这种类似人脑思维的机制,理论上能在兼顾效率的同时,保住准确率。

而华为搞这个“快慢双脑”也不是靠玄学。它背后用了强化学习、模型合并、奖励机制三段式训练流程,还真不是简简单单蒸馏就完事。这种方式,在多个权威测评中,实际跑赢了Qwen3-8B和GLM4-9B这类更大模型,足以证明它的设计不是噱头。

你可能会问:这些东西离普通人有啥用?我的看法是,这种级别的技术开源,不只是交个“作业”,而是在传递一个生态信号。华为要把昇腾NPU打造成真正意义上的国产AI底座,而不是依赖海外框架和芯片的“拼装生态”。

换句话说,过去大家说“开源”有点像姿态,但华为这次是连底层推理系统都开了,是真的要“请进来,用起来”。你想基于盘古二次开发模型、部署本地方案、打造自有大脑?现在它给你开门了。

当然,这一切仍然不能代表华为就此领先了整个AI生态。盘古Pro MoE再强,它面对的依旧是多语言、多任务、多平台的复杂环境,昇腾NPU再猛,软件生态也还在完善。

但你不得不承认,像这样真正从硬件到模型端“打通一条链”的国产方案,确实越来越稀有了。

这次盘古大模型的开源不只是一次技术展示,更像一次深水区的试探。参数不是最惊人的,但在模型架构和推理效率上,华为走了一条值得长期观察的路径。

未来几年,大模型一定会越来越重视“算力效率”而不是“参数恐惧症”。在这场博弈中,华为交出的答卷,不一定是最抢眼的,但绝对是最有力的。

如果你对这波盘古大模型怎么看?你觉得未来模型的参数数量还重要吗?欢迎在评论区聊聊,我们一块拆解这场国产大模型的博弈。

参考文章:720亿参数!华为首个开源大模型发布,用4000颗昇腾训练的-智东西

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗揪出81名内鬼,给中国敲响警钟,国安立即行动,果然抓到大鱼

伊朗揪出81名内鬼,给中国敲响警钟,国安立即行动,果然抓到大鱼

风眼军情
2026-03-19 20:04:48
美国对伊朗开出6个谈判条件,波斯无人机部队司令遭斩首

美国对伊朗开出6个谈判条件,波斯无人机部队司令遭斩首

史政先锋
2026-03-22 17:52:30
美以伊开打20天,下一步最大威胁,是粮食和淡水危机

美以伊开打20天,下一步最大威胁,是粮食和淡水危机

红星新闻
2026-03-19 18:45:22
陈诗媛「挺孕肚剪头发」完成产前心愿 甜晒新造型:有种仪式感

陈诗媛「挺孕肚剪头发」完成产前心愿 甜晒新造型:有种仪式感

ETtoday星光云
2026-03-04 09:46:47
不同命!三年前跟佩德里齐名的他,如今被爆火新1亿欧元先生超越

不同命!三年前跟佩德里齐名的他,如今被爆火新1亿欧元先生超越

里芃芃体育
2026-03-22 21:58:17
达芬奇《最后的晚餐》为何如此出名?放大10倍后,看看犹大的手!

达芬奇《最后的晚餐》为何如此出名?放大10倍后,看看犹大的手!

蒋南强读历史
2026-03-22 11:05:08
美媒:中美可能很快就会开战,但中国导弹能淹没美军任何防御系统

美媒:中美可能很快就会开战,但中国导弹能淹没美军任何防御系统

玛丽莲萌兔
2026-03-22 22:19:49
成都“牵手门”事件女主现今状况曝光,太惨了......

成都“牵手门”事件女主现今状况曝光,太惨了......

许三岁
2026-03-17 07:34:05
2026年,别乱找工作!这几个行业,已经发不出工资了

2026年,别乱找工作!这几个行业,已经发不出工资了

捣蛋窝
2026-03-22 19:45:22
彻底翻脸!沙特、土耳其等六国联合围剿以色列,美国也拦不住!

彻底翻脸!沙特、土耳其等六国联合围剿以色列,美国也拦不住!

多多爱探索
2026-03-22 11:25:20
奥运冠军梦碎!伊朗欺骗19岁摔跤冠军将见家人 次日将他绞刑处决

奥运冠军梦碎!伊朗欺骗19岁摔跤冠军将见家人 次日将他绞刑处决

念洲
2026-03-22 09:56:28
3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

3天暴跌40%!被套牢的中国大妈,该醒醒了:黄金从来不是避险资产

社会日日鲜
2026-03-22 07:07:19
18岁的姚晨在肯德基工作时的一张照片,那时就难掩浑身的好气质

18岁的姚晨在肯德基工作时的一张照片,那时就难掩浑身的好气质

娱你同欢
2026-03-17 16:08:28
吴京深夜发文喊饿,西装革履狂炫两份盒饭,一粒米都没剩太真实

吴京深夜发文喊饿,西装革履狂炫两份盒饭,一粒米都没剩太真实

草莓解说体育
2026-03-22 15:38:56
足坛著名酒鬼,喝酒喝到尿床,戒酒后却成为维埃里口中的雄狮

足坛著名酒鬼,喝酒喝到尿床,戒酒后却成为维埃里口中的雄狮

足篮大世界
2026-03-21 16:45:26
释永信行贿的是何方神圣?

释永信行贿的是何方神圣?

方清云
2026-03-22 17:26:33
今年大反常!老百姓为何不再关心房价和国际局势?答案让人震惊!

今年大反常!老百姓为何不再关心房价和国际局势?答案让人震惊!

新国学文化
2026-03-20 14:20:55
美国持续向中东地区增派两栖戒备群和约2500名海军陆战队员,专家:美军一旦针对伊朗发动地面作战行动,可能会付出更大的代价

美国持续向中东地区增派两栖戒备群和约2500名海军陆战队员,专家:美军一旦针对伊朗发动地面作战行动,可能会付出更大的代价

潇湘晨报
2026-03-22 11:10:17
中央发布2个重要文件,有关退休人员待遇!文件讲了什么,看看!

中央发布2个重要文件,有关退休人员待遇!文件讲了什么,看看!

天气观察站
2026-03-22 09:42:59
暴跌40%,关店4000家!曾创神话的“零食界爱马仕”,卖不动了

暴跌40%,关店4000家!曾创神话的“零食界爱马仕”,卖不动了

好贤观史记
2026-03-02 20:17:10
2026-03-23 01:55:00
小8说科技 incentive-icons
小8说科技
商务请私
6268文章数 339关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

时尚
艺术
手机
房产
家居

她凭这件旗袍在赛场圈粉无数

艺术要闻

如此美妙的光影,安静而温暖,真令人折服!

手机要闻

华为蝉联榜首,苹果紧追不舍,OPPO、vivo、小米、荣耀差距不大!

房产要闻

全城狂送1000杯咖啡!网易房产【早C计划】,即刻启动!

家居要闻

时空交织 空间绮梦

无障碍浏览 进入关怀版