网易首页 > 网易号 > 正文 申请入驻

盘古2.0代码放出来了 第一天反应大出所料

0
分享至


openPangu 2.0开源代码仓库界面

华为昨天把盘古2.0的代码放出来了。

比我预想的要多。首批开出来的是Flash版本的完整权重,920亿参数,激活参数量6B。还有基础推理代码和训推算子。后续还有预训练代码等总共7个组件分批上线。

我之前以为他们会先放一个最小的版本出来试试水。结果第一天就上了92B。

IT之家和凤凰网都发了快讯。但我翻了翻评论区,发现大多数人的关注点在参数量的数字上。92B、505B。其实这些数字不是最值得聊的。


openPangu 2.0开源组件清单与技术规格

真正让我愣了一下的是激活参数量的设计。

92B的Flash版本,激活参数量只有6B。505B的Pro版本,激活参数量18B。这是MoE架构的典型做法。总参数量巨大,但每次只激活很小一部分。

为什么这么做。成本。

6B的激活参数量意味着什么。意味着一张昇腾推理卡可以同时跑多个Flash实例。意味着部署成本比想象中低很多。华为在HDC上说过一句话,昇腾单卡推理吞吐是行业主流的2倍。当时很多人觉得是宣传。现在代码放出来了,你可以自己跑一遍验证。

说到MoE架构我想起一件事。去年有个做AI部署的朋友跟我说,他们公司评估大模型的时候,第一个看的不是精度,是显存占用。精度差一点可以用工程手段补,显存超了就得加卡。加卡就得多花钱。他说大模型部署的瓶颈从来不是模型有多大,是显存够不够用。盘古这个92B总参、6B激活的设计,在工程上就是在回答这个最实际的问题。


盘古2.0 MoE架构激活参数与推理成本对比图

开源协议也值得说一句。

MIT。最宽松的。闭源商用可以。改代码可以。不署名也可以。

华为选MIT不是随便选的。它想表达的信息很明确。这个模型你拿去用,不需要跟我们打招呼,不需要给我们付费,不需要在产品里标注用了盘古。你想怎么用就怎么用。

这个姿态在国产大模型里不太常见。大部分国产模型开源用的是Apache 2.0,也不差。但MIT在商业友好度上更进了一步。等于在跟企业客户说,放心用。

我其实不太确定华为选MIT的完整逻辑。可能是想快速铺开昇腾生态的开发者基数。可能是对标智谱GLM-5.2的MIT策略。也可能是发现大模型时代的商业回报不在模型授权费上,在算力和服务上。但不管理由是什么,MIT这个选择本身就是在说一件事。盘古不靠卖模型赚钱。


开源协议对比与MIT商用友好度示意图

再说一件我觉得被低估了的事。

盘古2.0是昇腾原生训练的。不是从英伟达迁移过来的。是一开始在昇腾上写的代码,在昇腾集群上做的训练。这个跟DeepSeek V4不一样。DeepSeek V4是从CUDA搬到CANN的,走的是迁移路线。盘古2.0是从零开始就在CANN上。

这两条路在工程上的区别很大。

迁移路线的好处是快,缺点是有些算子优化不到位,性能有损耗。原生路线的好处是性能最优,缺点是慢,要从头写算子。

华为选了原生路线。代价是研发周期更长,收益是推理和训练的效率都拉满了。


昇腾原生训练与CUDA迁移两种技术路线对比图

我知道有人会说,盘古2.0的评测数据没有GLM-5.2那么亮眼。

确实。Flash版本的定位不是跟Opus 4.8对标。它要做的事情不同。GLM-5.2追求的是一线模型的全面能力。盘古2.0 Flash追求的是一张卡能跑、成本够低、企业能用。

这两个目标没有高低之分。是不同战场的选择。

华为的策略很清楚。Pro版本对标一线,Flash版本铺量。Pro打性能,Flash打覆盖面。这套打法在硬件行业很常见,在模型行业才刚开始。

写到这我想到一个比喻不一定准。GLM-5.2像iPhone Pro,所有功能拉满,价格也拉满。盘古2.0 Flash像红米,核心功能有,价格打骨折。两种产品定位都没有问题,只要你清楚自己在打什么市场。


盘古2.0 Pro vs Flash双版本定位对比图

说了这么多技术细节,回到我最开始说的那句话。反应大出所料。

我昨天蹲了一下GitHub仓库的评论区。大部分是正向反馈,但也有一些有意思的质疑。有人问,92B的Flash版本实际跑起来效果到底怎么样,评测数据太少。有人担心后续7个组件能不能按时上线,华为的开发者大会承诺能不能兑现。

这些质疑不是坏话。恰恰说明开源社区的期待值已经被拉高了。一个模型如果没人挑毛病,说明根本没人关注。

还有个我没想到的事。HuggingFace上有人已经开始拿盘古2.0 Flash做量化版本了。6B激活参数量的MoE模型,量化到4bit之后,一张消费级显卡就能跑。这不是华为官方在做的事,是社区自发行为。

这就是开源的威力。你放出来的是一套代码,但社区会帮你探索你根本没想过的用法。华为官方想的是企业级部署,社区想的是能不能在我的笔记本上跑一下。

说到这我想起去年的一件事。Meta开源Llama系列的时候,最核心的战略就是把模型丢出去让社区免费帮它优化。华为现在走的是同一条路。开源不是你做了多少东西,是别人愿意在你的东西上做多少东西。


盘古2.0开源社区反应与GitHub数据

盘古2.0的开源还有一层意义。

它是华为生态的最后一块拼图。底层有昇腾芯片,中间有CANN框架,上层有盘古模型,端侧有鸿蒙系统。这四个环节现在全部都有了开源或开放方案。

以前华为的AI生态给人的印象是封闭的。昇腾芯片只适配华为自己的框架,鸿蒙系统只跑在华为自己的设备上。但现在不一样了。盘古开源,CANN开放,昇腾芯片开始走商业化路线。这条链路上的每一个环节都在向外打开。

不是华为突然变开放了。是它发现开放之后生态长得更快。

DeepSeek能跑在昇腾上,GLM-5.2能适配昇腾,美团能用国产五万卡集群做训练,这些都不是华为自己在推动的。是生态自发的。华为要做的是提供底层基础设施,然后把门打开。

盘古2.0开源就是这扇门。


华为AI全栈生态:昇腾→CANN→盘古→鸿蒙闭环示意图

你怎么看。盘古2.0开源之后,你会考虑在昇腾上部署试试吗。

注:本文仅为个人观察,基于公开资料整理,不构成任何投资建议,请谨慎决策。

我是全球AI算法笔记,专注硬核科技与AI商业深度解析。关注我,用最清醒的视角,带你看懂科技巨头背后的利益博弈!

本文信息综合自:IT之家 · 凤凰网科技 · 腾讯新闻 · 华为开源平台

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄一鸣女儿“闪闪”签约MCN,成企业品牌大使;母女曾直播一夜赚50万,反复提及“女儿像爷爷王健林”;闪闪奶声吆喝“9块9带回家”引争议

黄一鸣女儿“闪闪”签约MCN,成企业品牌大使;母女曾直播一夜赚50万,反复提及“女儿像爷爷王健林”;闪闪奶声吆喝“9块9带回家”引争议

洪观新闻
2026-07-02 16:54:49
台湾军车被发现用大陆品牌轮胎

台湾军车被发现用大陆品牌轮胎

观察者网
2026-07-01 14:22:06
清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

清北都不上?湖北状元702分拒绝北大清华,他的选择让所有人沉默

金哥说新能源车
2026-06-30 06:15:10
7月买菜,少买豆角和茄子,多吃4种应季“黄金菜”,营养又便宜

7月买菜,少买豆角和茄子,多吃4种应季“黄金菜”,营养又便宜

秀厨娘
2026-07-02 16:30:15
王曼昱输球1天,反常一幕出现,王励勤、马琳遭殃,孙颖莎太无辜

王曼昱输球1天,反常一幕出现,王励勤、马琳遭殃,孙颖莎太无辜

小嵩
2026-07-02 11:01:48
庆祝被打断,巴洛贡破门后模仿詹姆斯霸王步,结果边裁举旗了

庆祝被打断,巴洛贡破门后模仿詹姆斯霸王步,结果边裁举旗了

懂球帝
2026-07-02 08:57:27
现场上座率超99%!2026世界杯改写历史,48队赛制成最大商业胜利

现场上座率超99%!2026世界杯改写历史,48队赛制成最大商业胜利

热血体育社
2026-07-02 00:47:42
许世友拒当副旅长,刘伯承犯难,徐向前:你没告诉他旅长是谁?

许世友拒当副旅长,刘伯承犯难,徐向前:你没告诉他旅长是谁?

芊芊子吟
2026-06-28 09:35:12
霍震霆表态,坐实霍启山婚事!女方辱华再添实锤,整个霍家被抵制

霍震霆表态,坐实霍启山婚事!女方辱华再添实锤,整个霍家被抵制

小鋭有话说
2026-07-02 12:58:43
“时间旅行者”现身 !美国男子自称穿越到2118年,还带回了照片

“时间旅行者”现身 !美国男子自称穿越到2118年,还带回了照片

译言
2026-07-02 06:53:57
A股收评:遭遇“黑周四”!科创50暴跌7.7%,市场在怕什么?

A股收评:遭遇“黑周四”!科创50暴跌7.7%,市场在怕什么?

海右那人
2026-07-02 16:04:58
“这跟没断奶有什么区别”,五年级男孩无法分床睡,未来姻缘没了

“这跟没断奶有什么区别”,五年级男孩无法分床睡,未来姻缘没了

世界圈
2026-06-27 08:31:45
张继科看了两眼哈兰德跑步,丢下一句话,直接把整个直播间干沉默

张继科看了两眼哈兰德跑步,丢下一句话,直接把整个直播间干沉默

童叔不飙车
2026-06-23 01:17:32
被拜仁偷走的12年!从巴西到美加墨,德国足球丢掉了那块“铁”

被拜仁偷走的12年!从巴西到美加墨,德国足球丢掉了那块“铁”

全景体育V
2026-07-01 10:47:43
嚣张!华人电诈头目左手夹烟右手炫钞!团伙覆灭,成员多为非法移民,骗了6500万美元

嚣张!华人电诈头目左手夹烟右手炫钞!团伙覆灭,成员多为非法移民,骗了6500万美元

大洛杉矶LA
2026-07-02 04:20:32
唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

唯独中国交五倍签证费?高市不听岸田劝告,中方对日本改了称呼!

清衣渡a
2026-06-30 13:42:14
易建联求情周鹏出走朱芳雨犯难:CBA还有情义吗?

易建联求情周鹏出走朱芳雨犯难:CBA还有情义吗?

林子说事
2026-07-02 14:16:21
“我要挨个让她们怀孕,玩够就转学跑路!”

“我要挨个让她们怀孕,玩够就转学跑路!”

阿振观点
2026-07-02 15:12:54
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

2死1重伤!是什么让老实人变成杀人凶手?抚顺修车摊血案始末

易玄
2026-07-01 17:04:21
2026-07-02 17:28:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
806文章数 8870关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

两高三学生公交车智斗嫌犯救下学妹:当时吓得腿软了

头条要闻

两高三学生公交车智斗嫌犯救下学妹:当时吓得腿软了

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

小鹏MONA L03 智能化水平拉满 还有玩法多样的巧思大空间

态度原创

教育
房产
时尚
艺术
亲子

教育要闻

高二升高三英语60,中考英语79,求背单词技巧和提分方法突破110

房产要闻

匠造空间 筑美生活|中旅投资2026上半年品牌实践与长期主义答卷

月入3万,时代红利砸向文科生

艺术要闻

光辉历程 时代丹青——庆祝中国共产党成立105周年美展 油画选

亲子要闻

儿童被子按年龄选购的核心逻辑:新生儿到学龄期的睡眠需求与适配

无障碍浏览 进入关怀版