网易首页 > 网易号 > 正文 申请入驻

余承东亲管华为大模型团队:我的字典里没有第二、只有第一

0
分享至



出品|搜狐科技

作者|张雅婷

在AI大模型领域稍显低调的华为,今天主动“亮剑”。

在华为开发者大会(HDC 2026)上,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东正式发布开源盘古openPangu 2.0大模型,并放话未来将带领盘古大模型走向世界第一。

“之前盘古大模型因为各种各样的原因没做好,不应该。”余承东坦言,他去年国庆节前夕开始负责大模型,会带领大家一路赶超,从中国第一,走向世界第一。

在余承东之前,华为盘古大模型由王云鹤执掌。王云鹤博士毕业于北京大学智能科学系,2018年正式加入华为,去年3月接任华为诺亚方舟实验室主任、华为盘古大模型负责人。

不过,在去年7月,华为盘古Pro MoE开源模型陷入“抄袭风波”。有GitHub用户发现,盘古Pro MoE与阿里Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0为完全一致),引发外界对华为大模型能力的质疑。

这场风波最后以主帅易位收场。当盘古迎来了一位敢说真话、也敢打硬仗的指挥官,又将如何在DeepSeek、豆包等大模型的包围中走出一条属于自己的路?


余承东执掌大模型团队,目标是世界第一

在本次开发者大会上,余承东正式对外宣布接手盘古大模型团队,目标是世界第一。

他表示,此前在全世界都不知道大模型为何物的时候,华为就发布了盘古大模型,可以说是这个行业绝对的全球先驱者。但后来因为各种各样的原因,没做好,不应该。

“去年国庆节前夕,公司又让我来负责这个大模型,我会带领团队一路赶超,我的字典里没有第二、只有第一。我们会从中国第一,走向将来的世界第一。从追赶到超越需要时间,但在过去我所带领的所有业务都实现了这一目标。”

他还提到,华为虽然比不了互联网公司上亿的超高薪水,但也是汇集了一批优秀AI人才。他们不是特别关注个人利益,而是更有理想、有追求、有梦想,敢于不断奉献和努力。

此外,在AI领域,算法、算力、数据三样缺一不可,需要强大的工程能力来支撑和保障,而华为有强大的工程能力。

不过,为什么华为没有像美国一些厂家那样,发布上万亿甚至几十万亿参数的更大规模模型呢?

余承东坦言,第一个原因是算力,美国一些企业拥有几十万卡甚至上百万卡的高性能算力资源”。华为虽然有昇腾算力,但华为的算力大部分支持了国内企业的需要,留给自己的数量非常有限,算力不足以支撑几十万亿参数模型的训练。

第二个原因是内存价格大涨,AI算力成本非常高。非常大的模型做推理,吞吐率和时延就会急速发展。所以华为开发几百B的模型,就更加高效。

据了解,在本次发布会上,华为正式发布开源盘古openPangu 2.0大模型。openPangu 2.0采用稀疏MoE架构,搭载512K上下文窗口,分为Pro和Flash两个版本。

其中,旗舰级的openPangu 2.0 Pro总参数量达到505B,激活参数量为18B;而面向轻量化部署的openPangu 2.0 Flash总参数量为92B,激活参数仅为6B。

在硬件生态协同方面,openPangu 2.0原生针对昇腾芯片进行了深度调优,单卡推理吞吐率可达业界主流开源模型的2倍。

在鸿蒙体系中,openPangu 2.0对Agent任务进行了专项优化,执行速度与精准度更优,资源消耗更低。开源方面,华为计划从6月30日起分批开放7大核心组件。


盘古大模型此前为何“掉队”?

在余承东执掌之前,盘古大模型由王云鹤负责。

王云鹤在2018年博士毕业后正式入职华为,2021年底升任算法应用部部长,后于2025年3月接棒姚骏,成为诺亚方舟实验室主任,全面负责盘古大模型的研发。

不过在王云鹤主导的这一年来,盘古大模型的成果相较于国内其他公司而言并没有特别惊艳。并且在去年的套壳事件中,外界对王云鹤以及盘古大模型的质疑更是达到了顶峰。

去年6月30日,华为宣布开源其盘古大模型核心组件(Pangu Pro MoE),包括70亿参数稠密模型和720亿参数的混合专家模型,表示这是构建昇腾生态的关键举措。

然而仅隔四天,有GitHub用户发布报告指出:通过“LLM指纹”技术分析,盘古Pro MoE与阿里通义千问Qwen-2.5 14B模型的注意力参数分布相似性高达0.927(1.0表示完全一致),远超业内0.7以下的正常差异范围,且在开源代码中发现了阿里的版权声明。

面对质疑,当时盘古团队回应表示,“盘古开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。”

然而在7月6日凌晨,一位自称是盘古大模型团队的员工在GitHub上发布长文《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》,表示盘古大模型在开发过程中确实存在套壳、续训、洗水印的现象。

该员工表示,王云鹤领导的小模型实验室多次通过套壳其他公司开源模型,包括Qwen、DeepSeek等,来冒充盘古自研成果。“外行领导内行,使得领导完全对于这种扯淡的事情没有概念,他们只会觉得肯定是有什么算法创新。”

比如,将Qwen 1.5 110B续训、加层后包装成盘古135B V2,连代码类名都未改。盘古Pro MoE 72B是套壳Qwen 2.5的14B续训,为了洗掉千问的水印,团队还故意训练了脏数据。

在盘古抄袭风波之后,华为云进行大规模组织架构调整。去年8月,华为云CEO张平安发文宣布组织架构调整,重点围绕产品部、公有云服务部及研发部等核心团队,涉及数十个下层部门与组织。有媒体称,云EI(企业智能)产品线下的盘古大模型相关部门被明确撤销。

身处风暴眼中,王云鹤同样难以在华为继续“立足”。今年3月,王云鹤在朋友圈发文官宣离职,后投身于Agent创业。

而随着王云鹤的离开、华为老将余承东的接手,盘古大模型也顺势迎来了一段新的征程。



运营编辑 | 曹倩 审核|孟莎莎




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
济科:我支持巴西,但如果日本赢了也不难过

济科:我支持巴西,但如果日本赢了也不难过

懂球帝
2026-06-28 22:20:07
中俄轰炸机联合巡航后,不到24小时,日本发现更让人震惊的新情况

中俄轰炸机联合巡航后,不到24小时,日本发现更让人震惊的新情况

卷史
2026-06-29 12:34:28
飞机撒泼女子后续:刚登机就闹,正脸曝光头发全白疑患病

飞机撒泼女子后续:刚登机就闹,正脸曝光头发全白疑患病

糖逗在娱乐
2026-06-29 11:48:20
男子称购买4瓶同款茅台重量不一,差距超60克,门店回应:总重并无官方统一标准,重量差异主要源于瓶身烧制工艺,换货需走正规鉴定流程

男子称购买4瓶同款茅台重量不一,差距超60克,门店回应:总重并无官方统一标准,重量差异主要源于瓶身烧制工艺,换货需走正规鉴定流程

潇湘晨报
2026-06-29 12:33:17
新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

律法刑道
2026-04-01 10:15:47
先击落军机,再炸基地、雷达、港口,炸完后,万斯反劝伊朗打电话

先击落军机,再炸基地、雷达、港口,炸完后,万斯反劝伊朗打电话

小小科普员
2026-06-29 14:22:40
在派出所能听到多少八卦?网友:一个比一个狗血

在派出所能听到多少八卦?网友:一个比一个狗血

另子维爱读史
2026-06-27 22:18:43
最高可判刑入狱20年!36岁佛得角队长涉嫌强奸 FIFA回应:暂不评价

最高可判刑入狱20年!36岁佛得角队长涉嫌强奸 FIFA回应:暂不评价

风过乡
2026-06-29 06:09:10
亏大了!安徽考生高考使用修正带,数学判0分,总分458分超本科线

亏大了!安徽考生高考使用修正带,数学判0分,总分458分超本科线

火山詩话
2026-06-26 05:41:30
女人一旦有下面五种行为,男人就别联系了,没必要

女人一旦有下面五种行为,男人就别联系了,没必要

朗威谈星座
2026-06-29 14:45:05
76岁的万科创始人王石,最近彻底成了全网焦点。

76岁的万科创始人王石,最近彻底成了全网焦点。

梦录的西方史话
2026-04-23 14:36:39
乌军攻势已经拦不住了?普京遭俄罗斯强硬派施压,要求动用核武器

乌军攻势已经拦不住了?普京遭俄罗斯强硬派施压,要求动用核武器

王鶔吃吃喝喝
2026-06-29 16:58:30
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
向佐向佑再同框!兄弟俩一起参加线下活动,弟弟最新露脸有变化

向佐向佑再同框!兄弟俩一起参加线下活动,弟弟最新露脸有变化

喜欢历史的阿繁
2026-06-28 21:23:50
三大股指悉数翻红,沪指涨近1%

三大股指悉数翻红,沪指涨近1%

每日经济新闻
2026-06-29 14:01:09
四任主政25年皆被查,任职期间乱作为,终究是自己挖坑自己跳

四任主政25年皆被查,任职期间乱作为,终究是自己挖坑自己跳

元芳有看法
2026-06-28 21:50:43
80后,正成为社会的高危人群

80后,正成为社会的高危人群

细说职场
2026-06-29 15:45:42
布朗的心,真被凯尔特人伤透了

布朗的心,真被凯尔特人伤透了

野球帝
2026-06-29 11:14:11
百吨王组团冲卡后续!知情人爆料:一个都没跑掉,已全部落网!

百吨王组团冲卡后续!知情人爆料:一个都没跑掉,已全部落网!

奇思妙想草叶君
2026-06-29 15:52:34
6.4万FSD,百元破解,特斯拉后门为何失守?

6.4万FSD,百元破解,特斯拉后门为何失守?

小怪吃美食
2026-06-27 06:30:33
2026-06-29 18:43:00
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4896文章数 9194关注度
往期回顾 全部

财经要闻

近20家半导体企业开启新一轮涨价潮

头条要闻

媒体:台军偷拍福建舰 还异想天开用几款导弹摧毁航母

头条要闻

媒体:台军偷拍福建舰 还异想天开用几款导弹摧毁航母

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

健康
数码
艺术
房产
公开课

狂吃“糯叽叽”小心肠梗阻!

数码要闻

TrendForce:苹果将导入未来显示色彩基准BT.2020

艺术要闻

24幅 当代画家人物油画作品

房产要闻

你敢想?海口房地产投资,暴跌5成!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版