网易首页 > 网易号 > 正文 申请入驻

华为云“算力核弹”全面上线,规模最高可达16万卡

0
分享至

在6月20日举行的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算CEO张平安宣布,基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线,为大模型应用提供澎湃算力。

据介绍,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。华为云新一代昇腾AI云服务基于CloudMatrix384超节点,首创将384颗昇腾NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300 Tokens/s。

超节点架构能更好地支持混合专家MoE大模型的推理,可以实现“一卡一专家”,一个超节点可以支持384个专家并行推理,极大提升效率。同时,超节点还可以支持“一卡一算力任务”,灵活分配资源,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。

对于万亿、十万亿参数的大模型训练任务,在云数据中心,还能将432个超节点级联成最高16万卡的超大集群;同时,超节点还可以支持训推算力一体部署,如“日推夜训”,训推算力可灵活分配,帮助客户资源使用最优。

张平安介绍,新浪与华为云深度合作,基于CloudMatrix384昇腾AI云服务,为“智慧小浪”智能服务体系构建了统一的推理平台,底层由昇腾AI算力提供支持。推理的交付效率提升了超过 50%,模型上线速度成倍加快;通过软硬协同调优,NPU利用率提升超过40%。

硅基流动正在使用CloudMatrix384超节点,为数百万用户高效提供DeepSeek V3、R1的推理服务。面壁智能使用CloudMatrix384超节点,让他们的小钢炮模型的推理业务性能得到了2.7倍提升。

在科研领域,中科院基于CloudMatrix384超节点打造了自己的模型训练框架,快速构建了中科院AI for Science科研大模型,摆脱了对国外高性能AI算力平台的依赖。

在互联网领域,360打造的纳米AI搜索,为用户提供超级AI搜索服务,对AI算力有极大需求,也已开启了CloudMatrix384超节点的测试。

当前,昇腾AI云服务已经为超过1300家客户提供澎湃的AI算力。

在会上,张平安宣布盘古大模型5.5发布,自然语言理解NLP、计算机视觉CV、预测、多模态、科学计算五大基础模型全面升级。他强调,盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。

在NLP大模型方面,全新的718B 深度思考模型是一个由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域大幅增强,实现能力领先。盘古大模型通过通算掩盖、全局动态均衡、分组混合专家MoGE等算法,实现了昇腾亲和的高效训推系统,训练MFU和单卡推理吞吐业界领先。同时,提出了模型亲和的词表、三明治架构、EP-Group负载均衡loss等技术,实现了不弱于业界一流模型的竞争力。

本文系观察者网独家稿件,未经授权,不得转载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘品言夫妇一家三口现身街头,半岁女儿首曝光,白白胖胖太萌了

刘品言夫妇一家三口现身街头,半岁女儿首曝光,白白胖胖太萌了

小椰的奶奶
2026-06-04 12:22:05
一波九连胜,淘汰郑钦文的“黑马”闯入法网决赛创造历史,曾患抑郁症,不得不远离赛场

一波九连胜,淘汰郑钦文的“黑马”闯入法网决赛创造历史,曾患抑郁症,不得不远离赛场

极目新闻
2026-06-05 09:27:15
中国女排VS塞尔维亚,比赛时间敲定,解盛钰出彩,主攻和接应反转

中国女排VS塞尔维亚,比赛时间敲定,解盛钰出彩,主攻和接应反转

体育大学僧
2026-06-05 10:19:50
河北启动重大气象灾害(暴雨)Ⅲ级应急响应

河北启动重大气象灾害(暴雨)Ⅲ级应急响应

澎湃新闻
2026-06-05 12:23:13
22岁女子被前男友入室杀害,母亲重返案发现场泣不成声:对方家属没有任何道歉忏悔,希望严惩凶手

22岁女子被前男友入室杀害,母亲重返案发现场泣不成声:对方家属没有任何道歉忏悔,希望严惩凶手

极目新闻
2026-06-04 09:58:44
83岁赵朴初在陈独秀墓前叹息:墓碑上没有同志,也该有先生二字

83岁赵朴初在陈独秀墓前叹息:墓碑上没有同志,也该有先生二字

鉴史录
2026-06-03 16:18:12
吉利正式上市:6月3日,新车已全新开售

吉利正式上市:6月3日,新车已全新开售

科技堡垒
2026-06-03 09:42:19
被追债36亿,万达没了,首富没了,王健林还剩什么?

被追债36亿,万达没了,首富没了,王健林还剩什么?

李云飞Afey
2026-06-02 16:32:32
54%-70%,夺冠概率狂飙,42天未输球,马刺克星实至名归

54%-70%,夺冠概率狂飙,42天未输球,马刺克星实至名归

体育新角度
2026-06-05 11:47:34
欺人太甚!一家长因孩子备考,请求邻居约束噪音,对方回复没办法

欺人太甚!一家长因孩子备考,请求邻居约束噪音,对方回复没办法

火山詩话
2026-06-03 11:06:12
民营航天,大可不必盲目追赶疯狂的SpaceX

民营航天,大可不必盲目追赶疯狂的SpaceX

道总有理
2026-06-04 09:33:28
Dell承认被苹果逼出好产品,8GB内存争议重燃

Dell承认被苹果逼出好产品,8GB内存争议重燃

灰度测试中
2026-06-02 18:30:40
官方:比利亚雷亚尔与刘凯源续约

官方:比利亚雷亚尔与刘凯源续约

懂球帝
2026-06-04 23:05:25
终于明白中国的好了,大批外资逃离印度,中方救火,莫迪态度大变

终于明白中国的好了,大批外资逃离印度,中方救火,莫迪态度大变

空谷幽幽蓝
2026-06-05 01:47:17
留洋最大希望!李昊炎加盟巴萨对比分析:大概率踢上五大联赛

留洋最大希望!李昊炎加盟巴萨对比分析:大概率踢上五大联赛

邱泽云
2026-06-04 23:08:19
商务部:美滥用出口管制冲击全球半导体产供链稳定

商务部:美滥用出口管制冲击全球半导体产供链稳定

半导体产业纵横
2026-06-04 18:17:53
中国6000万签下世界杯后,第一个心态崩掉的国家出现:只有2000万

中国6000万签下世界杯后,第一个心态崩掉的国家出现:只有2000万

混沌录
2026-05-19 23:49:35
为妻子不要孩子的拜仁传奇穆勒还是分了,妻子有可能踏上仕途

为妻子不要孩子的拜仁传奇穆勒还是分了,妻子有可能踏上仕途

吃多福穿好禄睡多长肉
2026-06-04 10:31:10
CBA总决赛G5前瞻!上海欲夺冠,一人王博救星,孙铭徽难逃弃用

CBA总决赛G5前瞻!上海欲夺冠,一人王博救星,孙铭徽难逃弃用

烨侃体育
2026-06-05 10:22:42
中国不吃这一套!外媒发现不对劲,解放军做最坏准备,无惧核大战

中国不吃这一套!外媒发现不对劲,解放军做最坏准备,无惧核大战

无情有思可
2026-06-05 02:06:25
2026-06-05 12:51:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
142589文章数 1850744关注度
往期回顾 全部

科技要闻

深圳国产芯片成功训练万亿级AI大模型

头条要闻

特朗普对人民大会堂念念不忘 背后深层原因披露

头条要闻

特朗普对人民大会堂念念不忘 背后深层原因披露

体育要闻

梅西与亚马尔之间,那个被遗忘的巴萨10号

娱乐要闻

曾沛慈致歉:因为自身造成大家困扰

财经要闻

卖“友好”,试点5天被骂停

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

本地
房产
手机
公开课
军事航空

本地新闻

用杨柳青年画的方式,打开天津

房产要闻

重磅官宣!美丽沙侨中也要扩建,新增42个班!

手机要闻

小米17T Pro官宣搭载天玑9500:光追渲染性能提升199%

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:黎以和平谈判取得一定进展

无障碍浏览 进入关怀版