网易首页 > 网易号 > 正文 申请入驻

从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

0
分享至


2025年8月27日,在第四届828 B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50msTPOT的超高吞吐、低时延的性能,超过业界水平。

发挥“大杂烩”优势,以系统能力打造先进算力

过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半的时间增长了300多倍,反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。

在以往按卡时计费的基础上,今年3月,华为云正式推出了基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。

而这一次,华为云的Tokens服务正式接入CloudMatrix384,并通过384原生的xDeepServe框架再次实现了吞吐量的突破,从年初的1920TPS提升至2400TPS,TPOT仅为50ms。


大算力的构建不是单点突破,而是一个从硬件到软件、从算子到存储、从推理框架到超节点的全栈创新,充分依托了华为的“大杂烩”能力。

首先,CloudMatrix384 超节点以全新的计算架构创新,突破性能瓶颈,构筑稳固澎湃的算力根基; CANN昇腾硬件使能,优化算子与高效通信策略,让云端的算力能够以最高效的方式被调用和组合;EMS弹性内存存储打破AI内存墙,突破性地实现“以存强算”,彻底释放了每一颗芯片的算力;xDeepServe 分布式推理框架则以极致分离架构Transfomerless让超节点释放出更高效算力。

“拆掉”Transformer,xDeepServe全面激发算力潜能

作为CloudMatrix384超节点的原生服务,xDeepServe以Transformerless 的极致分离架构,把MoE大模型拆成可独立伸缩的 Attention、FFN、Expert三个微模块,相当于在一台CloudMatrix384上把“大模型”拆成“积木”,并分派到不同的NPU上同步处理任务。之后,再用基于内存语义的微秒级XCCL通信库与FlowServe 自研推理引擎把它们重新拼成一个超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。通过xDeepServe不断调优,最终实现了从非超节点单卡吞吐600tokens/s至超节点单卡吞吐2400tokens/s的提升。

作为硬件加速计算的中间层,CANN包含多个算子库和和XCCL这种高性能通信库等组件,共同支撑AI模型的高效运行。其中,XCCL作为专为超节点上的大语言模型(LLM)服务而量身打造的高性能通信库,能够充分发挥CloudMatrix384扩展后的UB互联架构(UB fabric)的全部潜力,为 Transformerless的全面分离奠定了带宽与时延双重硬底座。

而作为被重构的“去中心”式分布式引擎,FlowServe把CloudMatrix384 切成完全自治的 DP 小组,每个小组自带 Tokenizer、执行器、RTC 缓存与网络栈,完全自给自足,做到千卡并发也不“拥堵”。

目前,xDeepServe已实现MA分离,而下一步,将把Attention、MoE、Decode全部改成自由流动的数据流,并把同样的拼图方法复制到多台超节点,让推理吞吐像铺轨一样线性延伸,最终或将视线吞吐量的更大突破,让每块 NPU 都高效运作,芯片永不排队,推理永不塞车。

聚焦主流大模型,不断提升模型性能

目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台。

华为云积累了大量模型性能优化、效果调优的技术和能力,从而实现“源于开源,高于开源”,让更多大模型可以在昇腾云上跑得更快更好。以文生图大模型来说,在轻微损失画质的情况下,通过Int8量化、旋转位置编码融合算子等方式,在在华为云MaaS平台实现了2倍于业界主流平台的出图速度,最大尺寸支持2K×2K。而在文生视频大模型上,不仅通过量化方式来提速,还通过通算并行等方式,降低延迟与显存占用,大幅提升视频生成速度,相较于友商实现了3.5倍的性能提升。华为云Tokens服务在性能、模型适配、效果调优方面的基础,也让更多企业能够快速开发和构建AI Agent。

而在应用层,华为云已与超过100家伙伴携手深入行业场景,共建丰富的Agent,在调研分析、内容创作、智慧办公、智能运维等领域解决产业难题,让企业更便捷地拥抱AI创新,加速智能化。

如基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能实现与用户的智能交互和任务处理,显著提升服务效率与客户满意度;而北京方寸无忧科技开发的无忧智慧公文解决方案可以提升公文处理效能,实现政企办公智能化转型。

以Token为动力的智能社会已经到来,而华为云将以系统级创新能力和全新的Tokens服务构筑先进算力,助力各行各业加速落地AI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
胖东来“后遗症”现象:第1批从胖东来离职的员工,已无法上班了

胖东来“后遗症”现象:第1批从胖东来离职的员工,已无法上班了

阿柒的讯
2025-10-31 17:41:38
12月1日起,中国正式升级对荷兰的稀土管控!

12月1日起,中国正式升级对荷兰的稀土管控!

凌风的世界观
2025-11-01 16:41:52
钱赚够了不装了?退出春晚、被综艺开除,贾玲的下场怪不了别人

钱赚够了不装了?退出春晚、被综艺开除,贾玲的下场怪不了别人

阅识
2025-11-02 15:48:02
在钓鱼岛问题上,中国对待日本的态度出现了明显的变化

在钓鱼岛问题上,中国对待日本的态度出现了明显的变化

窥史
2025-10-23 21:01:43
火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

火葬场烧尸人:见惯了生离死别,最喜欢年轻漂亮的女尸

吴学华看天下
2024-06-26 12:43:21
今年立冬“邪乎得很”,60年没见过,冬天要冻哭?

今年立冬“邪乎得很”,60年没见过,冬天要冻哭?

阿天爱旅行
2025-11-02 12:17:34
王艺迪4-3险胜温特,WTT蒙彼利埃冠军赛,逆转夺冠,恭喜王艺迪!

王艺迪4-3险胜温特,WTT蒙彼利埃冠军赛,逆转夺冠,恭喜王艺迪!

烟浔渺渺
2025-11-03 00:16:18
ASML卖设备,美国急眼了,欧洲悄悄留后门

ASML卖设备,美国急眼了,欧洲悄悄留后门

普陀动物世界
2025-11-03 03:11:39
塞琳娜慈善活动状态翻车?黑瘦显老+胶原蛋白流失疑是医美后遗症

塞琳娜慈善活动状态翻车?黑瘦显老+胶原蛋白流失疑是医美后遗症

述家娱记
2025-10-30 09:16:31
听了潘汉年的坦白,陈毅如同晴天霹雳,毛主席震怒:此人再不能信

听了潘汉年的坦白,陈毅如同晴天霹雳,毛主席震怒:此人再不能信

元哥说历史
2025-11-02 21:20:03
屠杀!火箭128-101凯尔特人,谁是本场比赛的功臣,数据不会说谎

屠杀!火箭128-101凯尔特人,谁是本场比赛的功臣,数据不会说谎

砚底沉香
2025-11-03 03:55:35
首日中国12胜6负收官业余选手2连胜,附3日赛程丁俊晖VS霍尔特

首日中国12胜6负收官业余选手2连胜,附3日赛程丁俊晖VS霍尔特

小彭美识
2025-11-03 03:43:26
玄学提醒:人过五十,多去这几个地方走动,福气多多,顺利多多

玄学提醒:人过五十,多去这几个地方走动,福气多多,顺利多多

诗词中国
2025-10-30 20:14:52
惋惜!前中超冠军陨落:7年后再降级,季末7轮不胜+3次崩盘被绝平

惋惜!前中超冠军陨落:7年后再降级,季末7轮不胜+3次崩盘被绝平

我爱英超
2025-11-02 17:29:43
白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

阿纂看事
2025-08-29 15:46:57
惨绝人寰!RSF屠杀震惊联合国,妇产医院460人被杀,土壤都被染红

惨绝人寰!RSF屠杀震惊联合国,妇产医院460人被杀,土壤都被染红

霁寒飘雪
2025-11-02 09:25:37
上头有人!柬埔寨诈骗集团头脑陈志,被曝出更多内幕

上头有人!柬埔寨诈骗集团头脑陈志,被曝出更多内幕

王二哥老搞笑
2025-10-21 08:28:28
中央批准:王道席履新

中央批准:王道席履新

鲁中晨报
2025-11-02 20:03:03
退出德云社真相大白2年,官媒出手揭于谦真实现状,小沈阳说对了

退出德云社真相大白2年,官媒出手揭于谦真实现状,小沈阳说对了

豆哥记录
2025-10-31 18:37:32
全红婵复出就夺冠,好棒!

全红婵复出就夺冠,好棒!

科学发掘
2025-11-03 02:14:09
2025-11-03 04:43:00
猎云网
猎云网
聚焦科技创业创新,钻研产业趋势,用心服务创业者。
57794文章数 327067关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

数码
手机
教育
家居
旅游

数码要闻

麒麟9030处理器突然曝光:1+4+4六核狂飙,可惜工艺不详!

手机要闻

华为Mate80风扇版确认:五款机型同台竞技,18号见!

教育要闻

学龄前的孩子真的不要教,榜样的力量

家居要闻

吸睛艺术 富有传奇色彩

旅游要闻

这道金黄的绝美秋景里藏着古韵京华

无障碍浏览 进入关怀版