网易首页 > 网易号 > 正文 申请入驻

从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

0
分享至

2025年8月27日,在第四届828B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50msTPOT的超高吞吐、低时延的性能,超过业界水平。

发挥“大杂烩”优势,以系统能力打造先进算力

过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半的时间增长了300多倍,反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。

在以往按卡时计费的基础上,今年3月,华为云正式推出了基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。

而这一次,华为云的Tokens服务正式接入CloudMatrix384,并通过384原生的xDeepServe框架再次实现了吞吐量的突破,从年初的1920TPS提升至2400TPS,TPOT仅为50ms。

大算力的构建不是单点突破,而是一个从硬件到软件、从算子到存储、从推理框架到超节点的全栈创新,充分依托了华为的“大杂烩”能力。

首先,CloudMatrix384超节点以全新的计算架构创新,突破性能瓶颈,构筑稳固澎湃的算力根基;CANN昇腾硬件使能,优化算子与高效通信策略,让云端的算力能够以最高效的方式被调用和组合;EMS弹性内存存储打破AI内存墙,突破性地实现“以存强算”,彻底释放了每一颗芯片的算力;xDeepServe分布式推理框架则以极致分离架构Transfomerless让超节点释放出更高效算力。

“拆掉”Transformer,xDeepServe全面激发算力潜能

作为CloudMatrix384超节点的原生服务,xDeepServe以Transformerless的极致分离架构,把MoE大模型拆成可独立伸缩的Attention、FFN、Expert三个微模块,相当于在一台CloudMatrix384上把“大模型”拆成“积木”,并分派到不同的NPU上同步处理任务。之后,再用基于内存语义的微秒级XCCL通信库与FlowServe自研推理引擎把它们重新拼成一个超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。通过xDeepServe不断调优,最终实现了从非超节点单卡吞吐600tokens/s至超节点单卡吞吐2400tokens/s的提升。

作为硬件加速计算的中间层,CANN包含多个算子库和和XCCL这种高性能通信库等组件,共同支撑AI模型的高效运行。其中,XCCL作为专为超节点上的大语言模型(LLM)服务而量身打造的高性能通信库,能够充分发挥CloudMatrix384扩展后的UB互联架构(UBfabric)的全部潜力,为Transformerless的全面分离奠定了带宽与时延双重硬底座。

而作为被重构的“去中心”式分布式引擎,FlowServe把CloudMatrix384切成完全自治的DP小组,每个小组自带Tokenizer、执行器、RTC缓存与网络栈,完全自给自足,做到千卡并发也不“拥堵”。

目前,xDeepServe已实现MA分离,而下一步,将把Attention、MoE、Decode全部改成自由流动的数据流,并把同样的拼图方法复制到多台超节点,让推理吞吐像铺轨一样线性延伸,最终或将视线吞吐量的更大突破,让每块NPU都高效运作,芯片永不排队,推理永不塞车。

聚焦主流大模型,不断提升模型性能

目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台。

华为云积累了大量模型性能优化、效果调优的技术和能力,从而实现“源于开源,高于开源”,让更多大模型可以在昇腾云上跑得更快更好。以文生图大模型来说,在轻微损失画质的情况下,通过Int8量化、旋转位置编码融合算子等方式,在在华为云MaaS平台实现了2倍于业界主流平台的出图速度,最大尺寸支持2K×2K。而在文生视频大模型上,不仅通过量化方式来提速,还通过通算并行等方式,降低延迟与显存占用,大幅提升视频生成速度,相较于友商实现了3.5倍的性能提升。华为云Tokens服务在性能、模型适配、效果调优方面的基础,也让更多企业能够快速开发和构建AIAgent。

而在应用层,华为云已与超过100家伙伴携手深入行业场景,共建丰富的Agent,在调研分析、内容创作、智慧办公、智能运维等领域解决产业难题,让企业更便捷地拥抱AI创新,加速智能化。

如基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能实现与用户的智能交互和任务处理,显著提升服务效率与客户满意度;而北京方寸无忧科技开发的无忧智慧公文解决方案可以提升公文处理效能,实现政企办公智能化转型。

以Token为动力的智能社会已经到来,而华为云将以系统级创新能力和全新的Tokens服务构筑先进算力,助力各行各业加速落地AI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
冲突第31天,土耳其开出参战条件,伊朗救兵已到,中东或要变天

冲突第31天,土耳其开出参战条件,伊朗救兵已到,中东或要变天

谛听骨语本尊
2026-03-31 18:26:04
班切罗和申京谁将最先被交易!联盟最差老大,魔术火箭同病相怜

班切罗和申京谁将最先被交易!联盟最差老大,魔术火箭同病相怜

阿错田间生活
2026-03-31 18:05:20
招行董事长惹众怒,说员工很少准时下班,把加班吹成了核心竞争力

招行董事长惹众怒,说员工很少准时下班,把加班吹成了核心竞争力

潮鹿逐梦
2026-03-30 20:13:34
范元甄:与江青齐名的延安四美之一,嫁主席秘书,却输掉了一生

范元甄:与江青齐名的延安四美之一,嫁主席秘书,却输掉了一生

干史人
2026-03-05 21:06:35
HP整机组装价=单显卡价,5090这波操作让DIY党集体破防

HP整机组装价=单显卡价,5090这波操作让DIY党集体破防

固件更新中
2026-03-31 09:58:27
英媒:中东新四国集团出现

英媒:中东新四国集团出现

参考消息
2026-03-31 19:24:44
加价100元,全行业在低谷,茅台凭什么敢涨价?

加价100元,全行业在低谷,茅台凭什么敢涨价?

传心财经
2026-03-31 19:28:27
郑告蒋家后代:蒋介石逝哪葬哪,是对全体中国人民的最好安排!

郑告蒋家后代:蒋介石逝哪葬哪,是对全体中国人民的最好安排!

扶苏聊历史
2025-12-26 16:08:12
纪实:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长很后怕

纪实:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长很后怕

谈史论天地
2026-03-01 09:49:38
大众终于放下身段!一汽大众全新速腾S上市 起售价仅7.98万元

大众终于放下身段!一汽大众全新速腾S上市 起售价仅7.98万元

快科技
2026-03-31 17:28:07
特朗普服软:伊朗封锁海峡也要停战,但海湾国家要掏5万亿美元

特朗普服软:伊朗封锁海峡也要停战,但海湾国家要掏5万亿美元

荷兰豆爱健康
2026-03-31 17:14:17
随着张雪峰的离世,他的婚史也被拔出

随着张雪峰的离世,他的婚史也被拔出

公子麦少
2026-03-26 15:23:44
越来越近!特别的冠军,正在招手,热刺降级机会增加一倍

越来越近!特别的冠军,正在招手,热刺降级机会增加一倍

嗨皮看球
2026-03-31 16:24:09
国民党台中市长初选落幕,江启臣出线,卢秀燕:这是国民党胜选的开始

国民党台中市长初选落幕,江启臣出线,卢秀燕:这是国民党胜选的开始

海峡导报社
2026-03-31 15:53:04
2-3爆冷!梁靖崑遭逆转,国乒输球第一人,王皓脸色铁青,输麻了

2-3爆冷!梁靖崑遭逆转,国乒输球第一人,王皓脸色铁青,输麻了

生活新鲜市
2026-03-31 18:29:01
中国差点丢失的领土,刚刚设县了!| 地球知识局

中国差点丢失的领土,刚刚设县了!| 地球知识局

地球知识局
2026-03-30 21:02:03
心脏决定寿命!建议:别太节俭,多吃这3种食物,让心脏变年轻

心脏决定寿命!建议:别太节俭,多吃这3种食物,让心脏变年轻

阿龙美食记
2026-03-23 20:16:13
被问目前世上最好的篮球运动员是谁时,凯特琳·克拉克给了答案

被问目前世上最好的篮球运动员是谁时,凯特琳·克拉克给了答案

好火子
2026-03-30 20:34:37
涉嫌严重违纪违法 赵福增、张秀成接受审查调查

涉嫌严重违纪违法 赵福增、张秀成接受审查调查

中国网
2026-03-30 15:59:04
根据历史规律,中国极有可能成为地球上最后一个超级大国

根据历史规律,中国极有可能成为地球上最后一个超级大国

阅微札记
2026-03-31 10:02:28
2026-03-31 20:07:00
产业家
产业家
产业互联网第一媒体
1114文章数 1339关注度
往期回顾 全部

科技要闻

尚未正式宣发,国行苹果AI半夜"意外闪现"

头条要闻

张雪机车订单已排到6月"禁止"新手购买820RR 销售回应

头条要闻

张雪机车订单已排到6月"禁止"新手购买820RR 销售回应

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

教育
本地
艺术
家居
手机

教育要闻

4月20日开考!绵阳高三三诊时间定了

本地新闻

用Color Walk的方式解锁城市春日

艺术要闻

石涛『野色册』

家居要闻

新婚爱巢 甜蜜情趣拉满

手机要闻

国行iPhone开启苹果AI属于意外!苹果回应称“现已修复”

无障碍浏览 进入关怀版