网易首页 > 网易号 > 正文 申请入驻

华为云Tokens服务全面接入384超节点,以系统能力打造先进算力

0
分享至

8月27日,在第四届828 B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50msTPOT的超高吞吐、低时延的性能,超过业界水平。

发挥“大杂烩”优势,以系统能力打造先进算力

过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半的时间增长了300多倍,反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。

在以往按卡时计费的基础上,今年3月,华为云正式推出了基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。

而这一次,华为云的Tokens服务正式接入CloudMatrix384,并通过384原生的xDeepServe框架再次实现了吞吐量的突破,从年初的1920TPS提升至2400TPS,TPOT仅为50ms。



大算力的构建不是单点突破,而是一个从硬件到软件、从算子到存储、从推理框架到超节点的全栈创新,充分依托了华为的“大杂烩”能力。

首先,CloudMatrix384 超节点以全新的计算架构创新,突破性能瓶颈,构筑稳固澎湃的算力根基; CANN昇腾硬件使能,优化算子与高效通信策略,让云端的算力能够以最高效的方式被调用和组合;EMS弹性内存存储打破AI内存墙,突破性地实现“以存强算”, 彻底释放了每一颗芯片的算力;xDeepServe 分布式推理框架则以极致分离架构Transfomerless让超节点释放出更高效算力。

“拆掉”Transformer,xDeepServe全面激发算力潜能

作为CloudMatrix384 超节点的原生服务,xDeepServe以Transformerless 的极致分离架构,把MoE大模型拆成可独立伸缩的 Attention、FFN、Expert三个微模块,相当于在一台CloudMatrix384上把“大模型”拆成“积木”,并分派到不同的NPU上同步处理任务。之后,再用基于内存语义的微秒级XCCL通信库与FlowServe 自研推理引擎把它们重新拼成一个超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。通过xDeepServe不断调优,最终实现了从非超节点单卡吞吐600tokens/s至超节点单卡吞吐2400tokens/s的提升。

作为硬件加速计算的中间层,CANN包含多个算子库和和XCCL这种高性能通信库等组件,共同支撑AI模型的高效运行。其中,XCCL作为专为超节点上的大语言模型(LLM)服务而量身打造的高性能通信库,能够充分发挥CloudMatrix384扩展后的UB互联架构(UB fabric)的全部潜力,为 Transformerless的全面分离奠定了带宽与时延双重硬底座。

而作为被重构的“去中心”式分布式引擎,FlowServe把CloudMatrix384 切成完全自治的 DP 小组,每个小组自带 Tokenizer、执行器、RTC 缓存与网络栈,完全自给自足,做到千卡并发也不“拥堵”。

目前,xDeepServe已实现MA分离,而下一步,将把Attention、MoE、Decode全部改成自由流动的数据流,并把同样的拼图方法复制到多台超节点,让推理吞吐像铺轨一样线性延伸,最终或将视线吞吐量的更大突破,让每块 NPU 都高效运作,芯片永不排队,推理永不塞车。

聚焦主流大模型,不断提升模型性能

目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台。

华为云积累了大量模型性能优化、效果调优的技术和能力,从而实现“源于开源,高于开源”,让更多大模型可以在昇腾云上跑得更快更好。以文生图大模型来说,在轻微损失画质的情况下,通过Int8量化、旋转位置编码融合算子等方式,在在华为云MaaS平台实现了2倍于业界主流平台的出图速度,最大尺寸支持2K×2K。而在文生视频大模型上,不仅通过量化方式来提速,还通过通算并行等方式,降低延迟与显存占用,大幅提升视频生成速度,相较于友商实现了3.5倍的性能提升。华为云Tokens服务在性能、模型适配、效果调优方面的基础,也让更多企业能够快速开发和构建AI Agent。

而在应用层,华为云已与超过100家伙伴携手深入行业场景,共建丰富的Agent,在调研分析、内容创作、智慧办公、智能运维等领域解决产业难题,让企业更便捷地拥抱AI创新,加速智能化。

如基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能实现与用户的智能交互和任务处理,显著提升服务效率与客户满意度;而北京方寸无忧科技开发的无忧智慧公文解决方案可以提升公文处理效能,实现政企办公智能化转型。

以Token为动力的智能社会已经到来,而华为云将以系统级创新能力和全新的Tokens服务构筑先进算力,助力各行各业加速落地AI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“抽象顶流”那艺娜的塌房之路:假扮“俄罗斯娜娜”出圈,请“嘎子”当嘉宾遭质疑

“抽象顶流”那艺娜的塌房之路:假扮“俄罗斯娜娜”出圈,请“嘎子”当嘉宾遭质疑

上游新闻
2026-02-21 13:43:15
湖北省文旅厅认定那艺娜(翟革英)为劣迹艺人,叫停演出

湖北省文旅厅认定那艺娜(翟革英)为劣迹艺人,叫停演出

环球网资讯
2026-02-20 23:33:11
新化消防车救火后返程坠崖6名消防员牺牲,起火住户痛心不已,记者实探:事发地坡道陡峭,村民刨出便道协助救援

新化消防车救火后返程坠崖6名消防员牺牲,起火住户痛心不已,记者实探:事发地坡道陡峭,村民刨出便道协助救援

极目新闻
2026-02-21 17:51:05
太歹毒了!把他俩放在同一部影片里,是谁想出来的?

太歹毒了!把他俩放在同一部影片里,是谁想出来的?

钱小刀娱乐
2026-02-20 22:48:28
张晶遭批:冬奥会+亚冬会+世锦赛+世巡赛都创最差纪录 黄牌满天飞

张晶遭批:冬奥会+亚冬会+世锦赛+世巡赛都创最差纪录 黄牌满天飞

念洲
2026-02-21 10:27:40
湛江妈祖事件后续,福建老板集体放话:以后绝不跟姓许的打交道!

湛江妈祖事件后续,福建老板集体放话:以后绝不跟姓许的打交道!

社会日日鲜
2026-02-21 06:53:41
女子除夕夜在洗浴中心浴池门口被人录像,洗浴中心称公共区域直播很正常,律师:公共区域未经允许直播同样涉嫌侵权

女子除夕夜在洗浴中心浴池门口被人录像,洗浴中心称公共区域直播很正常,律师:公共区域未经允许直播同样涉嫌侵权

大象新闻
2026-02-20 21:52:07
东北大妈偷菜谎称山东人后续:弟弟单位同事证明,脸都丢尽了

东北大妈偷菜谎称山东人后续:弟弟单位同事证明,脸都丢尽了

离离言几许
2026-02-20 15:57:01
33.9万!火锅店称把春节4天盈利分给员工,老板:去年关了两家店 但春节福利要坚持

33.9万!火锅店称把春节4天盈利分给员工,老板:去年关了两家店 但春节福利要坚持

红星新闻
2026-02-21 10:12:08
至少在已经过去的25年里,中国的“财神”不是赵公明,而是WTO!

至少在已经过去的25年里,中国的“财神”不是赵公明,而是WTO!

细雨中的呼喊
2026-02-21 06:59:07
华为手机基本走向没落了

华为手机基本走向没落了

月光作笺a
2026-02-21 06:06:45
42死300伤!北海道暴雪困住中国游客,有人喊话:祖国包机来接人

42死300伤!北海道暴雪困住中国游客,有人喊话:祖国包机来接人

青眼财经
2026-02-20 23:31:25
罄!告急!有跨省回上海返程机票高达11560元

罄!告急!有跨省回上海返程机票高达11560元

新民晚报
2026-02-21 12:30:00
克格勃的悲哀:偷到的西方技术,却是压垮苏联的最后一根稻草

克格勃的悲哀:偷到的西方技术,却是压垮苏联的最后一根稻草

吕醿极限手工
2026-02-21 07:47:57
安德鲁王子跪地与小男孩玩“乳房”球,画面不适,王位继承权难保

安德鲁王子跪地与小男孩玩“乳房”球,画面不适,王位继承权难保

译言
2026-02-21 04:42:00
第5枚金牌今夜18点45分!CCTV5直播,金牌榜反超日本队看混合团体

第5枚金牌今夜18点45分!CCTV5直播,金牌榜反超日本队看混合团体

老吴说体育
2026-02-21 08:58:41
美大法官“大战”总统,6:3裁定特朗普关税违法:1.4万亿美元收入“落空”,或撕开美国财政千亿黑洞!特朗普闪电反击

美大法官“大战”总统,6:3裁定特朗普关税违法:1.4万亿美元收入“落空”,或撕开美国财政千亿黑洞!特朗普闪电反击

每日经济新闻
2026-02-21 17:02:32
夫妇路边散步捡到帆布袋,里面装了20多个红包共7万多元,失主回应:是4个孩子的压岁钱,广东人:惊呆了......

夫妇路边散步捡到帆布袋,里面装了20多个红包共7万多元,失主回应:是4个孩子的压岁钱,广东人:惊呆了......

极目新闻
2026-02-21 08:51:20
男子打麻将连续自摸胡牌后突然瘫倒在牌桌前!送医时血压飙到201/115mmHg

男子打麻将连续自摸胡牌后突然瘫倒在牌桌前!送医时血压飙到201/115mmHg

闪电新闻
2026-02-20 22:54:48
短道创28年最差成绩!王濛怒斥战术与训练问题,直言敢签生死状!

短道创28年最差成绩!王濛怒斥战术与训练问题,直言敢签生死状!

篮球资讯达人
2026-02-21 17:01:43
2026-02-21 18:35:00
科技talk
科技talk
科技领域资深新媒体
1312文章数 2249关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

省直机关女工程师陷美男计 拉公职人员丈夫当间谍17年

头条要闻

省直机关女工程师陷美男计 拉公职人员丈夫当间谍17年

体育要闻

冬奥第一"海王"?一人和13国选手都有关系

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

教育
艺术
房产
本地
公开课

教育要闻

新春走基层 | 慢飞天使捏出 “年的形状”

艺术要闻

皇家秘藏的《金刚经》,这才叫最美中国字!

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版