华为云CEO张平安：CloudMatrix384 AI Token服务全面上线|算力|云计算|云服务|知名企业|token

华为云CEO张平安：CloudMatrix384 AI Token服务全面上线

2025-09-19 12:04:04　来源: 封面新闻

四川举报

分享至

封面新闻记者孟梅易弋力

9月19日，华为全联接大会2025（HC 2025）上，华为常务董事、华为云计算CEO张平安介绍了华为云昇腾AI云服务的重磅升级与创新进展。

依托华为刚刚发布的最新AI服务器规划，CloudMatrix云上超节点规格将从384卡升级到未来的8192卡，实现50~100万卡的超大集群，为智能时代提供更澎湃的AI算力。为充分释放算力潜能，华为云还首创了弹性内存存储服务EMS，打破传统AI算力与显存绑定限制，让内存可以替代昂贵的显存，以存补算，提升大模型多轮对话的性能。

当下AI算力需求正以指数级增长，面对不同客户需求，华为云提供了灵活的使用方式。

张平安指出，AI的Token服务可以有效屏蔽复杂的底层技术实现，是最高效的推理算力使用方式。会上，张平安宣布华为云CloudMatrix384 AI Token服务全面上线，将以优的性能、好的服务、高的质量，高效满足各行各业所需的“最终AI计算结果”。

华为云通过CloudMatrix384超节点的创新架构，将资源全面池化，形成算力池、内存池、显存池等，把计算型任务、存储型任务、AI专家系统解耦开来，将串行任务尽可能地变成分布式并行任务，极大地提升系统推理性能。在在线、近线和离线等不同时延要求推理场景中，CloudMatrix384的平均单卡推理性能是中国特供H20的3~4倍。目前、已经为Pangu，DeepSeek，Qwen等业界主流大模型提供极致的Token服务，加速各行业 AI 技术落地与业务创新。

360纳米AI依托CloudMatrix384的Token推理服务，成功处理每天上千万的内容生成请求。中科院构建的“磐石·科学基础大模型”平台，基于CloudMatrix384超节点内部高速互联架构及融合算子优化，模型训练精度更高，超出GPU 4%，支持100+专业院所领域场景，不断拓展人类认知的前沿。

随着 AI 算力需求的暴增，企业对基础设施散热、功耗、运维等也提出更高的要求。华为云在贵州、内蒙古、安徽部署大规模、领先的全液冷AI数据中心，将液冷年均 PUE 降低至 1.1。通过华为云的AI云服务，企业无需花时间改造或新建传统数据中心，只需一对光纤，就能够获取华为云上高效的AI算力。华为云提供了全栈专属AI云服务，企业可以把模型和数据放到华为云专属物理隔离资源池进行训练和调优，全程端到端加密，同时自主掌握密钥，在保障数据安全的同时，高效享用华为云提供的AI基础设施。

华为云昇腾AI云服务的升级，不仅为客户带来了极致性能的Tokens服务，更通过技术创新与多样化部署模式，为千行万业的智能化升级注入了强大动力，推动AI技术在各领域的深度应用与发展。如今，昇腾AI云服务的客户数量从去年的321家已增长到今年的1805家，华为云AI总算力规模相比去年同期增长了268%。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.