网易首页 > 网易号 > 正文 申请入驻

华为昇腾 0Day 支持 DeepSeek-V3.2-Exp

0
分享至

IT之家 9 月 29 日消息,今晚,DeepSeek-V3.2-Exp 发布并开源,引入稀疏 Attention 架构。华为宣布昇腾已快速基于 vLLM/SGLang 等推理框架完成适配部署,实现 DeepSeek-V3.2-Exp 0day 支持,并面向开发者开源所有推理代码和算子实现。

IT之家从官方介绍获悉,昇腾在 DeepSeek-V3.2-Exp 一发布开源即实现了 DeepSeek-V3.2-Exp BF16 模型部署,并在 CANN 平台上完成对应的优化适配,整体部署策略沿用 DeepSeek 的大 EP 并行方案,针对稀疏 DSA 结构,叠加实现长序列亲和的 CP 并行策略,兼顾时延和吞吐,在 128K 长序列下能够保持 TTFT 低于 2 秒、TPOT 低于 30 毫秒的推理生成速度。

NPU DeepSeek-V3.2-Exp 推理优化实践:

昇腾针对 DeepSeek-V3.2-Exp 架构中两个全新的算子:Lightning Indexer (LI) 以及 Sparse Flash Attention (SFA),针对性地进行算子 Tiling 设计、Cube 核与 Vector 核间的流水优化、计算流程的实现优化等,模型和融合 Kernel 均已开源。

NPU DeepSeek-V3.2-Exp Ascend C 融合算子优化:

为进一步提高昇腾融合算子的编程易用性,昇腾 CANN 首次推出大融合算子的编程体系 PyPTO,旨在简化算子开发流程,同时保持高性能计算能力。该框架创新性地采用 PTO (Parallel Tensor / Tile Operation) 编程范式,以 Tensor 为基本数据表达方式,构建计算图,实现高效计算与优化。目前在昇腾上已经基于 PyPTO 完成 DeepSeek-V3.2-Exp 模型中 DeepSeek Indexer Attention 和 Lightning indexer 算子的开发实践,仅需几百行代码即可完成动态 Shape 算子编程和算子整网运行。

基于 PyPTO 的 Lightning Indexer 和 DeepSeek Indexer Attention 算子开发实践:

昇腾不仅提供了 DeepSeek-V3.2-Exp 的官方参考实践,也同步支持 vLLM 和 SGLang 等业界主流大模型推理框架部署,提供完整功能,能够让广泛的开发者在社区直接下载相关代码体验 DeepSeek-V3.2-Exp 模型,可以在昇腾实现融合算子、稀疏访存、多核并行计算等深度优化能力,并持续优化 DeepSeek-V3.2-Exp 在主流社区的推理性能。

大模型推理框架 vLLM 及昇腾实现: 大模型推理框架 SGLang 及昇腾实现:

TileLang 是由 Tile-AI 社区发起的 Tile-level 的类 Python 的 AI 编程语言(DSL)项目,在 Tile 粒度上进行编程和编译,实现模型算子和硬件的高效协同。昇腾已经实现 TileLang 的 Sparse Flash Attention 和 Lightning Indexer 算子开发,后续将支持更完备的 NPU 算子并提升性能和泛化性。

NPU DeepSeek-V3.2-Exp TileLang 算子开发实践: TileLang-Ascend 开源社区:

昇腾凭借敏捷协同优化能力,0Day 高效完成 DeepSeek-V3.2-Exp 适配,不仅深度开放自研编程语言 AscendC 及 PyTorch 算子源码,也积极拥抱开源生态,同步实现 vLLM、SGLang 等主流框架的快速支持,并携手开源社区 Tile-AI 共同开源 NPU 编程项目 TileLang-Ascend。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方正式宣布:永久更换国内供应商!荷兰这次后悔也来不及了

中方正式宣布:永久更换国内供应商!荷兰这次后悔也来不及了

墨羽怪谈
2026-02-28 21:59:26
3月1日晚间,多家上市公司发布重大利好利空好消息

3月1日晚间,多家上市公司发布重大利好利空好消息

A股数据表
2026-03-01 17:33:53
伊朗最高国家安全委员会发布第1号公告

伊朗最高国家安全委员会发布第1号公告

界面新闻
2026-02-28 18:24:27
南海连轰三日!敢划禁区便夷平,全球纷燃战火,中国严划红线!

南海连轰三日!敢划禁区便夷平,全球纷燃战火,中国严划红线!

起喜电影
2026-03-02 01:17:18
即日起,广州全面禁止!

即日起,广州全面禁止!

羊城攻略
2026-03-01 23:03:39
乱世之秋谁会成为波斯新掌门?为何说伊朗之变对乌克兰是大利好?

乱世之秋谁会成为波斯新掌门?为何说伊朗之变对乌克兰是大利好?

史政先锋
2026-03-01 20:02:01
3月1日晚间上市公司重大事项公告

3月1日晚间上市公司重大事项公告

风风顺
2026-03-01 19:37:35
伊朗外长:伊朗已将导弹射程限制在2000公里以内

伊朗外长:伊朗已将导弹射程限制在2000公里以内

新华社
2026-02-27 10:33:20
汪小菲回应转学风波,大S私自操办被国际学校退学,得知后很崩溃

汪小菲回应转学风波,大S私自操办被国际学校退学,得知后很崩溃

萌神木木
2026-03-01 11:37:34
伊朗前总统 内贾德遇袭身亡

伊朗前总统 内贾德遇袭身亡

每日经济新闻
2026-03-01 22:34:10
真相大白!王曼昱丢冠原因曝光,是打不过莎莎吗?张继科早有预言

真相大白!王曼昱丢冠原因曝光,是打不过莎莎吗?张继科早有预言

曹说体育
2026-03-01 22:16:15
河北孟村杀妻案迎来结局,堂哥和律师证实已执行

河北孟村杀妻案迎来结局,堂哥和律师证实已执行

九方鱼论
2026-03-01 23:13:07
2连胜男篮最新评分!3人满分4人优秀,有3人郭士强下次不能再带了

2连胜男篮最新评分!3人满分4人优秀,有3人郭士强下次不能再带了

后仰大风车
2026-03-01 20:26:16
曼联夏窗中场大换新!续约梅努成优先项,三新人成卡里克主推人选

曼联夏窗中场大换新!续约梅努成优先项,三新人成卡里克主推人选

里芃芃体育
2026-03-02 03:00:03
创纪录!外资,突然大抛售!全球“最牛”股市,发生了什么?

创纪录!外资,突然大抛售!全球“最牛”股市,发生了什么?

数据宝
2026-03-01 18:36:28
你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

带你感受人间冷暖
2026-02-17 01:00:24
美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

美国军力全球第一,敢打任何国家?俄泼冷水:这4国你敢打谁?

近史谈
2026-01-19 10:09:51
牺牲时仅19岁:被20多名土匪轮番侵犯,行刑前高呼"毛主席万岁"

牺牲时仅19岁:被20多名土匪轮番侵犯,行刑前高呼"毛主席万岁"

小莜读史
2026-03-01 09:04:30
感谢日本队?世预赛78:72力克韩国,中国男篮大胜=反超升小组第二

感谢日本队?世预赛78:72力克韩国,中国男篮大胜=反超升小组第二

现代小青青慕慕
2026-03-01 17:05:42
彻底飘了,美防长公然“警告”中国,振臂高呼:美国威慑力回来了

彻底飘了,美防长公然“警告”中国,振臂高呼:美国威慑力回来了

小兰聊历史
2026-01-11 10:27:33
2026-03-02 03:27:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
331712文章数 607030关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

健康
旅游
教育
房产
军事航空

转头就晕的耳石症,能开车上班吗?

旅游要闻

青州春雨刷屏,千年古城烟雨朦胧,藏着最动人的东方浪漫!

教育要闻

11年,学生平均增高5.52厘米!成都这所小学,登上教育部发布会

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

军事要闻

伊朗前总统内贾德遇袭身亡

无障碍浏览 进入关怀版