网易首页 > 网易号 > 正文 申请入驻

DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。

开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。



海外社区也注意到DeepSeek使用了它而不是OpenAI开发的Triton语言。

有接触过的开发者感叹TileLang是一种非常优雅的语言,只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现。



那么什么是TileLang,又为何引人瞩目?

首先,TileLang是一种专门用来开发GPU内核的领域专用语言,性能上可以对标英伟达CUDA,DeepSeek官方推荐使用此版本做实验,在方便调试和快速迭代上有优势。

更重要的是,TileLang与国产算力生态适配,连华为昇腾都要在第一时间公告对TileLang的支持。



在几周前的华为全联接大会2025的开发者日上,TileLang团队成员董宇骐就介绍了TileLang实现FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。

此外TileLang团队成员王磊沐曦集成电路的高级总监董兆华也在同一个圆桌沙龙上出现过,讨论了沐曦GPU与TileLang的适配。

DeepSeek为什么选择TileLang

DeepSeek与TileLang第一次同框亮相,其实是在6月的北京智元大会。

在DeepSeek实习过的北大博士袁境阳,在报告中就提到“TileLang的算子实现会更快一点”。

TileLang的发起人之一,北大博士研究生王磊当时还专门发帖感谢DeepSeek尝试他们的语言。



TileLang由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智



2025年1月,TileLang在GitHub上正式开源,至今已获得1.9k标星。



简单来说,Tile语言 ( tile-lang ) 是一种简洁的领域专用语言,旨在简化高性能 GPU/CPU 内核的开发。tile-lang采用Python式语法,并在TVM之上构建底层编译器基础架构,使开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。



王磊曾在7月HyperAI超神经主办的Meet AI Compiler技术沙龙分享TileLang的核心设计理念:

将调度空间(包括线程绑定、内存布局、张量化和流水线等)与数据流解耦,并将其封装为一组可自定义的注解和原语。这种方法允许用户专注于内核的数据流本身,而将大部分优化工作交给编译器完成。

TileLang将“Tile”作为编程模型的核心概念,通过显式的Tile抽象,让开发者能够直观地控制数据在全局内存、共享内存和寄存器之间的流动。

TileLang提供了三个不同层次的编程接口,满足不同水平开发者的需求。

初学者可以使用硬件无关的高层接口,专注于算法逻辑而不必关心底层细节。

有经验的开发者可以使用ile Library,这里包含了各种针对不同硬件架构优化过的预定义操作。

对于追求极致性能的专家用户,TileLang还提供了线程原语级别的控制,允许他们直接操作线程同步、内存合并等底层特性。



DeepSeek显然就属于追求极致性能的专家用户了,根据v3.2公告的说法,在早期DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能。

v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制(lightning indexer)运行速度远超传统实现。



在TileLang的文档中也有相关的技术介绍,在计算过程中缓存中间数据,比全局内存快得多。



TileLang与DeepSeek双向奔赴

更早之前,在DeepSeek连续一周发布开源代码库的第一天,王磊就曾向DeepSeek团队推荐TileLang语言。



后来TileLang也以DeepSeek在这天发布的FlashMLA内核作为评测基准,在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当。



在最新的DeepSeek v3.2发布之后,王磊也发帖致敬DeepSeek敢于使用一门新的编程语言来开发核心产品。

并且DeepSeek v3.2也验证了TileLang确实可以用来训练模型。



DeepSeek V3.2技术报告:
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

TileLang:
https://github.com/tile-ai/tilelang

参考链接:
[1]https://x.com/Lei_Wang_1999/status/1932331703747698786
[2]https://x.com/nathancgy4/status/1972613835598299245
[3]https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519
[4]https://hub.baai.ac.cn/view/46173

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

公子麦少
2025-11-07 14:36:16
西安市委书记方红卫,被查

西安市委书记方红卫,被查

新京报政事儿
2025-11-07 20:23:03
我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

我在部队当了5年通讯兵,退伍发现村后头的信号塔每晚都准时闪3下

五元讲堂
2025-11-05 10:35:02
老板开8500月薪在某平台招聘新人,竟被系统警告:建议降到8000以下

老板开8500月薪在某平台招聘新人,竟被系统警告:建议降到8000以下

风向观察
2025-11-07 20:04:38
巴西可能没救了

巴西可能没救了

虚声
2025-11-06 20:45:05
银行不能再层层加码了

银行不能再层层加码了

阿亮评论
2025-11-07 11:16:19
16人遇难、39人受伤!四川自贡九鼎大楼重大火灾详情披露

16人遇难、39人受伤!四川自贡九鼎大楼重大火灾详情披露

极目新闻
2025-11-07 15:17:51
大米公司为什么被全网群嘲?这两点就够了!

大米公司为什么被全网群嘲?这两点就够了!

宏哥谈商道
2025-11-06 19:00:03
副院长祖雄兵被停职!他口中所谓的“纯洁婚外恋”,是自欺欺人

副院长祖雄兵被停职!他口中所谓的“纯洁婚外恋”,是自欺欺人

鋭娱之乐
2025-11-07 12:47:00
伟大的9-6!吴宜泽兑现第3个赛点,淘汰赵心童进决赛,剑指破荒!

伟大的9-6!吴宜泽兑现第3个赛点,淘汰赵心童进决赛,剑指破荒!

刘姚尧的文字城堡
2025-11-07 21:55:16
网传:太子集团高管交完保释金后离开法院,面带笑容,轻松淡定!

网传:太子集团高管交完保释金后离开法院,面带笑容,轻松淡定!

眼光很亮
2025-11-07 17:17:57
我国第三代防空武器系统总设计师张福安逝世,曾长期隐姓埋名为国奉献

我国第三代防空武器系统总设计师张福安逝世,曾长期隐姓埋名为国奉献

澎湃新闻
2025-11-07 19:30:26
全国多地临时停课!句容疾控重要提醒

全国多地临时停课!句容疾控重要提醒

句容发布
2025-11-06 20:44:39
《西游记》沙僧扮演者刘大刚先生因病去逝,剧中数位演员已永远离开

《西游记》沙僧扮演者刘大刚先生因病去逝,剧中数位演员已永远离开

潇湘晨报
2025-11-07 18:49:54
“软的更软,硬的更硬”

“软的更软,硬的更硬”

环球网资讯
2025-11-07 19:53:14
房贷还有650万,市场价仅360万,深圳90后业主问“我该怎么办?”

房贷还有650万,市场价仅360万,深圳90后业主问“我该怎么办?”

恪守原则和底线
2025-11-07 11:50:03
今天起,世界上少了一家纯电车企

今天起,世界上少了一家纯电车企

大象新闻
2025-11-07 10:54:05
为什么要坚定加入CPTPP呢?因为WTO组织已经被玩坏了……

为什么要坚定加入CPTPP呢?因为WTO组织已经被玩坏了……

翻开历史和现实
2025-11-07 14:42:30
曾琦和院长的视频透露出重要信号,为何他们与毛奇佩霞事件不一样

曾琦和院长的视频透露出重要信号,为何他们与毛奇佩霞事件不一样

李昕言温度空间
2025-11-07 22:42:06
白应苍被判死刑,吓坏了沈伯洋,美国不搭理,求助无门,害怕了!

白应苍被判死刑,吓坏了沈伯洋,美国不搭理,求助无门,害怕了!

时时有聊
2025-11-07 14:38:47
2025-11-08 01:11:00
量子位 incentive-icons
量子位
追踪人工智能动态
11642文章数 176329关注度
往期回顾 全部

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

头条要闻

家长称男婴被两个不满12周岁女孩害死:拿她们没办法

头条要闻

家长称男婴被两个不满12周岁女孩害死:拿她们没办法

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

王家卫的“看人下菜碟”?

财经要闻

荷兰政府:安世中国将很快恢复芯片供应

汽车要闻

美式豪华就是舒适省心 林肯航海家场地试驾

态度原创

数码
本地
家居
艺术
公开课

数码要闻

微软首款硬件Z - 80 SoftCard:80年代的意外“吸金王”

本地新闻

这届干饭人,已经把博物馆吃成了食堂

家居要闻

现代自由 功能美学居所

艺术要闻

地球的巨眼?亚洲第一铜矿藏190层深渊,能吞下59个西湖!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版