网易首页 > 网易号 > 正文 申请入驻

刚刚,摩尔线程宣布开源!代码量暴降90%

0
分享至


芯东西(公众号:aichip001)
作者 ZeR0
编辑 漠影

芯东西2月10日报道,今天,摩尔线程宣布近日开源TileLang-MUSA项目,实现对TileLang编程语言的完整支持,旨在充分释放全功能GPU的性能潜力,大幅降低国产GPU开发门槛。

此前DeepSeek-V3大模型的研发已采用TileLang进行算子快速原型设计与性能验证,证明了其在大规模模型训练中的实战价值。

TileLang_MUSA项目已在摩尔线程多代全功能GPU上完成功能验证与特性开发,验证了“高层语言+国产GPU”技术路线的可行性。


开源地址:https://github.com/MooreThreads/tilelang_musa

一、重新定义GPU算子编程,“零门槛”实现算子迁移

TileLang是一款基于张量分块(Tiling)抽象的高性能AI算子编程语言,属于领域特定语言(DSL),采用声明式语法与类Python前端,使开发者能以接近数学公式的形式描述计算意图,并由编译器自动完成循环优化、内存调度与代码生成,在保持底层性能的同时,大幅降低GPU及异构计算平台的编程复杂度。

在实际应用中,TileLang通过高级抽象降低开发门槛,具备跨平台能力,实现“一次编写、多架构运行”,编译器自动执行Layout推导、线程映射、Warp特化、流水线排布、内存优化等复杂优化,在保障性能的同时提升GPU计算的开发效率,已广泛应用于AI与机器学习、科学计算等领域。

TileLang-MUSA项目提供了一种介于底层汇编与高层DSL之间的“中间层”抽象,
在保留硬件控制力的同时,显著降低编程复杂度。

该项目硬件兼容性良好,已在摩尔线程多代全功能GPU上完成功能验证与打通,包括训推一体全功能智算卡MTT S5000MTT S4000

团队还实现了TileLang高层语义到摩尔线程GPU底层MUSA架构的精准映射。

  • Tensor Core加速:编译器能够自动调用MUSA的MMA(矩阵乘累加)指令,充分发挥硬件张量核心的峰值计算能力;
  • Tile-Level Pipeline:自动处理从全局内存(Global Memory)到共享内存(Shared Memory)再到寄存器(Registers)的多级数据搬运,利用MUSA异步拷贝指令掩盖访存延迟;
  • Warp级并行优化:完整支持Warp Specialization特性。

目前,基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%,为大规模应用提供了可靠保障。

在完成环境配置后,开发者可保留原有的import tilelang习惯,通过Cython编译后端直接在MUSA环境中运行TileLang代码。

二、实测兼顾开发效率与运行性能,代码量减少约90%

在实际算子开发实践中,TileLang-MUSA实现了让开发者“写得快”且“跑得快”。

以大语言模型中重要的FlashAttention-3和GEMM(通用矩阵乘)算子为例,在摩尔线程MTT S5000上的测试结果显示:

(1)开发效率倍增:相较手写MUSA C++代码,使用TileLang-MUSA的代码量减少了约90%,且代码逻辑更加清晰,极大降低了开发与维护成本。

(2)性能媲美手写:得益于编译器优化,生成的算子性能在典型配置下,Gemm最高可达手写优化版本的95%,FlashAttention-3可达手写优化版本的85%

(3)自动化调优:借助TileLang-MUSA的Auto-tuning机制,开发者可在MUSA架构的全功能GPU上快速搜索最优的分块策略(Tile Size)和流水线级数,轻松超越未经深度优化的基准实现。

TileLang-MUSA的推出,使TileLang用户能近乎零成本地将算子逻辑迁移至摩尔线程GPU,还为不熟悉MUSA指令集的AI工程师提供了高层次的开发入口,并通过支持FlashAttention等关键算子的高效开发,加速大语言模型等前沿AI应用在国产算力平台上的部署与落地。

结语:计划打造基于MUSA的深度学习统一平台

TileLang-MUSA的开源是摩尔线程构建国产算力生态的关键一步,摩尔线程计划持续推进平台与生态建设,致力于打造一个覆盖从单算子到完整大模型的国产算力统一加速平台。

其计划包括深度集成SGLang等主流AI框架,实现Transformer、MoE等复杂模型架构的跨算子调度与全局优化,完善调试和性能分析工具链,以及通过性能优化,开发更多MUSA架构定制扩展,使生成代码性能稳定达到手写优化版本的90%以上。

这将为构建一个开放、易用的国产算力开发生态提供工具支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大数据“杀熟”再引争议,“看人下菜碟”式价格歧视该休矣!

大数据“杀熟”再引争议,“看人下菜碟”式价格歧视该休矣!

时代周报
2026-01-16 20:42:04
商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

商务部回应加拿大油菜籽问题:将在规则框架内充分考虑加方合理诉求

澎湃新闻
2026-02-12 15:56:26
夸美国空气香甜的杨舒平,已被美驱逐出境,如今回国下场怎么样了

夸美国空气香甜的杨舒平,已被美驱逐出境,如今回国下场怎么样了

谈史论天地
2026-02-07 13:20:03
浙江一小区两年前“买房送黄金”,如今250万的房子市值缩水87万,送的1000克黄金暴涨到112万,当初没折现的业主资产增值约25万

浙江一小区两年前“买房送黄金”,如今250万的房子市值缩水87万,送的1000克黄金暴涨到112万,当初没折现的业主资产增值约25万

观威海
2026-02-12 09:46:13
印尼准备向加沙派遣多达8000名士兵,以支持特朗普成立的“和平委员会”

印尼准备向加沙派遣多达8000名士兵,以支持特朗普成立的“和平委员会”

咣当地球
2026-02-12 18:15:26
索赔54万!宁波24岁男子为寻找女友,从18楼用尼龙绳空降当场摔死

索赔54万!宁波24岁男子为寻找女友,从18楼用尼龙绳空降当场摔死

火山詩话
2026-02-11 06:35:03
为何高市早苗即将辞职?

为何高市早苗即将辞职?

寰宇大观察
2026-02-11 15:56:27
2026年,辽宁启动独生子女父母奖励:发放标准、所需材料?看看

2026年,辽宁启动独生子女父母奖励:发放标准、所需材料?看看

虎哥闲聊
2026-02-12 08:28:17
于谦好霸气,参加陶阳婚礼戴40万绿松石,坐100多万雷克萨斯回家!

于谦好霸气,参加陶阳婚礼戴40万绿松石,坐100多万雷克萨斯回家!

小娱乐悠悠
2026-02-12 10:43:50
日本传奇女双志田千阳官宣转为自由人!国羽劲敌正式转向韩国

日本传奇女双志田千阳官宣转为自由人!国羽劲敌正式转向韩国

小兰看体育
2026-02-12 12:14:06
你知道中国最大的资金外流通道是什么吗?

你知道中国最大的资金外流通道是什么吗?

流苏晚晴
2026-02-02 18:08:27
烛影斧声那晚,赵匡胤其实已看透结局:不动赵光义,是因为不敢赌

烛影斧声那晚,赵匡胤其实已看透结局:不动赵光义,是因为不敢赌

梁岱爱玩车
2026-02-11 09:56:12
一名国军闯入解放区,对我军战士说:快向首长报告,我是代号902

一名国军闯入解放区,对我军战士说:快向首长报告,我是代号902

谈古论今历史有道
2026-02-12 13:15:03
一农商行原董事长、一农信社原理事长春节前被查

一农商行原董事长、一农信社原理事长春节前被查

湘财Plus
2026-02-11 23:10:23
江西3人被查处

江西3人被查处

黄河新闻网吕梁频道
2026-02-12 08:30:55
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
600397,涨停!拟重大资产重组,整合钨产业链

600397,涨停!拟重大资产重组,整合钨产业链

数据宝
2026-02-12 11:12:42
戴口罩!戴口罩!戴口罩!春节进入高发期!

戴口罩!戴口罩!戴口罩!春节进入高发期!

美丽大北京
2026-02-12 03:40:39
A股:刚刚,大消息传来,释放一信号,明天将迎来大级别的行情!

A股:刚刚,大消息传来,释放一信号,明天将迎来大级别的行情!

夜深爱杂谈
2026-02-12 18:44:31
爱泼斯坦文件中,特朗普名字出现超过一百万次

爱泼斯坦文件中,特朗普名字出现超过一百万次

第一财经资讯
2026-02-12 01:24:14
2026-02-12 19:23:00
芯东西 incentive-icons
芯东西
专注AI芯片、半导体产业媒体
2200文章数 8148关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

美国新交付F35隐身战机没雷达 知情者:新雷达没造出来

头条要闻

美国新交付F35隐身战机没雷达 知情者:新雷达没造出来

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

体操运动员坠楼涉事教练被立案调查

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

教育
健康
艺术
本地
公开课

教育要闻

放假之我在家里当“德华”

转头就晕的耳石症,能开车上班吗?

艺术要闻

王献之的“9大神帖”才是大草笔法源头

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版