网易首页 > 网易号 > 正文 申请入驻

告别“硬堆料”时代:摩尔线程全功能GPU的技术路线图与生态突围样本

0
分享至


“全功能GPU的创新,就是一部算力进化史。”

在近日摩尔线程首届MUSA开发者大会(MDC 2025)的开场演讲中,摩尔线程创始人、董事长兼CEO张建中用这样一句话定义了过去几十年的GPU技术变革。这句话的潜台词是清晰的:在国产GPU赛道上,单纯比拼硬件参数的“硬堆料”时代正在过去,架构的通用性与软件生态的成熟度,正成为衡量技术护城河的新标尺。

从地下的盾构机大脑到指尖的眼科手术机器人,从气象大模型的云端推演到挖掘机的边缘计算,大会现场覆盖AI大模型&Agent、具身智能、科学计算、空间智能等前沿技术领域,延伸至工业智造、数字孪生、数字文娱、智慧医疗等领域的几十款创新应用,外加20+场专题论坛,将“软件生态”这个略显抽象的概念,具象化为可触摸的实体。


大会上,摩尔线程不仅展示了万卡集群的肌肉,更系统性地披露了其底层技术底座的演进逻辑——从MUSA架构的持续迭代到全新“花港”架构的亮相。这不仅是一次产品的更新,更是一次对国产GPU技术路线的“实地验证”:摩尔线程正试图通过架构层面的软硬协同,让国产算力从“可用”变为“好用的生产力”。


“花港”架构与“华山”芯片:以指令集重塑算力密度

在摩尔线程的技术路线图中,“花港”被定义为新一代全功能GPU架构。与以往单纯追求制程红利不同,“花港”架构的核心突破在于通过微架构设计来“榨取”性能


据大会披露的数据,基于新一代指令集架构,“花港”在同等工艺下实现了算力密度提升50%,能效提升10倍这种设计并非空中楼阁,而是为了承载即将面世的AI训推一体芯片——“华山”。

计算精度方面,“华山”芯片展现了对大模型时代需求的精准响应。它不仅支持从FP4到FP64的全精度端到端计算,还新增了MTFP6和MTFP4及混合低精度计算技术。这直接回应了当前大模型量化推理的主流趋势——通过降低精度损耗来换取更高的吞吐量。


架构层面的另一大革新在于互联与调度。面对万卡乃至十万卡集群的扩展需求,“华山”集成了自研的MTLink高速互联技术和新一代异步编程模型。


对于这一复杂的底层技术,张建中在演讲中给出了一个极具开发者视角的解释:

“我们希望利用异步编程模型,让开发者无感去操作芯片,让芯片自动为你服务。”

这种“无感”的背后,是硬件级对任务与资源调度机制的重构,旨在减少流水线中的“气泡”,提升并行执行效率。

架构的先进性最终需要通过集群来验证。基于“华山”的前序技术积累,摩尔线程发布的夸娥(KUAE)万卡智算集群已经交出了工程化的答卷:在Dense大模型上MFU(模型算力利用率)达到60%,训练线性扩展效率达95%。特别是在DeepSeek V3模型的复现中,摩尔线程通过自研FP8 GEMM的精细化优化,不仅突破了FP8累加精度的瓶颈,更实现了算力利用率高达90%的成绩。这证明了其架构在大规模工程实践中的可靠性。


MUSA 5.0软件栈:生态是核心护城河

如果说架构是骨架,软件栈则是灵魂。长期以来,CUDA生态的壁垒是国产GPU难以逾越的高墙。

“生态体系是GPU行业的核心护城河与价值所在。”张建中在大会上强调,摩尔线程致力于攻克从硬件到软件的核心技术挑战,目的就是“共同构建自立自强的国产计算产业生态”。

发布的MUSA 5.0软件栈,采取了一条“兼容主流+原生创新”的双轨策略。

兼容性方面,MUSA 5.0不仅原生支持MUSA C,还深度兼容TileLang、Triton等新兴编程语言。这种广泛的兼容性旨在降低开发者的迁移成本。

性能优化方面,为了解决兼容带来的性能折损,MUSA 5.0在底层计算库上进行了极致优化。数据显示,其核心计算库muDNN在HGEMM和FlashAttention等关键算子上的效率超过98%,通信效率达到97%。

软件栈的成熟度,最终要看它能否跑通真实的业务逻辑。在MDC 2025的展区,MUSA软件栈支撑下的多元化图景变得鲜活:

  • 在大模型推理端,摩尔线程与硅基流动的合作就是一个典型样本。通过深度适配MUSA软件栈,双方在DeepSeek R1 671B全量模型上实现了性能突破:S5000单卡Prefill吞吐突破4000 tokens/s,Decode吞吐突破1000 tokens/s。这一数据不仅树立了国产推理性能的新标杆,也验证了MUSA软件栈在处理复杂大模型时的从容。


  • 在硬核工业端雪浪云展示的盾构机大脑,利用全功能GPU的算力打通了盾构机七大控制系统;柳工的CLG922E挖掘机则通过板载的GPU模组实现了边缘侧的故障诊断与自动驾驶模型运行。

  • 在精准医疗端微眸医疗的眼科手术机器人,依托端侧算力实现了毫秒级的RGBD图像处理与微米级的手术操作。

  • 在科学计算端,摩尔线程联合北京大学高毅勤课题组,基于国产SPONGE软件,摩尔线程的全功能GPU正在加速分子动力学模拟,推动生命科学的底层突破。

这些横跨千行百业的实体展示,证明了摩尔线程已经把生态落实到一行行代码和一台台设备

此外,针对特定领域的痛点,MUSA 5.0还推出了差异化的工具链,如联合量子领域生态伙伴打造“QPU+GPU”智算融合平台,以及携手51SIM利用“图形+计算”能力加速自动驾驶世界模型的生成。

而随着AI计算的个人化,摩尔线程也在企业级市场之外完成了个人智算平台的关键拼图——MTT AIBOOK。与传统笔记本电脑不同,MTT AIBOOK针对开发者群体,在50TOPS异构算力基础上提供了开源计算加速库、通信库等核心组件的底层支撑,预置了VS Code、PyTorch、vLLM等全套开发环境,支持Linux/Windows/Android多环境切换,实现了AI学习与开发的开箱即用。配合摩尔学院20万开发者学习资源,AIBOOK或许可成为个人开发者接入国产AI生态的“入口级”载体。


谈及未来规划时,张建中表示,摩尔线程将在明年上半年开放中间语言MTX 1.0,并逐步开源计算加速库(MATE)、通信库(MT DeepEP)及系统管理框架。前者类似于CUDA的PTX,允许高阶开发者绕过上层封装,直接对GPU硬件资源进行细粒度的调度和优化,后者则有助于构建一个更具活力的开发者社区,驱动生态体系从“可用”向“好用”进化。


全功能GPU的“物理AI”拼图

在AI计算之外,“花港”架构并未放弃图形能力,反而通过“庐山”芯片强化了“图形+AI”的物理融合。

“庐山”芯片专注于高性能图形渲染,AI性能提升64倍,光线追踪性能提升50倍,并完整支持DirectX 12 Ultimate。这种设计思路试图利用AI算力来加速图形渲染流水线,从而实现从传统的“计算渲染”向“生成式渲染”的范式转变。这对于数字孪生、具身智能等“物理AI”场景至关重要。


正如张建中所预判的,未来的AI将从数字世界走向物理世界。无论是51SIM的自动驾驶仿真,还是光轮智能的具身智能数据合成,都需要一颗既懂AI又懂图形的“全功能GPU”。


结语

回顾摩尔线程过去五年的发展历程,从累计投入43亿元研发费用,到获批500多项授权专利,这家公司正在用实际行动构建一条完整的国产技术栈。展区那些正在运行的实体设备则证明,这个技术栈已经具备了解决实际问题的能力。

然而摩尔线程并不满足于此,大会发布的架构路线图,固然是一份面向未来的“预告”,但它更多是向全体开发者发出的一份“协同邀请函”,一起为国产GPU“好用”添加柴火。

“中国科技的自立自强应该会走得更快、走得更好,我们也希望摩尔线程持续为美好世界加速。”

张建中结束演讲的话语,既是对摩尔线程未来的期许,也是对中国计算产业的信心。MDC 2025展示的不仅仅是“花港”架构或MUSA 5.0软件栈的技术细节,更是一种构建自主计算生态的决心。在全功能GPU这条拥挤且艰难的赛道上,摩尔线程正试图通过架构的底层创新和软件生态的开放共建,为中国计算产业提供一个可行的、具备技术深度与演进潜力的替代方案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
45岁仍拍三级片追求刺激?从亿万富豪再到烂片女王,她追求是什么

45岁仍拍三级片追求刺激?从亿万富豪再到烂片女王,她追求是什么

丰谭笔录
2026-01-03 07:50:06
68岁上海阿姨要花92万元为“男友”买名表,“我们是有感情的,你们别管”

68岁上海阿姨要花92万元为“男友”买名表,“我们是有感情的,你们别管”

极目新闻
2026-01-04 11:10:57
“半夜掳走一国总统,没有比这更猖狂的了”

“半夜掳走一国总统,没有比这更猖狂的了”

观察者网
2026-01-03 23:42:06
如果事情属实,这将是巨大的底线溃败!

如果事情属实,这将是巨大的底线溃败!

胖胖说他不胖
2026-01-03 10:55:03
从拜仁大腿到米兰鸡肋,还失意于利物浦,全能战士被转会耽误了

从拜仁大腿到米兰鸡肋,还失意于利物浦,全能战士被转会耽误了

足篮大世界
2026-01-04 17:00:42
用了20+年的Windows激活方式,被一夜作废!Win11/Win10电话激活突然失效,微软没公告、没通知

用了20+年的Windows激活方式,被一夜作废!Win11/Win10电话激活突然失效,微软没公告、没通知

CSDN
2026-01-04 18:51:29
这和“真空”有啥区别,章子怡大胆穿衣,却没赢过保守的蒋勤勤

这和“真空”有啥区别,章子怡大胆穿衣,却没赢过保守的蒋勤勤

黄小仙的搞笑视频
2025-12-27 16:10:37
青鸟被爆九成是女性,港媒痛批:把防务当成了“军事家家酒”

青鸟被爆九成是女性,港媒痛批:把防务当成了“军事家家酒”

海峡导报社
2026-01-03 08:32:02
具俊晔元旦守着大S,俯身擦拭墓碑很憔悴,忙得连折叠椅都没打开

具俊晔元旦守着大S,俯身擦拭墓碑很憔悴,忙得连折叠椅都没打开

娱圈小愚
2026-01-04 14:25:24
蓉城新帅+茹萨都到了!队长不走继续争冠,海港5大冠军外援都走了

蓉城新帅+茹萨都到了!队长不走继续争冠,海港5大冠军外援都走了

刀锋体育
2026-01-04 10:17:32
绝不向中方出售?国产重器实现0.01毫米突破,终结日本天价进口

绝不向中方出售?国产重器实现0.01毫米突破,终结日本天价进口

坠入二次元的海洋
2026-01-04 06:15:40
三角洲高价值目标抓捕:直升机、特种车辆、战术,适配元首级目标

三角洲高价值目标抓捕:直升机、特种车辆、战术,适配元首级目标

形上谓道
2026-01-03 19:33:18
特朗普:何时将委内瑞拉 交还给委内瑞拉人将由美国 决定

特朗普:何时将委内瑞拉 交还给委内瑞拉人将由美国 决定

每日经济新闻
2026-01-04 11:37:05
大连黑天鹅被偷后续:嫌疑人已抓获,不止一只被吃,恐仅赔钱了事

大连黑天鹅被偷后续:嫌疑人已抓获,不止一只被吃,恐仅赔钱了事

单手搓核弹
2026-01-04 14:07:31
美国突袭委内瑞拉抓获马杜罗 多国强烈谴责

美国突袭委内瑞拉抓获马杜罗 多国强烈谴责

新京报
2026-01-03 18:12:06
1935年红军拿下腊子口后,战士们打开鲁大昌的仓库,里面有什么?

1935年红军拿下腊子口后,战士们打开鲁大昌的仓库,里面有什么?

古书记史
2026-01-03 01:06:30
霸气7连胜!阿森纳3-2客场逆转苦主 6分领跑英超 1.2亿欧铁腰双响

霸气7连胜!阿森纳3-2客场逆转苦主 6分领跑英超 1.2亿欧铁腰双响

我爱英超
2026-01-04 04:42:08
中国东方航空集团有限公司原党组书记、董事长刘绍勇被开除党籍

中国东方航空集团有限公司原党组书记、董事长刘绍勇被开除党籍

新京报
2026-01-04 16:09:11
一针实现肿瘤临床清零!多款癌症疫苗攻克胰腺癌、肺癌等12大癌种

一针实现肿瘤临床清零!多款癌症疫苗攻克胰腺癌、肺癌等12大癌种

无癌家园i
2026-01-04 10:51:53
特朗普不宣而战,美军已经开火,中俄介入局势,局面开始一边倒

特朗普不宣而战,美军已经开火,中俄介入局势,局面开始一边倒

博览历史
2025-12-31 20:50:44
2026-01-04 19:43:00
CSDN incentive-icons
CSDN
成就一亿技术人
26230文章数 242207关注度
往期回顾 全部

科技要闻

独家|宇树科技上市绿色通道被叫停

头条要闻

媒体:美军突袭抓获马杜罗 三个细节令人吃惊

头条要闻

媒体:美军突袭抓获马杜罗 三个细节令人吃惊

体育要闻

球队陷入危难,一名44岁教练选择复出打球

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

委内瑞拉变局对原油美元黄金的连锁冲击

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

健康
时尚
旅游
手机
军事航空

这些新疗法,让化疗不再那么痛苦

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

旅游要闻

陕西神木跻身2025“奔县游”热门县城TOP10

手机要闻

开年重磅性能旗舰 iQOO 15 Ultra春节前发布

军事要闻

美军突袭抓获马杜罗 三个细节值得关注

无障碍浏览 进入关怀版