网易首页 > 网易号 > 正文 申请入驻

摩尔线程大秀肌肉,国产GPU实现万卡训练与推理双突破

0
分享至

2025年12月20日,北京——摩尔线程首届MUSA开发者大会(简称:MDC 2025)在北京中关村国际创新中心正式开幕。作为国内首个聚焦全功能GPU的开发者技术盛会,大会系统展示了摩尔线程以自主MUSA统一架构为核心的全栈技术成果,全面展现公司在高端全功能GPU领域的关键突破与前瞻布局。



本次发布的核心成果包括:



1、新架构“花港”亮相:全功能GPU架构“花港”,支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍。未来并将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片。

2、“夸娥万卡”高效训练:发布夸娥万卡智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平。

3、推理性能实现跨越:摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

4、超节点架构前瞻:分享面向下一代超大规模智算中心的MTT C256超节点架构,着眼高密硬件架构,实现极致智算性能。

5、全新个人智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与学习者。

6、图形进化与前沿探索:揭晓硬件级光线追踪加速与自研AI生成式渲染技术,具身智能、科学智能(AI4S)、AI for 6G等前沿领域的深度布局,进一步印证了全功能GPU技术路线的广度与面向未来的可扩展性。

这一系列成果的发布,标志着摩尔线程已成功构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈,实现了从底层硬件到上层应用的系统化闭环。该体系为国产智能计算生态的持续演进与产业融合,提供了坚实、开放且可持续的平台级支撑。

战略基石:MUSA统一架构的进化与开放

MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。



MUSA不仅完整定义了从芯片设计到软件生态的统一技术标准,更代表了公司坚持底层创新、践行长期主义的战略核心,并为全功能GPU奠定了坚实的技术根基,可高效支持AI计算、图形渲染、物理仿真和科学计算、超高清视频编解码等全场景高性能计算。



历经五年深度研发与持续迭代,MUSA实现了软件性能的指数级跨越。全新升级的MUSA 5.0标志着架构步入成熟新阶段,在全栈统一性、极致效能与生态开放性上取得关键突破。

  • 编程生态全面升级:原生MUSA C,深度兼容 TileLang、Triton 等编程语言,为开发者提供灵活高效的全栈开发体验。
  • 计算效能极致优化:核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程。
  • 开源生态持续扩大:计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力。
  • 前沿特性拓展边界:即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力边界。

硬件核心:“花港”新架构与技术路线图

基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:

  • 计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。
  • 异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。
  • 图形与AI深度融合:内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。
  • 全栈自研与安全可信:架构基于全栈自主研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,其中发明专利468项),具备全栈自研与自主可控的核心能力。通过四层硬件安全架构,提供从芯片到系统的可验证安全守护。

基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:

  • “华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。



  • “庐山”专攻高性能图形渲染。其图形性能实现全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。



基础设施:夸娥万卡集群,树立国产智算效率标杆

本次大会正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。



  • 在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈,充分释放国产GPU在大模型训练中的性能潜力。



  • 在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模型上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。






  • 面向未来,发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。



迈向物理AI:图形技术持续进化,前瞻布局未来计算

在图形计算领域,摩尔线程持续推动国产GPU向兼容性更广、技术更深的方向发展。其产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API,并与国产主流CPU及操作系统完成了全栈适配,持续扩展游戏及专业应用的兼容覆盖。公司同时宣布,即将完整支持DirectX 12 Ultimate,进一步接轨行业顶级图形标准。



在核心渲染技术上,摩尔线程率先拥抱“图形+AI”范式革命,实现两项关键突破:

  • 迈入实时光追时代:基于“花港”架构的硬件光线追踪加速引擎,可实现对DirectX Raytracing (DXR)的支持,使实时、逼真的光影效果在国产GPU上成为可能。
  • 定义AI生成式渲染(AGR):推出全自研MTAGR 1.0技术,推动渲染技术范式从“计算”走向“生成”,为下一代数字内容创作及数字孪生等场景构建国产技术基座。

面向更广阔的未来计算场景,摩尔线程已展开前瞻性布局:

  • 具身智能全栈赋能:发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境。推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案,并宣布将于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA,以开放协作助力机器人产业研发效率提升。



  • 前沿融合计算探索:MUSA生态已与合作伙伴在科学智能(AI for Science)、量子科技、AI for 6G等前沿交叉领域展开探索工作,持续拓展全功能GPU作为通用算力底座的技术边界与应用价值。

生态加速:全面赋能开发者,发布个人AI算力平台

生态建设是GPU行业的核心壁垒与价值所在,摩尔线程构建了从硬件工具、算力支撑到人才培养的赋能体系。

  • 深化人才培养,建设MUSA生态枢纽:以摩尔学院为平台,摩尔线程已构建起产教融合的开发者成长体系,该平台汇聚近20万名开发者与学习者,并通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与。本次大会宣布建设MUSA生态中心,同时发布MUSA开发者计划,旨在为从AI学习探索到科研创新的各阶段创新者,提供算力支持与技术赋能。



  • 发布AI算力本,提供“开箱即用”的开发体验:作为连接开发者与MUSA生态的核心入口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力,首次实现从芯片、驱动到开发环境的全栈整合,不仅实现了专业AI开发的“开箱即用”,更创新地打破Linux开发、Windows办公与Android应用之间场景壁垒,将强大的AI能力转化为人人可及的生产力,赋能开发者在AI时代成为“超级个体”。



大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态。

结语:构筑自主基座,共赴智能未来

MDC 2025展示了从统一架构到核心芯片,从超大规模基础设施到开发者终端的技术全景,这不仅是一次全功能GPU技术路线的系统呈现,更是摩尔线程对自主计算未来的坚定承诺。

展望未来,摩尔线程将以MUSA为核心,坚持开放生态,与全球开发者及伙伴携手,共同构建下一代的智能计算体系,赋能千行百业,迈向智能新纪元。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马杜罗被抓走,武契奇动摇了,关键时刻中国扛旗,王毅发出最强音

马杜罗被抓走,武契奇动摇了,关键时刻中国扛旗,王毅发出最强音

素年文史
2026-01-05 20:15:03
楼市大局已定?2026年的房价,已经出现这4大迹象!

楼市大局已定?2026年的房价,已经出现这4大迹象!

平说财经
2026-01-06 23:49:39
事态升级!闫学晶嚣张不认错,再现丑恶嘴脸,离谱发言谁也救不了

事态升级!闫学晶嚣张不认错,再现丑恶嘴脸,离谱发言谁也救不了

李健政观察
2026-01-06 19:13:28
雷军的道歉,打了多少友军的脸

雷军的道歉,打了多少友军的脸

此地无言
2026-01-06 23:39:23
冉莹颖直播忏悔:我败光亿万资产,丈夫邹市明被迫复出拳坛

冉莹颖直播忏悔:我败光亿万资产,丈夫邹市明被迫复出拳坛

赶鸭子上架
2026-01-05 21:49:38
上海启动“稳岗留工”工作

上海启动“稳岗留工”工作

中国青年报
2026-01-06 14:14:20
强援报到,火箭双向合同签下冠军后卫,他曾让马刺卡斯尔让出球权

强援报到,火箭双向合同签下冠军后卫,他曾让马刺卡斯尔让出球权

苏言朝
2026-01-05 22:52:36
有个性的女生就是会穿,花纹瑜伽裤轻松有活力,显身材又耐看

有个性的女生就是会穿,花纹瑜伽裤轻松有活力,显身材又耐看

小乔古装汉服
2025-12-07 13:02:50
马斯克一句话,全网炸了:我们可能真的进入了“奇点”

马斯克一句话,全网炸了:我们可能真的进入了“奇点”

AI范儿
2026-01-05 11:46:03
佐香园被抵制之后轮到统厨了,还有网友爆料闫学晶会参加春晚

佐香园被抵制之后轮到统厨了,还有网友爆料闫学晶会参加春晚

映射生活的身影
2026-01-06 12:30:49
如何看待茅台设立新公司,经营范围包含芯片和区块链业务?

如何看待茅台设立新公司,经营范围包含芯片和区块链业务?

闻号说经济
2026-01-06 11:56:27
房子里有“不干净”的东西,会有以下3种特征,占一样也不得了

房子里有“不干净”的东西,会有以下3种特征,占一样也不得了

神奇故事
2026-01-05 23:24:05
报应来了吧!欧洲终将为自己的无知买单,格陵兰岛保不住了!

报应来了吧!欧洲终将为自己的无知买单,格陵兰岛保不住了!

达文西看世界
2026-01-06 16:59:32
继续引援脚步,多位媒体人:北京首钢正在接触前NBA球员麦基

继续引援脚步,多位媒体人:北京首钢正在接触前NBA球员麦基

懂球帝
2026-01-06 22:40:03
存储彻底爆了!闪迪,半年十倍!A股存储概念图都传包浆了...

存储彻底爆了!闪迪,半年十倍!A股存储概念图都传包浆了...

金石随笔
2026-01-07 00:09:20
南京下雪了!

南京下雪了!

鲁中晨报
2026-01-06 15:01:03
官方:成都蓉城签下北京国安前锋王子铭

官方:成都蓉城签下北京国安前锋王子铭

懂球帝
2026-01-06 17:21:08
真当中国不敢动手?中方向全世界宣布:推出1900亿大项目

真当中国不敢动手?中方向全世界宣布:推出1900亿大项目

烈史
2025-12-26 20:44:58
爆发冲突,有人受伤!深圳知名商场连夜发布说明!“警察到场协调”

爆发冲突,有人受伤!深圳知名商场连夜发布说明!“警察到场协调”

南方都市报
2026-01-06 09:44:55
美国发动对委内瑞拉战争之前,可能已与俄罗斯和中国达成默契

美国发动对委内瑞拉战争之前,可能已与俄罗斯和中国达成默契

碳基生物关怀组织
2026-01-03 23:30:35
2026-01-07 01:31:00
全球半导体观察
全球半导体观察
半导体产业研究机构
2629文章数 1662关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

13岁男孩餐馆内被烫伤致死:四肢被烫熟 腿像大象腿

头条要闻

13岁男孩餐馆内被烫伤致死:四肢被烫熟 腿像大象腿

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

50万亿存款"洪流"将至 四大去向引关注

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

时尚
旅游
教育
房产
亲子

冬天,“大衣”是中年女人的穿搭刚需,这样搭配时髦提气质

旅游要闻

就在地铁口,深圳这片“绿野仙踪”又要刷屏!

教育要闻

考试复习和打工和创业的对比-《中考高考备考心理提升训练特辑-12》

房产要闻

爆发!三亚开年超千亩城更计划曝光,香港城砸下100亿!

亲子要闻

孩子叫你“妈妈”和“妈”,是何感受?

无障碍浏览 进入关怀版