网易首页 > 网易号 > 正文 申请入驻

万卡双突破!摩尔线程发布“花港”新架构!

0
分享至



国产GPU实现万卡训练与推理双突破,摩尔线程发布“花港”新架构

12月20日,北京——摩尔线程首届MUSA开发者大会(简称:MDC 2025)在北京中关村国际创新中心正式开幕。作为国内首个聚焦全功能GPU的开发者技术盛会,大会系统展示了摩尔线程以自主MUSA统一架构为核心的全栈技术成果,全面展现公司在高端全功能GPU领域的关键突破与前瞻布局。

本次发布的核心成果包括:

1、新架构“花港”亮相全功能GPU架构“花港”,支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍。未来并将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片。


2、“夸娥万卡”高效训练发布夸娥万卡智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平。


3、推理性能实现跨越摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

4、超节点架构前瞻分享面向下一代超大规模智算中心的MTT C256超节点架构,着眼高密硬件架构,实现极致智算性能。


5、全新个人智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与学习者。

6、图形进化与前沿探索揭晓硬件级光线追踪加速与自研AI生成式渲染技术,具身智能、科学智能(AI4S)、AI for 6G等前沿领域的深度布局,进一步印证了全功能GPU技术路线的广度与面向未来的可扩展性。

这一系列成果的发布,标志着摩尔线程已成功构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈,实现了从底层硬件到上层应用的系统化闭环。该体系为国产智能计算生态的持续演进与产业融合,提供了坚实、开放且可持续的平台级支撑。

战略基石:MUSA统一架构的进化与开放

MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。

MUSA不仅完整定义了从芯片设计到软件生态的统一技术标准,更代表了公司坚持底层创新、践行长期主义的战略核心,并为全功能GPU奠定了坚实的技术根基,可高效支持AI计算、图形渲染、物理仿真和科学计算、超高清视频编解码等全场景高性能计算。

历经五年深度研发与持续迭代,MUSA实现了软件性能的指数级跨越。全新升级的MUSA 5.0标志着架构步入成熟新阶段,在全栈统一性、极致效能与生态开放性上取得关键突破。

  • 编程生态全面升级原生MUSA C,深度兼容 TileLang、Triton 等编程语言,为开发者提供灵活高效的全栈开发体验。

  • 计算效能极致优化核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程。

  • 开源生态持续扩大计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力。

  • 前沿特性拓展边界即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力边界。

硬件核心:“花港”新架构与技术路线图

基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:

  • 计算性能显著提升基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。

  • 异步编程与超大规模互联集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。

  • 图形与AI深度融合内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。

  • 全栈自研与安全可信架构基于全栈自主研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,其中发明专利468项),具备全栈自研与自主可控的核心能力。通过四层硬件安全架构,提供从芯片到系统的可验证安全守护。

基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:

“华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。


“庐山”专攻高性能图形渲染。其图形性能实现全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。


基础设施:夸娥万卡集群,树立国产智算效率标杆

本次大会正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。

  • 在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈,充分释放国产GPU在大模型训练中的性能潜力。

  • 在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模型上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

  • 面向未来,发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。

迈向物理AI:图形技术持续进化,前瞻布局未来计算

在图形计算领域,摩尔线程持续推动国产GPU向兼容性更广、技术更深的方向发展。其产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API,并与国产主流CPU及操作系统完成了全栈适配,持续扩展游戏及专业应用的兼容覆盖。公司同时宣布,即将完整支持DirectX 12 Ultimate,进一步接轨行业顶级图形标准。

在核心渲染技术上,摩尔线程率先拥抱“图形+AI”范式革命,实现两项关键突破:

  • 迈入实时光追时代:基于“花港”架构的硬件光线追踪加速引擎,可实现对DirectX Raytracing (DXR)的支持,使实时、逼真的光影效果在国产GPU上成为可能。

  • 定义AI生成式渲染(AGR):推出全自研MTAGR 1.0技术,推动渲染技术范式从“计算”走向“生成”,为下一代数字内容创作及数字孪生等场景构建国产技术基座。

面向更广阔的未来计算场景,摩尔线程已展开前瞻性布局:

  • 具身智能全栈赋能:发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境。推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案,并宣布将于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA,以开放协作助力机器人产业研发效率提升。


  • 前沿融合计算探索:MUSA生态已与合作伙伴在科学智能(AI for Science)、量子科技、AI for 6G等前沿交叉领域展开探索工作,持续拓展全功能GPU作为通用算力底座的技术边界与应用价值。

生态加速:全面赋能开发者,发布个人AI算力平台

生态建设是GPU行业的核心壁垒与价值所在,摩尔线程构建了从硬件工具、算力支撑到人才培养的赋能体系。

  • 深化人才培养,建设MUSA生态枢纽:以摩尔学院为平台,摩尔线程已构建起产教融合的开发者成长体系,该平台汇聚近20万名开发者与学习者,并通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国 200多所高校,吸引超10万名学子参与。本次大会宣布建设MUSA生态中心,同时发布MUSA开发者计划,旨在为从AI学习探索到科研创新的各阶段创新者,提供算力支持与技术赋能。


  • 发布AI算力本,提供“开箱即用”的开发体验:作为连接开发者与MUSA生态的核心入口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力,首次实现从芯片、驱动到开发环境的全栈整合,不仅实现了专业AI开发的“开箱即用”,更创新地打破Linux开发、Windows办公与Android应用之间场景壁垒,将强大的AI能力转化为人人可及的生产力,赋能开发者在AI时代成为“超级个体”。


大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态。

结语:构筑自主基座,共赴智能未来

MDC 2025展示了从统一架构到核心芯片,从超大规模基础设施到开发者终端的技术全景,这不仅是一次全功能GPU技术路线的系统呈现,更是摩尔线程对自主计算未来的坚定承诺。

展望未来,摩尔线程将以MUSA为核心,坚持开放生态,与全球开发者及伙伴携手,共同构建下一代的智能计算体系,赋能千行百业,迈向智能新纪元。

—— 芯榜 ——

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
"老年人存款等级表"出炉,存到这个数才够养老,你还差多少?

"老年人存款等级表"出炉,存到这个数才够养老,你还差多少?

大果小果妈妈
2025-12-26 13:24:59
事实证明!陪马克龙回国的巩俐,可能已经走上了另一条大道

事实证明!陪马克龙回国的巩俐,可能已经走上了另一条大道

梦史
2025-12-13 11:46:11
普京:除了顿巴斯,其他可以谈

普京:除了顿巴斯,其他可以谈

观察者网
2025-12-26 21:24:05
39岁饺子馆老板深夜离世,妻子失声痛哭:我不该说那句气话

39岁饺子馆老板深夜离世,妻子失声痛哭:我不该说那句气话

丫头舫
2025-12-24 20:52:54
“再来人留学”倒闭了,留学行业寒冬已经来了

“再来人留学”倒闭了,留学行业寒冬已经来了

留学生日报
2025-12-25 21:55:08
白银还能更疯狂?库存耗尽、金银比坍塌,资深分析师喊出300美元天价

白银还能更疯狂?库存耗尽、金银比坍塌,资深分析师喊出300美元天价

华尔街见闻官方
2025-12-26 21:26:53
Google 这对组合拳太狠了!3 句话让我的 Idea 变成真 App,全程不写代码,爽翻!

Google 这对组合拳太狠了!3 句话让我的 Idea 变成真 App,全程不写代码,爽翻!

AI范儿
2025-12-25 14:01:00
1979 年对越反击战中国装备落后 20 年,美学者疑惑为何最终取胜

1979 年对越反击战中国装备落后 20 年,美学者疑惑为何最终取胜

磊子讲史
2025-12-24 17:33:59
高市早苗出招:到拼速度的时候了!日本高层赴俄,在中国背后捅刀

高市早苗出招:到拼速度的时候了!日本高层赴俄,在中国背后捅刀

墨兰史书
2025-12-27 02:30:03
吃完猪血后大便发黑,是肺在排毒?还是胃在排毒?告诉你真相

吃完猪血后大便发黑,是肺在排毒?还是胃在排毒?告诉你真相

39健康网
2025-12-20 19:41:17
黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

黄有龙做梦也没想到,自己花重金培养大的女儿,竟给赵薇做了嫁衣

查尔菲的笔记
2025-12-16 15:14:06
撕破脸了?骂张柏芝三胎全是赔钱货,向太出手曝光宁静嫁老外内幕

撕破脸了?骂张柏芝三胎全是赔钱货,向太出手曝光宁静嫁老外内幕

手工制作阿歼
2025-12-26 12:39:02
严防死守36年,利智还是输了,李连杰终是没放下一直亏欠的“她”

严防死守36年,利智还是输了,李连杰终是没放下一直亏欠的“她”

法老不说教
2025-12-24 18:25:17
倒霉透顶!男子只是睡了个午觉就被火化,惨叫15秒后死亡.....

倒霉透顶!男子只是睡了个午觉就被火化,惨叫15秒后死亡.....

谭老师地理工作室
2025-12-04 19:01:20
男演员被限制高消费,“涉案金额1118万”登热搜,本人发文回应

男演员被限制高消费,“涉案金额1118万”登热搜,本人发文回应

红星新闻
2025-12-25 20:41:16
特朗普刚松口,高市不装了,日本必须拥核?话音刚落朝鲜来了

特朗普刚松口,高市不装了,日本必须拥核?话音刚落朝鲜来了

博览历史
2025-12-25 18:26:29
狂扫1000吨黄金,美联储慌了,金价突破4500,中国底牌要藏不住了

狂扫1000吨黄金,美联储慌了,金价突破4500,中国底牌要藏不住了

趣文说娱
2025-12-26 16:31:37
罕见!法德英等国一致“强烈谴责”美国

罕见!法德英等国一致“强烈谴责”美国

环球时报国际
2025-12-26 08:58:18
利润缩水68亿!昔日全球第四车企被曝将停产,又一巨头撑不住了?

利润缩水68亿!昔日全球第四车企被曝将停产,又一巨头撑不住了?

品牌观察官
2025-12-23 22:49:13
美国部分参议员警告:全球半数国家可能没有美国大使

美国部分参议员警告:全球半数国家可能没有美国大使

新京报
2025-12-25 16:56:20
2025-12-27 03:52:49
芯榜 incentive-icons
芯榜
中国芯片排行榜
3933文章数 3217关注度
往期回顾 全部

科技要闻

收割3000亿!拼多多"土办法"熬死所有巨头

头条要闻

老人婚宴上被提醒孙女非亲生 做鉴定后忍3年忍不了了

头条要闻

老人婚宴上被提醒孙女非亲生 做鉴定后忍3年忍不了了

体育要闻

开翻航母之后,他决定亲手造一艘航母

娱乐要闻

王传君生病后近照变化大,面部浮肿

财经要闻

投资巨鳄罗杰斯最新持仓:只留四种资产

汽车要闻

两大CEO试驾 华为乾崑*启境开启首款猎装轿跑路测

态度原创

艺术
游戏
家居
亲子
教育

艺术要闻

你绝对想不到,佛陀微笑隐藏的秘密竟然是!

PS6或兼容PS1-PS5全世代游戏!索尼新专利曝光

家居要闻

格调时尚 智慧品质居所

亲子要闻

为什么买好衣服给孩子是个大坑?你绝对想不到!

教育要闻

不公布成绩排名其实也不耽误学生知道谁是优秀生谁是差生!

无障碍浏览 进入关怀版