网易首页 > 网易号 > 正文 申请入驻

万卡双突破!摩尔线程发布“花港”新架构!

0
分享至



国产GPU实现万卡训练与推理双突破,摩尔线程发布“花港”新架构

12月20日,北京——摩尔线程首届MUSA开发者大会(简称:MDC 2025)在北京中关村国际创新中心正式开幕。作为国内首个聚焦全功能GPU的开发者技术盛会,大会系统展示了摩尔线程以自主MUSA统一架构为核心的全栈技术成果,全面展现公司在高端全功能GPU领域的关键突破与前瞻布局。

本次发布的核心成果包括:

1、新架构“花港”亮相全功能GPU架构“花港”,支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍。未来并将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片。


2、“夸娥万卡”高效训练发布夸娥万卡智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠性,在多项关键精度指标上达到国际主流水平。


3、推理性能实现跨越摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

4、超节点架构前瞻分享面向下一代超大规模智算中心的MTT C256超节点架构,着眼高密硬件架构,实现极致智算性能。


5、全新个人智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与学习者。

6、图形进化与前沿探索揭晓硬件级光线追踪加速与自研AI生成式渲染技术,具身智能、科学智能(AI4S)、AI for 6G等前沿领域的深度布局,进一步印证了全功能GPU技术路线的广度与面向未来的可扩展性。

这一系列成果的发布,标志着摩尔线程已成功构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈,实现了从底层硬件到上层应用的系统化闭环。该体系为国产智能计算生态的持续演进与产业融合,提供了坚实、开放且可持续的平台级支撑。

战略基石:MUSA统一架构的进化与开放

MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。

MUSA不仅完整定义了从芯片设计到软件生态的统一技术标准,更代表了公司坚持底层创新、践行长期主义的战略核心,并为全功能GPU奠定了坚实的技术根基,可高效支持AI计算、图形渲染、物理仿真和科学计算、超高清视频编解码等全场景高性能计算。

历经五年深度研发与持续迭代,MUSA实现了软件性能的指数级跨越。全新升级的MUSA 5.0标志着架构步入成熟新阶段,在全栈统一性、极致效能与生态开放性上取得关键突破。

  • 编程生态全面升级原生MUSA C,深度兼容 TileLang、Triton 等编程语言,为开发者提供灵活高效的全栈开发体验。

  • 计算效能极致优化核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程。

  • 开源生态持续扩大计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力。

  • 前沿特性拓展边界即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力边界。

硬件核心:“花港”新架构与技术路线图

基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:

  • 计算性能显著提升基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。

  • 异步编程与超大规模互联集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。

  • 图形与AI深度融合内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。

  • 全栈自研与安全可信架构基于全栈自主研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,其中发明专利468项),具备全栈自研与自主可控的核心能力。通过四层硬件安全架构,提供从芯片到系统的可验证安全守护。

基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:

“华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。


“庐山”专攻高性能图形渲染。其图形性能实现全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。


基础设施:夸娥万卡集群,树立国产智算效率标杆

本次大会正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。

  • 在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈,充分释放国产GPU在大模型训练中的性能潜力。

  • 在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模型上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

  • 面向未来,发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。

迈向物理AI:图形技术持续进化,前瞻布局未来计算

在图形计算领域,摩尔线程持续推动国产GPU向兼容性更广、技术更深的方向发展。其产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API,并与国产主流CPU及操作系统完成了全栈适配,持续扩展游戏及专业应用的兼容覆盖。公司同时宣布,即将完整支持DirectX 12 Ultimate,进一步接轨行业顶级图形标准。

在核心渲染技术上,摩尔线程率先拥抱“图形+AI”范式革命,实现两项关键突破:

  • 迈入实时光追时代:基于“花港”架构的硬件光线追踪加速引擎,可实现对DirectX Raytracing (DXR)的支持,使实时、逼真的光影效果在国产GPU上成为可能。

  • 定义AI生成式渲染(AGR):推出全自研MTAGR 1.0技术,推动渲染技术范式从“计算”走向“生成”,为下一代数字内容创作及数字孪生等场景构建国产技术基座。

面向更广阔的未来计算场景,摩尔线程已展开前瞻性布局:

  • 具身智能全栈赋能:发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建了开发、仿真、训练的高效统一环境。推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群“端云结合”的MT Robot具身智能解决方案,并宣布将于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA,以开放协作助力机器人产业研发效率提升。


  • 前沿融合计算探索:MUSA生态已与合作伙伴在科学智能(AI for Science)、量子科技、AI for 6G等前沿交叉领域展开探索工作,持续拓展全功能GPU作为通用算力底座的技术边界与应用价值。

生态加速:全面赋能开发者,发布个人AI算力平台

生态建设是GPU行业的核心壁垒与价值所在,摩尔线程构建了从硬件工具、算力支撑到人才培养的赋能体系。

  • 深化人才培养,建设MUSA生态枢纽:以摩尔学院为平台,摩尔线程已构建起产教融合的开发者成长体系,该平台汇聚近20万名开发者与学习者,并通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国 200多所高校,吸引超10万名学子参与。本次大会宣布建设MUSA生态中心,同时发布MUSA开发者计划,旨在为从AI学习探索到科研创新的各阶段创新者,提供算力支持与技术赋能。


  • 发布AI算力本,提供“开箱即用”的开发体验:作为连接开发者与MUSA生态的核心入口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力,首次实现从芯片、驱动到开发环境的全栈整合,不仅实现了专业AI开发的“开箱即用”,更创新地打破Linux开发、Windows办公与Android应用之间场景壁垒,将强大的AI能力转化为人人可及的生产力,赋能开发者在AI时代成为“超级个体”。


大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态。

结语:构筑自主基座,共赴智能未来

MDC 2025展示了从统一架构到核心芯片,从超大规模基础设施到开发者终端的技术全景,这不仅是一次全功能GPU技术路线的系统呈现,更是摩尔线程对自主计算未来的坚定承诺。

展望未来,摩尔线程将以MUSA为核心,坚持开放生态,与全球开发者及伙伴携手,共同构建下一代的智能计算体系,赋能千行百业,迈向智能新纪元。

—— 芯榜 ——

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

天天热点见闻
2026-04-19 08:13:15
重要信号显现!外资转向,加仓这些A股

重要信号显现!外资转向,加仓这些A股

新浪财经
2026-04-19 20:07:13
伊朗确认将参加2026年美加墨世界杯

伊朗确认将参加2026年美加墨世界杯

界面新闻
2026-04-19 22:44:47
天王山曼城2-1险胜阿森纳!哈兰德进球,英超争冠进入曼城时间!

天王山曼城2-1险胜阿森纳!哈兰德进球,英超争冠进入曼城时间!

海浪星体育
2026-04-20 01:28:17
汪小菲松口,马筱梅野心实现,名字取好太敷衍,张兰不忍了

汪小菲松口,马筱梅野心实现,名字取好太敷衍,张兰不忍了

观察鉴娱
2026-04-05 21:16:37
不敢相信她有五十多岁了

不敢相信她有五十多岁了

科学发掘
2026-04-19 21:09:22
红果 “拔管” 引爆短剧圈:90%公司将出局,迟到的行业大洗牌?

红果 “拔管” 引爆短剧圈:90%公司将出局,迟到的行业大洗牌?

老特有话说
2026-03-09 15:16:53
美国洛马怎么也没想到,没缴中国的990亿罚单,后果竟如此严重了

美国洛马怎么也没想到,没缴中国的990亿罚单,后果竟如此严重了

叹知
2026-04-19 21:19:26
很多欧美高管访问中国以后,回国后,为啥都汗毛直立,压力巨大

很多欧美高管访问中国以后,回国后,为啥都汗毛直立,压力巨大

说历史的老牢
2026-04-19 19:21:36
亚锦赛中国女排选朱婷还是选李盈莹,赵勇已给出了肯定答案

亚锦赛中国女排选朱婷还是选李盈莹,赵勇已给出了肯定答案

体育快递小哥哥
2026-04-19 16:59:40
快讯!伊朗正式通知美国:下一轮谈判,不奉陪了!

快讯!伊朗正式通知美国:下一轮谈判,不奉陪了!

达文西看世界
2026-04-19 07:15:02
空房交物业费合理吗?2026年物业费新规:这4种情况一分不掏

空房交物业费合理吗?2026年物业费新规:这4种情况一分不掏

老特有话说
2026-04-15 15:11:16
1分29秒,戴维打进尤文意甲主场自2022年8月以来最快进球

1分29秒,戴维打进尤文意甲主场自2022年8月以来最快进球

懂球帝
2026-04-20 03:12:07
彻底怒了!俄军发动今年最大打击,乌克兰和北约遭重创

彻底怒了!俄军发动今年最大打击,乌克兰和北约遭重创

兵国大事
2026-04-18 18:17:27
李小冉疑发文回应退出《浪姐》:努力赶上优秀的姐姐们

李小冉疑发文回应退出《浪姐》:努力赶上优秀的姐姐们

爱吃冰棍的小痞子
2026-04-20 01:07:16
魏建军现场发飙:你们没BBA那个品味

魏建军现场发飙:你们没BBA那个品味

热点科技
2026-04-19 17:07:34
别被今天的太阳“骗”了!下一波暴雨,马上到广东

别被今天的太阳“骗”了!下一波暴雨,马上到广东

新浪财经
2026-04-19 14:34:10
正大光明官宣!中国舰艇编队过航横当水道

正大光明官宣!中国舰艇编队过航横当水道

武器纵论
2026-04-19 21:56:32
陈乔恩不忍了!公开回应老公艾伦将私生子带回家,她才不是软柿子

陈乔恩不忍了!公开回应老公艾伦将私生子带回家,她才不是软柿子

八卦王者
2026-04-18 16:41:43
摸景甜胸侧,抱李雪琴胳膊,31岁的他综艺翻车,为何如此没分寸感

摸景甜胸侧,抱李雪琴胳膊,31岁的他综艺翻车,为何如此没分寸感

草莓解说体育
2026-04-15 04:23:51
2026-04-20 03:48:49
芯榜 incentive-icons
芯榜
中国芯片排行榜
4489文章数 3247关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

教育
亲子
家居
艺术
军事航空

教育要闻

655家单位、1.29万个岗位,湖南用心帮大学生找工作

亲子要闻

孩子总打喷嚏、起疹子,时过敏吗?

家居要闻

法式线条 时光静淌

艺术要闻

超模施特洛耶克写真曝光,简直美到窒息,别错过!

军事要闻

伊朗逼退美扫雷艇:美方求给15分钟撤退

无障碍浏览 进入关怀版