网易首页 > 网易号 > 正文 申请入驻

摩尔线程,走英伟达的路,也走自己的路

0
分享至


图片来自AI生成

在完成资本市场的关键一跃之后,摩尔线程要回答更大的问题。

在摩尔线程首届MUSA开发者大会(简称:MDC 2025)上,摩尔线程创始人、董事长兼首席执行官张建中拿出了一连串的“硬货”,全功能GPU架构“花港”,夸娥万卡智算集群,下一代超节点架构,搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK等。

如果只看产品名、参数和发布节奏,这场MDC 2025很容易被误解成一次例行升级。但把张建中两个多小时的演讲完整听下来,会发现摩尔线程想传递的并不只是国产GPU又快了多少,而是一个核心趋势:国产GPU,终于像一家真正的基础设施公司那样思考问题了。

摩尔线程素来被视为“中国版英伟达”,这体现在它的方方面面,张建中曾任英伟达全球副总裁、中国区总经理,在GPU行业深耕近二十年,团队并不缺少英伟达履历的人,公司行事风格和英伟达很像,譬如MDC就对标英伟达的GTC。

之所以摩尔线程选择全功能GPU,也和英伟达“通用并行计算”的思路一致,不做AI-only 加速器,图形、AI、HPC、视频共存,他们认为,下一代应用一定是混合计算,而不是单一模型推理。

英伟达最被低估的,不是芯片,而是 CUDA 生态,摩尔线程最容易被忽略的也是 MUSA。英伟达真正完成质变,是从 GPU 公司变成算力基础设施公司,摩尔线程这两年的变化也非常明显,从单卡到万卡集群,从追求性能到追求稳定性、线性度、MFU等系统级指标。

但,若只看到“像英伟达”,就会得出一个错误结论,摩尔线程是在“复刻英伟达”,其实不然,英伟达成长在一个高度全球化、低摩擦的产业环境里,摩尔线程则要面对供应链不确定性、技术封锁、国产生态薄弱等难题,这是英伟达当年不需要做的题目。

更确切的说法是,摩尔线程在用英伟达的方法论,解决中国自己的算力问题,在中国现有产业条件下,重走一遍GPU的必经之路。


为什么是全功能GPU?

在张建中演讲的开始,首先阐释了摩尔线程为何要做全功能GPU。“全功能GPU的创新,就是一部算力进化史。”他说。

如果回顾 GPU 的发展史,会发现它并不是为某一类应用而生,而是在持续拓展自身的计算边界。早期 GPU 主要承担图形与 3D 渲染任务;进入本世纪后,随着可编程能力的引入,GPU 开始向通用并行计算平台演进。其后,GPU 在科学计算和深度学习中的广泛应用,使其逐步成为人工智能时代的核心算力载体。

随着 Transformer 架构推动生成式 AI 爆发,人工智能正从感知 AI、生成式 AI 迈向 Agentic AI,并进一步走向与现实世界深度融合的物理 AI 阶段。未来五到十年,具身智能等新形态应用,要求算力平台同时具备计算、仿真、图形与感知能力,这并非单一功能加速器可以胜任。

张建中表示,从更长周期来看,未来五到十年的关键应用形态,很可能集中体现在具身智能领域。具身智能通过将人工智能能力嵌入真实世界的物理实体之中,推动虚拟世界、数字世界与物理世界的深度融合,而这背后所依赖的,正是能够支撑复杂计算形态的物理 AI 基础设施。

在这一演进过程中,“3D + AI + HPC” 并非偶然组合,而是全功能 GPU 自然演进的结果。随着 GPU 在图形、计算与仿真等多个维度能力的不断融合,其逐步演化为支撑新一代科技发展的核心基础设施。实践已经反复证明,

在张建中看来,基于全功能 GPU 构建的算力基础设施,更有能力支撑技术体系的持续演进与长期领先。

从技术架构角度看,全功能 GPU 的核心在于其内部集成的多类计算引擎,实现对多样化计算需求的统一支撑。当前,全功能 GPU 主要包含四类核心计算引擎:

首先是 AI 计算引擎,覆盖模型训练、推理以及训推一体等典型场景,是支撑大模型与各类 AI 应用的基础能力。

其次是 3D 图形渲染引擎,为数字内容生产、数字孪生、仿真可视化等场景提供高性能图形处理能力。

第三是 高性能计算与物理仿真引擎。这一能力在科学计算和 AI for Science 场景中具有重要价值,能够支撑复杂物理过程模拟与大规模科学计算任务。

第四是 智能视频编解码引擎。尽管这一能力往往容易被低估,但在云端计算成为主流的背景下,视觉仍是人类感知计算结果的主要方式。高效的视频编解码能力,决定了云端算力成果能否被稳定、低成本地传递至终端用户。

MUSA 才是“第一产品”

MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。

一个完整MUSA的统一系统架构,最底层是摩尔线程全功能GPU,可以去处理各种行业、不同精度、不同类型和不同格式的数据。

在全功能GPU之上,是硬件系统,摩尔线程的智算集群叫作夸娥。夸娥智算集群可大可小,小到一个小的系统,大到一个万卡集群,十万卡集群,甚至更大的超大规模。

在硬件基础之上,摩尔线程搭建所有的软件栈。首先是MUSA全套软件栈,包括所有的加速库,所有的开发者调试工具和开发者的应用案例和实例,利用全套MUSA体系结构能够在基础之上去搭建夸娥的基础软件。

在这一基础上,摩尔线程继续建设MUSA生态,可以看出,MUSA是一个从芯片到生态的完整系统。


本次MUSA 升级至5.0,标志着架构步入成熟。原生MUSA C,深度兼容 TileLang、Triton 等编程语言,核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程。

摩尔线程计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力。据悉,摩尔线程即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力边界。

“MUSA不光是支持国际上通用的CPU系统,同时也支持国产的CPU操作系统和国内的开发环境。利用我们国产的生态,结合国际的生态,能够完美支撑AI、3D图形和科学计算应用当中的方方面面。“张建中表示,摩尔线程统一软件栈能够覆盖全系列产品,覆盖“云边端”三个系列,这些产品都可以用同一套软件来支撑不同的硬件产品。

“花港”新架构、两款芯片和夸娥万卡集群

过去几年,国产GPU厂商最容易被问到的问题只有一个:“你们性能追到哪一代了?”摩尔线程给出了自己的答案,基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:

计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。

异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。

图形与AI深度融合:内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。

全栈自研与安全可信:架构基于全栈自主研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,其中发明专利468项),具备全栈自研与自主可控的核心能力。通过四层硬件安全架构,提供从芯片到系统的可验证安全守护。

基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:

“华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。


“庐山”专攻高性能图形渲染。其图形性能实现全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。

人工智能基础设施的边界早已突破芯片的边界,摩尔线程也将自己的能力拓展到集群系统层面。

本次大会,摩尔线程正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。

在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈,充分释放国产GPU在大模型训练中的性能潜力。

在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模型上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

面向未来,发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。

摩尔线程这场大会,更像是一种国产算力进入长期主义阶段的宣言。这条路不会快,也不会轻松,但至少,从这次MDC开始,它不再是零散的点,而是一条能被复述、被理解、被跟随的路线。(本文作者 | 张帅,编辑 | 盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

有其母必有其女!张柏芝母亲风流不输女儿,55岁全裸拍三级片

橙星文娱
2026-03-29 00:22:53
巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

巴基斯坦战略专家:这三场战争已表明,中国才是世界最强超级大国

甜美蜜桃派
2026-05-07 18:35:53
张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

张本智和再度豪言夺冠!日媒力挺:马龙樊振东隐退中国队实力大减

颜小白的篮球梦
2026-05-10 08:32:23
人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

人老了确实没太大意思,我妈今年72岁,独自在家每天就做这两件事

心理观察局
2026-05-04 11:19:11
潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

潘江:比赛主要输在篮板球上,对刘传兴的使用是赛前讨论过的

懂球帝
2026-05-10 22:57:35
从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

从确诊到去世只15天,“央视最帅主持人”的遭遇给所有人提了个醒

娱小余
2026-05-10 23:40:39
特朗普懵了!最后一条路,也被堵死了!

特朗普懵了!最后一条路,也被堵死了!

大嘴说天下
2026-05-09 20:24:37
某地“日前”出现一例汉坦病毒致死病例

某地“日前”出现一例汉坦病毒致死病例

一个生物狗的科普小园
2026-05-10 08:51:13
预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

预计11日1时至8时,济南历下区、市中区、槐荫区、天桥区、历城区、南山区和起步区将有雷阵雨,局部10级以上阵风!

鲁中晨报
2026-05-10 17:54:04
德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

德媒主编访华归来:深圳街头看到的一幕,让我为欧洲捏了一把冷汗

補懂事的孩紙
2026-05-10 15:27:34
“爱必享”糖果中检出“伟哥”?上海市监局回应

“爱必享”糖果中检出“伟哥”?上海市监局回应

闪电新闻
2026-05-09 13:01:47
5月10日俄乌:俄罗斯又耍无赖了

5月10日俄乌:俄罗斯又耍无赖了

山河路口
2026-05-10 20:11:00
不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

不得不承认,俄罗斯已经走到了退无可退的悬崖边上!

阿七说史
2026-05-10 05:10:06
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

一觉醒来,成了全球首富的老婆?和贝索斯太太撞名,22岁妹子被骂懵了...

英国那些事儿
2026-05-10 23:20:09
惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

惯子如杀子!孩子这几种表现说明已经被惯坏了,再不改就来不及了

木言观
2026-04-29 22:28:49
全亚洲穿比基尼最好看的女人,身材到底有多迷人?

全亚洲穿比基尼最好看的女人,身材到底有多迷人?

书画艺术收藏
2026-04-03 19:30:09
奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

奚梦瑶独自在香港逛街!手捂肚子表情好痛苦,小腹隆起引三胎猜疑

漫婷侃娱乐
2026-05-07 22:25:01
值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

值得警惕!万万没想到,伊朗真正的内鬼,根本不是人

华史谈
2026-05-10 09:19:37
阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

阿斯:利物浦致电皇马,询问哈维-阿隆索接班斯洛特

懂球帝
2026-05-10 20:05:06
2026-05-11 01:16:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
133376文章数 862150关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

家居
健康
手机
时尚
旅游

家居要闻

菁英人居 全能豪宅

干细胞能让人“返老还童”吗

手机要闻

OPPO Reno16系列参数全曝光,就差价格了

真爱大牌|| 用了4年都不舍得换,终于把小贵的价格也磨下来了

旅游要闻

重庆新增一夜景打卡点!磁器口步行街看大学生“脑洞”建筑

无障碍浏览 进入关怀版