网易首页 > 网易号 > 正文 申请入驻

摩尔线程,走英伟达的路,也走自己的路

0
分享至


图片来自AI生成

在完成资本市场的关键一跃之后,摩尔线程要回答更大的问题。

在摩尔线程首届MUSA开发者大会(简称:MDC 2025)上,摩尔线程创始人、董事长兼首席执行官张建中拿出了一连串的“硬货”,全功能GPU架构“花港”,夸娥万卡智算集群,下一代超节点架构,搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK等。

如果只看产品名、参数和发布节奏,这场MDC 2025很容易被误解成一次例行升级。但把张建中两个多小时的演讲完整听下来,会发现摩尔线程想传递的并不只是国产GPU又快了多少,而是一个核心趋势:国产GPU,终于像一家真正的基础设施公司那样思考问题了。

摩尔线程素来被视为“中国版英伟达”,这体现在它的方方面面,张建中曾任英伟达全球副总裁、中国区总经理,在GPU行业深耕近二十年,团队并不缺少英伟达履历的人,公司行事风格和英伟达很像,譬如MDC就对标英伟达的GTC。

之所以摩尔线程选择全功能GPU,也和英伟达“通用并行计算”的思路一致,不做AI-only 加速器,图形、AI、HPC、视频共存,他们认为,下一代应用一定是混合计算,而不是单一模型推理。

英伟达最被低估的,不是芯片,而是 CUDA 生态,摩尔线程最容易被忽略的也是 MUSA。英伟达真正完成质变,是从 GPU 公司变成算力基础设施公司,摩尔线程这两年的变化也非常明显,从单卡到万卡集群,从追求性能到追求稳定性、线性度、MFU等系统级指标。

但,若只看到“像英伟达”,就会得出一个错误结论,摩尔线程是在“复刻英伟达”,其实不然,英伟达成长在一个高度全球化、低摩擦的产业环境里,摩尔线程则要面对供应链不确定性、技术封锁、国产生态薄弱等难题,这是英伟达当年不需要做的题目。

更确切的说法是,摩尔线程在用英伟达的方法论,解决中国自己的算力问题,在中国现有产业条件下,重走一遍GPU的必经之路。


为什么是全功能GPU?

在张建中演讲的开始,首先阐释了摩尔线程为何要做全功能GPU。“全功能GPU的创新,就是一部算力进化史。”他说。

如果回顾 GPU 的发展史,会发现它并不是为某一类应用而生,而是在持续拓展自身的计算边界。早期 GPU 主要承担图形与 3D 渲染任务;进入本世纪后,随着可编程能力的引入,GPU 开始向通用并行计算平台演进。其后,GPU 在科学计算和深度学习中的广泛应用,使其逐步成为人工智能时代的核心算力载体。

随着 Transformer 架构推动生成式 AI 爆发,人工智能正从感知 AI、生成式 AI 迈向 Agentic AI,并进一步走向与现实世界深度融合的物理 AI 阶段。未来五到十年,具身智能等新形态应用,要求算力平台同时具备计算、仿真、图形与感知能力,这并非单一功能加速器可以胜任。

张建中表示,从更长周期来看,未来五到十年的关键应用形态,很可能集中体现在具身智能领域。具身智能通过将人工智能能力嵌入真实世界的物理实体之中,推动虚拟世界、数字世界与物理世界的深度融合,而这背后所依赖的,正是能够支撑复杂计算形态的物理 AI 基础设施。

在这一演进过程中,“3D + AI + HPC” 并非偶然组合,而是全功能 GPU 自然演进的结果。随着 GPU 在图形、计算与仿真等多个维度能力的不断融合,其逐步演化为支撑新一代科技发展的核心基础设施。实践已经反复证明,

在张建中看来,基于全功能 GPU 构建的算力基础设施,更有能力支撑技术体系的持续演进与长期领先。

从技术架构角度看,全功能 GPU 的核心在于其内部集成的多类计算引擎,实现对多样化计算需求的统一支撑。当前,全功能 GPU 主要包含四类核心计算引擎:

首先是 AI 计算引擎,覆盖模型训练、推理以及训推一体等典型场景,是支撑大模型与各类 AI 应用的基础能力。

其次是 3D 图形渲染引擎,为数字内容生产、数字孪生、仿真可视化等场景提供高性能图形处理能力。

第三是 高性能计算与物理仿真引擎。这一能力在科学计算和 AI for Science 场景中具有重要价值,能够支撑复杂物理过程模拟与大规模科学计算任务。

第四是 智能视频编解码引擎。尽管这一能力往往容易被低估,但在云端计算成为主流的背景下,视觉仍是人类感知计算结果的主要方式。高效的视频编解码能力,决定了云端算力成果能否被稳定、低成本地传递至终端用户。

MUSA 才是“第一产品”

MUSA(Meta-computing Unified System Architecture)是摩尔线程自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。

一个完整MUSA的统一系统架构,最底层是摩尔线程全功能GPU,可以去处理各种行业、不同精度、不同类型和不同格式的数据。

在全功能GPU之上,是硬件系统,摩尔线程的智算集群叫作夸娥。夸娥智算集群可大可小,小到一个小的系统,大到一个万卡集群,十万卡集群,甚至更大的超大规模。

在硬件基础之上,摩尔线程搭建所有的软件栈。首先是MUSA全套软件栈,包括所有的加速库,所有的开发者调试工具和开发者的应用案例和实例,利用全套MUSA体系结构能够在基础之上去搭建夸娥的基础软件。

在这一基础上,摩尔线程继续建设MUSA生态,可以看出,MUSA是一个从芯片到生态的完整系统。


本次MUSA 升级至5.0,标志着架构步入成熟。原生MUSA C,深度兼容 TileLang、Triton 等编程语言,核心计算库muDNN实现GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍,并集成高性能算子库,显著加速训练与推理全流程。

摩尔线程计划逐步开源计算加速库、通信库及系统管理框架在内的核心组件,向开发者社区开放深度优化的底层能力。据悉,摩尔线程即将推出兼容跨代GPU指令架构的中间语言MTX、面向渲染+AI融合计算的编程语言muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力边界。

“MUSA不光是支持国际上通用的CPU系统,同时也支持国产的CPU操作系统和国内的开发环境。利用我们国产的生态,结合国际的生态,能够完美支撑AI、3D图形和科学计算应用当中的方方面面。“张建中表示,摩尔线程统一软件栈能够覆盖全系列产品,覆盖“云边端”三个系列,这些产品都可以用同一套软件来支撑不同的硬件产品。

“花港”新架构、两款芯片和夸娥万卡集群

过去几年,国产GPU厂商最容易被问到的问题只有一个:“你们性能追到哪一代了?”摩尔线程给出了自己的答案,基于MUSA统一体系,摩尔线程揭晓新一代全功能GPU架构“花港”,该架构在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破,其核心特性包括:

计算性能显著提升:基于新一代指令集,算力密度提升50%,能效大幅优化;支持从FP4到FP64的全精度端到端计算,新增MTFP6/MTFP4及混合低精度支持。

异步编程与超大规模互联:集成新一代异步编程模型,优化任务调度与并行机制;通过自研MTLink高速互联技术,支持十万卡以上规模智算集群扩展。

图形与AI深度融合:内置AI生成式渲染架构,增强硬件光线追踪加速引擎,完整支持DirectX 12 Ultimate,实现图形渲染与智能计算的高度协同。

全栈自研与安全可信:架构基于全栈自主研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,其中发明专利468项),具备全栈自研与自主可控的核心能力。通过四层硬件安全架构,提供从芯片到系统的可验证安全守护。

基于“花港”架构,摩尔线程公布了未来将发布的两款芯片技术路线:

“华山”专注AI训推一体与超大规模智能计算。集成新一代异步编程与全精度张量计算单元,支持从FP4至FP64的全精度计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一代“AI工厂”的坚实底座。


“庐山”专攻高性能图形渲染。其图形性能实现全面跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,为3A游戏、高端图形创作提供强大算力支持。

人工智能基础设施的边界早已突破芯片的边界,摩尔线程也将自己的能力拓展到集群系统层面。

本次大会,摩尔线程正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理。其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense大模型上达60%,MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95%,与国际主流生态高度兼容,并在多项指标上具备显著能效优势。

在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化:Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈,充分释放国产GPU在大模型训练中的性能潜力。

在推理侧,摩尔线程联合硅基流动,经过系统级工程优化与FP8精度加速,在DeepSeek R1 671B全量模型上实现性能突破:MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能新标杆。

面向未来,发布了MTT C256超节点的架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基石。

摩尔线程这场大会,更像是一种国产算力进入长期主义阶段的宣言。这条路不会快,也不会轻松,但至少,从这次MDC开始,它不再是零散的点,而是一条能被复述、被理解、被跟随的路线。(本文作者 | 张帅,编辑 | 盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

突发心梗,吃丹参滴丸有用吗?医生:这2种药才是心梗急救药!

健康科普365
2026-03-26 09:57:24
伊朗重要人事任命,释放强烈信号!

伊朗重要人事任命,释放强烈信号!

斐君观点
2026-03-25 21:08:16
特朗普坚称正在与伊朗谈判:伊朗不敢认,其领导人“害怕被自己人干掉,也害怕被美国干掉”,美国在伊朗赢麻了

特朗普坚称正在与伊朗谈判:伊朗不敢认,其领导人“害怕被自己人干掉,也害怕被美国干掉”,美国在伊朗赢麻了

极目新闻
2026-03-26 08:57:45
张雪峰的财产几个亿,竟然没买车,天天吃外卖,生活简朴到极致

张雪峰的财产几个亿,竟然没买车,天天吃外卖,生活简朴到极致

魔都姐姐杂谈
2026-03-25 15:59:12
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

古希腊掌管松饼的神
2026-03-26 11:29:25
伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

老马拉车莫少装
2026-03-26 00:02:39
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
于东来:30岁开始吃药,CT拍了上百次,身体出什么问题都不足为奇,哪天说没就没了

于东来:30岁开始吃药,CT拍了上百次,身体出什么问题都不足为奇,哪天说没就没了

每日经济新闻
2026-03-25 23:58:31
热搜上63万人破防的“奥特曼蛋糕”事件:有毒父母,逼疯中国孩子

热搜上63万人破防的“奥特曼蛋糕”事件:有毒父母,逼疯中国孩子

小椰子专栏
2026-03-25 13:00:11
中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

每日经济新闻
2026-03-26 13:25:09
我想过Sora会死,但没想到这么快。

我想过Sora会死,但没想到这么快。

差评XPIN
2026-03-26 00:04:51
经济学历巴曙松被带走调查

经济学历巴曙松被带走调查

地产微资讯
2026-03-25 20:49:47
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

环球网资讯
2026-03-26 06:58:33
4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

4个LV包都是假的!女子送检后傻眼:全在专柜买的啊,最新回应

半岛晨报
2026-03-25 15:30:03
女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

观威海
2026-03-26 10:39:05
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
比国足还惨!意大利已12年未踢世界杯,仅剩33岁维拉蒂踢过世界杯

比国足还惨!意大利已12年未踢世界杯,仅剩33岁维拉蒂踢过世界杯

小金体坛大视野
2026-03-26 11:16:02
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
2026-03-26 14:28:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
131349文章数 862009关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
本地
艺术
公开课
军事航空

家居要闻

傍海而居 静观蝴蝶海

本地新闻

春日吃花第三站——广东

艺术要闻

哪一座桥不是风景?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版