网易首页 > 网易科技 > 网易科技 > 正文

WAIC前线|摩尔线程张建中:为AGI时代造生产模型的“超级工厂”

0
分享至
据透露,摩尔线程将于今年10月举办首届MUSA开发者大会。

本文系网易科技上海世界人工智能大会系列前方原创报道

7月26日消息,在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程召开发布会,提出“AI工厂”理念。摩尔线程创始人兼CEO张建中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于AGI时代打造生产先进模型的“超级工厂”。

据介绍,摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

据了解,这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单芯片有效算力 × 单节点效率 × 集群效率 × 集群稳定性

技术一:全功能GPU

在AI基础设施建设中,计算功能的完备性与精度完整性是支撑多元场景的核心基石。摩尔线程以自主研发的全功能GPU为核心,构建了“功能完备”与“精度完整”的通用性底座,全面覆盖从AI训练、推理到科学计算的全场景需求。

1,创新突破:单芯片覆盖多场景。基于MUSA架构的突破性设计,摩尔线程的GPU单芯片即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等多样化应用场景。

2,精度标杆:性能跃升20%~30%。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升,为国产GPU的算力效率树立行业标杆。

3,前瞻布局:推动AI基础设施进化。这一技术体系不仅满足大模型时代的高效计算需求,更为世界模型和新兴AI架构的演化提供前瞻性支撑,助力AI基础设施向高通用性、高精度方向持续升级。

技术二:自研MUSA架构

据介绍,摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,显著提升单GPU运算效率。

1,创新架构突破传统限制:摩尔线程采用多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。其参数化配置可伸缩架构允许面向目标市场快速裁剪出优化的芯片配置,大幅降低了新品芯片的开发成本。

2,计算性能显著提升:在计算层面,摩尔线程的AI加速系统(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。

3,内存与通信效率全面优化:内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。在通信和互联领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽,为大规模集群部署奠定了坚实基础。

技术三:MUSA全栈系统软件

据介绍,摩尔线程通过MUSA全栈系统软件实现关键技术突破,推动AI工厂从单点创新转向系统级效能提升。其核心创新包括:

1,任务调度优化:核函数启动时间缩短50%;

2,极致性能算子库:GEMM算子算力利用率达98%,Flash Attention 算子算力利用率突破95%;

3,通信效能跃升:MCCL通信库实现RDMA网络97%带宽利用率;基于异步通信引擎优化计算通信并行,集群性能提升10%;

4,低精度计算效率革新:FP8优化与重计算技术显著降低训练开销;

5,开发生态完善:基于Triton-MUSA编译器 + MUSA Graph 实现DeepSeek R1推理加速1.5倍,全面兼容Triton等主流框架。

技术四:自研KUAE大规模集群

摩尔线程自研KUAE计算集群通过5D大规模分布式并行计算技术,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

1,创新5D并行训练:摩尔线程整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构,显著提升大规模集群训练效率。

2,性能仿真与优化:自主研发的Simumax工具面向超大规模集群自动搜索最优并行策略,精准模拟FP8混合精度训练与算子融合,为DeepSeek等模型缩短训练周期提供科学依据。

3,秒级备份恢复:针对大模型稳定性难题,创新CheckPoint加速方案利用RDMA技术,将百GB级备份恢复时间从数分钟压缩至1秒,提升GPU有效算力利用率。

技术五:零中断容错技术

在构建高效集群的基础上,稳定可靠的运行环境是“AI工厂”持续产出的保障。特别在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。摩尔线程推出零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这一方案使KUAE集群有效训练时间占比超99%,大幅降低恢复开销。

同时,KUAE集群通过多维度训练洞察体系实现动态监测与智能诊断,异常处理效率提升50%;结合集群巡检与起飞检查,训练成功率提高10%,为大规模AI训练提供稳定保障。

与此同时,完善的“AI工厂”不仅需要高效训练大模型,还需具备推理验证能力。摩尔线程基于自研MUSA技术栈,构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接。其MT Transformer自研推理引擎、TensorX自研推理引擎和vLLM-MUSA推理框架,为模型验证和部署提供极致性能支持。

据透露,摩尔线程将于今年10月举办首届MUSA开发者大会

延伸阅读
相关推荐
热点推荐
太操劳了!王思聪现身日本,多名美女作陪,其发量和发色引发关注

太操劳了!王思聪现身日本,多名美女作陪,其发量和发色引发关注

火山詩话
2025-12-14 05:28:17
40岁退休,躺赢千亿:中国最“懒”顶级富豪,狠狠打了内卷一巴掌

40岁退休,躺赢千亿:中国最“懒”顶级富豪,狠狠打了内卷一巴掌

功夫财经
2025-12-13 10:03:14
何晴24岁儿子现状:身高190cm很帅,和后妈有母子相,成妈妈骄傲

何晴24岁儿子现状:身高190cm很帅,和后妈有母子相,成妈妈骄傲

冷紫葉
2025-12-15 13:25:31
摩尔线程股价连涨后再陷连跌?

摩尔线程股价连涨后再陷连跌?

财视传播
2025-12-15 11:22:28
入冬冲刺失败,上海明又回归小阳春体感,今年会有寒冬吗

入冬冲刺失败,上海明又回归小阳春体感,今年会有寒冬吗

纵相新闻
2025-12-15 13:27:29
乌克兰不入北约?泽连斯基同意下课?

乌克兰不入北约?泽连斯基同意下课?

新民周刊
2025-12-15 13:03:20
重大突破!彩虹-7高空高速隐身无人机成功首飞

重大突破!彩虹-7高空高速隐身无人机成功首飞

新京报
2025-12-15 07:40:04
父子在悉尼海滩枪击致16人死亡,儿子涉嫌和恐怖组织有关,案发前致电母亲称刚游完泳

父子在悉尼海滩枪击致16人死亡,儿子涉嫌和恐怖组织有关,案发前致电母亲称刚游完泳

红星新闻
2025-12-15 12:17:18
大家发现没有,这次中日冲突比历次都严重,却没有人喊抵制日货了

大家发现没有,这次中日冲突比历次都严重,却没有人喊抵制日货了

诗意世界
2025-12-15 08:30:02
沙媒:C罗将收购利雅得胜利15%股份,估值约为5000万英镑

沙媒:C罗将收购利雅得胜利15%股份,估值约为5000万英镑

懂球帝
2025-12-15 07:02:10
就因为我不出名,我的心血都成了别人的“名作”

就因为我不出名,我的心血都成了别人的“名作”

新京报
2025-12-14 17:28:51
藏了40年的爸爸竟是陈道明!不拼爹不炒作,怪不得她这么优秀

藏了40年的爸爸竟是陈道明!不拼爹不炒作,怪不得她这么优秀

诗意世界
2025-12-14 16:36:29
芋头再次被关注!研究发现:常吃芋头的人,不用多久,或有4改善

芋头再次被关注!研究发现:常吃芋头的人,不用多久,或有4改善

阿兵科普
2025-12-11 21:10:08
中方点头应下韩国,中日韩会议照开不误,唯独对日本降格处理

中方点头应下韩国,中日韩会议照开不误,唯独对日本降格处理

博览历史
2025-12-14 17:32:04
何晴遗体告别,现场有人背红色包太不像话,入殓师透露告别式内幕

何晴遗体告别,现场有人背红色包太不像话,入殓师透露告别式内幕

一娱三分地
2025-12-15 13:48:02
云南省体育局回应运动员实名举报事件

云南省体育局回应运动员实名举报事件

界面新闻
2025-12-15 14:05:22
女教师结婚当天选择跳楼!被拒绝收尸,原来是一楼住户索要几十万

女教师结婚当天选择跳楼!被拒绝收尸,原来是一楼住户索要几十万

火山詩话
2025-12-14 15:00:23
英国一年制水硕崩了?qs前100都敢乱发文凭,水硕的背后都是生意

英国一年制水硕崩了?qs前100都敢乱发文凭,水硕的背后都是生意

趣笔谈
2025-12-07 13:24:58
张本智和夺冠后发文:第四次终于如愿以偿,明年争取拿更多冠军

张本智和夺冠后发文:第四次终于如愿以偿,明年争取拿更多冠军

懂球帝
2025-12-15 14:41:06
这些病都是被“气”出来的,尤其是第一种!再次劝你:别再生气了

这些病都是被“气”出来的,尤其是第一种!再次劝你:别再生气了

华医网
2025-12-14 05:41:16
2025-12-15 18:44:49

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

美方称将同菲方一起共同应对中方挑衅行为 外交部回应

头条要闻

美方称将同菲方一起共同应对中方挑衅行为 外交部回应

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

亲子
房产
游戏
数码
公开课

亲子要闻

加码“低敏”赛道!海普诺凯能立多全新升级,以科研实证回应“敏宝”家庭刚需

房产要闻

6.66亿摘地,海南封关大动作,千亩海澄新城震撼登场

世界冠军!FIFAe World Cup 2025™泰国勇夺移动端冠军,波兰摘得主机端桂冠

数码要闻

1999元起 飞牛首款双盘位NAS EVO 2预售:最高扩展68TB、英特尔N150 CPU

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×