网易首页 > 网易号 > 正文 申请入驻

摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

0
分享至

2025年7月25日,上海——在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程以“算力进化,精度革命”为主题举办技术分享会,并创新性提出“AI工厂”理念。摩尔线程创始人兼CEO张建中在主题演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“超级工厂”。

“AI工厂”:锻造先进模型的“超级工厂”

人工智能前沿模型的竞争正推动着AI智能水平的迅猛提升,全球科技巨头正以惊人的速度迭代模型。从GPT系列、Gemini到DeepSeek、QWen的快速更新,模型训练迭代时间已缩短至不足3个月,这种高频迭代不仅体现在大型语言模型(LLM)上,还同步扩展至多模态模型、语音模型、世界模型等前沿模型领域。这些模型在性能、效率和应用场景上实现的指数级突破,不仅推动了AI从专用领域向通用智能的跨越,其快速迭代的特性更对新一代高性能人工智能计算基础设施提出了迫切需求。

摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单芯片有效算力 × 单节点效率 × 集群效率 × 集群稳定性

摩尔线程以全功能GPU通用算力为基石,通过先进架构、芯片算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新,旨在将全功能GPU加速计算平台的强大潜能,转化为工程级的训练效率与可靠性保障。

五大核心技术:系统性提升AI训练效率

摩尔线程通过软硬深度协同的系统级创新,从五大核心技术构建“AI工厂”,致力于推动大模型训练效率实现质的飞跃。

技术一:全功能GPU,实现加速计算通用性

在AI基础设施建设中,计算功能的完备性与精度完整性是支撑多元场景的核心基石。摩尔线程以自主研发的全功能GPU为核心,构建了“功能完备”与“精度完整”的通用性底座,全面覆盖从AI训练、推理到科学计算的全场景需求。

s创新突破:单芯片覆盖多场景。基于MUSA架构的突破性设计,摩尔线程的GPU单芯片即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等多样化应用场景。

s精度标杆:性能跃升20%~30%。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升,为国产GPU的算力效率树立行业标杆。

s前瞻布局:推动AI基础设施进化。这一技术体系不仅满足大模型时代的高效计算需求,更为世界模型和新兴AI架构的演化提供前瞻性支撑,助力AI基础设施向高通用性、高精度方向持续升级。

技术二:自研MUSA架构,提升芯片有效算力

强大的芯片有效算力是驱动“AI工厂”高效运转的核心动力。摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,显著提升单GPU运算效率。

s创新架构突破传统限制:摩尔线程采用创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。其参数化配置可伸缩架构允许面向目标市场快速裁剪出优化的芯片配置,大幅降低了新品芯片的开发成本。

s计算性能显著提升:在计算层面,摩尔线程的AI加速系统(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。

s内存与通信效率全面优化:内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。在通信和互联领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽,为大规模集群部署奠定了坚实基础。

技术三:MUSA全栈系统软件,提升单节点计算效率

当AI算力竞争进入深水区,摩尔线程通过MUSA全栈系统软件实现关键技术突破,推动AI工厂从单点创新转向系统级效能提升。其核心创新包括:

s任务调度优化:核函数启动时间缩短50%;

s极致性能算子库:GEMM算子算力利用率达98%,Flash Attention 算子算力利用率突破95%;

s通信效能跃升:MCCL通信库实现RDMA网络97%带宽利用率;基于异步通信引擎优化计算通信并行,集群性能提升10%;

s低精度计算效率革新:FP8优化与重计算技术显著降低训练开销;

s开发生态完善:基于Triton-MUSA编译器+MUSA Graph 实现DeepSeek R1推理加速1.5倍,全面兼容Triton等主流框架。

技术四:自研KUAE大规模集群,优化集群效率

当单节点效率达到新高度,如何实现大规模集群的高效协作成为新的挑战。摩尔线程自研KUAE计算集群通过5D大规模分布式并行计算技术,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

s创新5D并行训练:摩尔线程整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构,显著提升大规模集群训练效率。

s性能仿真与优化:自主研发的Simumax工具面向超大规模集群自动搜索最优并行策略,精准模拟FP8混合精度训练与算子融合,为DeepSeek等模型缩短训练周期提供科学依据。

s秒级备份恢复:针对大模型稳定性难题,创新CheckPoint加速方案利用RDMA技术,将百GB级备份恢复时间从数分钟压缩至1秒,提升GPU有效算力利用率。

技术五:零中断容错技术,提升集群的稳定性和可靠性

在构建高效集群的基础上,稳定可靠的运行环境是“AI工厂”持续产出的保障。

特别在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。摩尔线程创新推出零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这一方案使KUAE集群有效训练时间占比超99%,大幅降低恢复开销。

同时,KUAE集群通过多维度训练洞察体系实现动态监测与智能诊断,异常处理效率提升50%;结合集群巡检与起飞检查,训练成功率提高10%,为大规模AI训练提供稳定保障。

从训练到验证:构建完整闭环

摩尔线程以打造先进的“AI工厂”为目标,凭借全功能GPU的通用计算能力、创新的MUSA架构、优化的MUSA软件栈、自研的KUAE集群以及零中断容错技术这五大核心要素,构建起高效的“AI工厂”,为AI大模型训练提供了强大而可靠的基础设施支持。

完善的“AI工厂”不仅需要高效训练大模型,还需具备推理验证能力。摩尔线程基于自研MUSA技术栈,构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接。其MT Transformer自研推理引擎、TensorX自研推理引擎和vLLM-MUSA推理框架,为模型验证和部署提供极致性能支持。

AI工厂,驱动千行百业智能升级

依托AI工厂,摩尔线程成功构建起覆盖"训练-推理-部署"全流程的高效体系。这一突破标志着国产计算基础设施已具备支撑AGI时代规模化、高效率、高可靠模型生产的关键能力。

从图形渲染基石到AI算力引擎,摩尔线程全功能GPU持续加速计算革新。以“KUAE+MUSA”为智算业务核心,摩尔线程将加速赋能千行百业,推动全功能GPU驱动的AI技术在物理仿真、AIGC、科学计算、具身智能、智能体、医疗影像分析、工业大模型等关键领域的应用与部署。

同时,摩尔线程深知开放是生态繁荣之源。摩尔线程将于今年10月举办首届MUSA开发者大会,诚邀全球开发者共探前沿技术,共享MUSA自主新生态。

随着WAIC 2025正式拉开帷幕,摩尔线程以“全功能GPU,为美好世界加速”为主题,精彩亮相上海世博展览馆H1-A821展位,诚邀业界同仁莅临参观交流,共同见证国产人工智能基础设施的创新突破与发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
痛心!佳能深圳工厂搬离的悲剧:走了一家,死了一片…

痛心!佳能深圳工厂搬离的悲剧:走了一家,死了一片…

慧翔百科
2026-02-09 11:20:40
乌克兰即将接收250架战斗机,大反攻箭在弦上

乌克兰即将接收250架战斗机,大反攻箭在弦上

名人苟或
2026-02-09 14:37:11
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
常州市委原副秘书长、二级巡视员周家林被查

常州市委原副秘书长、二级巡视员周家林被查

扬子晚报
2026-02-09 17:28:56
日经225指数涨幅扩大至5%,续创新高

日经225指数涨幅扩大至5%,续创新高

界面新闻
2026-02-09 08:37:04
苦等仨月终于提车,大雷入手理想i6有话说

苦等仨月终于提车,大雷入手理想i6有话说

电动邦
2026-02-09 11:12:57
上海消保委实测:你家待客的一次性杯子可能“有毒”,这款致癌物超标3倍!

上海消保委实测:你家待客的一次性杯子可能“有毒”,这款致癌物超标3倍!

上观新闻
2026-02-09 16:42:32
王曼昱惜败孙颖莎不到48小时,不和谐的一幕发生,远比输球更可怕

王曼昱惜败孙颖莎不到48小时,不和谐的一幕发生,远比输球更可怕

揽星河的笔记
2026-02-09 13:33:19
日经225指数日内涨超3%,突破56000点

日经225指数日内涨超3%,突破56000点

每日经济新闻
2026-02-09 08:11:04
马杜罗儿子透露,美军电子战瘫痪了加拉加斯,但父亲的华为手机还能打通

马杜罗儿子透露,美军电子战瘫痪了加拉加斯,但父亲的华为手机还能打通

大白聊IT
2026-02-09 00:03:01
争议!特朗普公开怒骂美国冬奥运动员:你是一个彻头彻尾的失败者

争议!特朗普公开怒骂美国冬奥运动员:你是一个彻头彻尾的失败者

念洲
2026-02-09 10:21:42
日本人均实际工资连续4年 负增长

日本人均实际工资连续4年 负增长

每日经济新闻
2026-02-09 09:16:38
广西交通投资集团原党委委员胡芳接受审查调查

广西交通投资集团原党委委员胡芳接受审查调查

界面新闻
2026-02-09 17:02:45
华为鸿蒙造假被网友发现,尚界冬测宣传图反物理:轮毂飞转轮胎静止

华为鸿蒙造假被网友发现,尚界冬测宣传图反物理:轮毂飞转轮胎静止

爆角追踪
2026-02-08 20:33:20
曹德旺又开口了:未来10年,把存款换成这4个资产,或将衣食无忧

曹德旺又开口了:未来10年,把存款换成这4个资产,或将衣食无忧

猫叔东山再起
2026-02-09 10:05:08
我为什么不太好意思八卦爱泼斯坦案件

我为什么不太好意思八卦爱泼斯坦案件

白马狗熊
2026-02-09 18:45:10
年轻人能捅多大的娄子?网友:给领导一些来自00后的震撼

年轻人能捅多大的娄子?网友:给领导一些来自00后的震撼

带你感受人间冷暖
2026-02-04 00:15:07
日本众议院选举结果公布

日本众议院选举结果公布

新华社
2026-02-09 06:03:02
上海女子一个月结了两次婚!周旋在两个“老公”之间,生下孩子却是第三个男人的…她说自己只是婚外情,受害者坚决不原谅

上海女子一个月结了两次婚!周旋在两个“老公”之间,生下孩子却是第三个男人的…她说自己只是婚外情,受害者坚决不原谅

扬子晚报
2026-02-09 16:09:25
有钱能使鬼推磨!身价数亿、拿下三块地的华晨宇,还是被骂惨了

有钱能使鬼推磨!身价数亿、拿下三块地的华晨宇,还是被骂惨了

白面书誏
2026-02-09 17:36:47
2026-02-09 19:04:49
爱集微 incentive-icons
爱集微
集微网官方账号
108987文章数 98336关注度
往期回顾 全部

科技要闻

马斯克终于想通了:先去月球“刷经验”

头条要闻

爱泼斯坦案亚裔受害者:首次见他就与2人发生关系

头条要闻

爱泼斯坦案亚裔受害者:首次见他就与2人发生关系

体育要闻

创中国冬奥最佳战绩!19岁速滑新星含泪向天拉勾

娱乐要闻

李亚鹏暂停直播:将投入嫣然医院工作

财经要闻

沪深北交易所优化再融资 释放3个信号

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

教育
本地
游戏
旅游
军事航空

教育要闻

家长必看:中产家庭应该怎么规划孩子的留学教育?

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

画面太惊艳!饭制《老滚4》重制公布遗迹场景新截图

旅游要闻

2月15日至23日,烟台所有国有景区实行首道门票半价优惠

军事要闻

美伊最敏感时刻 林肯号航母迎来三位“不速之客”

无障碍浏览 进入关怀版