网易首页 > 网易号 > 正文 申请入驻

使DeepSeek模型推理加速150%,摩尔线程首次提出“AI工厂”|直击WAIC 2025

0
分享至

摩尔线程创始人、CEO张建中

继英伟达之后,国产通用GPU公司摩尔线程也要发力“AI工厂”理念。

7月26日消息,2025世界人工智能大会(WAIC)期间,摩尔线程创始人兼CEO张建中宣布,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,公司将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“超级工厂”。

张建中表示,除了语言模型之外,所有人都在把模型能力拓展到多模态和世界模型,甚至于具身智能和三维空间里的模拟仿真,它需要大型AI计算基础设施,但要想建立大型基础设施的难度就好比建一个Foundry(晶圆厂)一样,所以他称之为“AI工厂”(AI Foundry)。Foundry是生产芯片的,而AI Foundry是生产智能的,而摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。其中,基于Triton-MUSA编译器 + MUSA Graph,基于“平湖”架构的MTT S5000 GPU可实现DeepSeek R1推理加速1.5倍(150%)

张建中强调,我们正迎来前所未有的生成式AI技术变革,而大模型的发展非常“卷”,从DeepSeek V3发布以来,短短半年,全球前沿模型DeepSeek的“智力”水平提升50%,远超人类智力水平的增长速度。

“这是一件很可怕的事情,首先我们不要跟模型斗,要把它用好,它是你的Agent,你不能变成它的Agent。短短几个月,Grok 4直接飙到世界第一,马斯克只有一个秘诀,就是买了20万张GPU卡,所以它可以‘卷’成世界第一,用很少的人力,但用强大的财力、强大的算力,所以就是靠算力推动智力的革命。”张建中称。

据悉,摩尔线程成立于2020年6月,以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案。摩尔线程创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理,在GPU这一行业已经深耕近二十年。

成立以来,摩尔线程以自主研发的全功能GPU为核心,致力于为AI、数字孪生、科学计算等高性能计算领域提供计算加速平台,公司已推出四代GPU架构,其芯片采用先进MUSA技术,并拓展出覆盖AI智算、云计算和个人智算等应用领域的计算加速产品矩阵,满足政务、企业及个人消费者等多层次、多样化需求。

启动IPO之前,摩尔线程已经完成了多轮融资,整个融资规模超过40亿元。投资方包括中国移动、深创投、上海国盛、中银国际、建银国际、招商局创投、中关村科学城、红杉资本等基金和机构。最近一轮投前估值246.20亿元。

业务方面,基于自主研发的MUSA架构,公司成功开发出支持 AI 计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多场景的全功能GPU芯片。公司四年推出四代GPU芯片架构、四颗GPU芯片系列——苏堤、春晓、曲院和平湖,流片成功/发布时间分别是2021年、2022年、2023年和2024年,覆盖 AI 智算、专业图形加速及桌面级图形加速等领域,主要生产方式包括板卡/模组、一体机、集群设备等,客户包括百度(北京百度网讯科技有限公司)、京东平台、中国邮电器材集团等多家头部公司。

2022年,摩尔线程推出国产游戏显卡MTT S80,被誉为“国产游戏第一卡”,也是国内极少数可以支持DirectX 12的消费级显卡。此外,在数据中心GPU部分,摩尔线程还发布了MTT S4000、S5000等多款计算卡,并拥有千卡智算集群、自有的万卡集群方案。

招股书中显示,MTT S80显卡性能规格与英伟达RTX 3060相当,公司在两年时间内先后完成24版驱动更新,显卡性能表现提升数倍,成功兼容近千款游戏和应用。

目前,摩尔线程已成功自主研发并量产第四代高性能 GPU 架构“平湖”,并基于此推出了十余款高性能GPU加速卡与模组,以及D800计算服务器和KUAE智能计算集群等产品,构建了包含芯片设计、硬件产品及软硬件一体化解决方案的全方位自主可控产品体系。

据悉,最新采用“平湖”架构的摩尔线程MTT S5000加速计算卡对标英伟达H100产品,其FP8计算能力适合对DeepSeek-V3/R1 MoE大模型进行训练。

如今,基于通用GPU的全方位的自主可控产品体系,张建中提出了摩尔线程更大的“野心”:AI工厂(AI Foundry)。

事实上,英伟达最先提出了“AI工厂”(AI Factory)这一概念,原因在于,英伟达认为与传统数据中心不同,AI工厂不仅存储和处理数据,还能大规模生产智能,将原始数据转化为实时洞察,对于世界各地的企业和国家而言,这意味着显著缩短价值实现时间,将AI从一项长期投资转化为提升竞争优势的直接驱动力,从而让企业未来将在创新、效率和市场差异化方面引领行业。

那么,在“AI工厂”设计中,英伟达提供强大的计算性能、高级网络、基础设施管理和工作负载编排、最大的AI推理生态系统、存储和数据平台、设计和优化蓝图、参考架构、为每个企业提供灵活部署等完整、集成的 AI 工厂堆栈,其中从芯片到软件的每一层都针对大规模训练、微调和推理进行了优化。这种全栈式方法确保企业能够部署经济高效、性能卓越且面向未来的 AI 工厂,以应对 AI 的指数级增长。

黄仁勋曾提到,借助基于英伟达Blackwell Ultra 的GB300 NVL72机架级解决方案,AI 工厂可实现高达 50 倍的 AI 推理输出。

相比英伟达的“AI工厂”理念,摩尔线程“AI工厂”(AI Foundry)的核心在于基于全功能GPU通用算力,以系统化创新和工程化的能力提升先进模型生产效率。

在张建中看来,打造AI工厂,摩尔线程主要拥有五个技术竞争力:1、拥有全功能GPU,功能完备精度完整,实现加速计算通用性;2、自研MUSA架构,提升芯片有效算力;3、MUSA全栈系统软件,提升单节点计算效率;4、自研KUAE大规模集群,优化集群效率;5、零中断容错技术,提升集群的稳定性和可靠性。

数据显示,基于第四代“平湖”架构,摩尔线程的AI加速系统(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算,在保证计算精度的同时,将Transformer计算性能提升约30%;内存系统方面,实现了50%的带宽节省和60%的延迟降低;独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽;核函数启动时间缩短50%;GEMM算子算力利用率达98%,Flash Attention 算子算力利用率突破95%;MCCL通信库实现RDMA网络97%带宽利用率;将百GB级备份恢复时间从数分钟压缩至1秒,提升GPU有效算力利用率。

张建中表示,依托AI工厂,摩尔线程成功构建起覆盖“训练-推理-部署”全流程高效体系,从图形渲染基石到AI算力引擎,摩尔线程以“KUAE+MUSA”为智算业务核心,加速赋能千行百业,推动全功能GPU驱动的AI技术在物理仿真、AIGC、科学计算、具身智能、智能体、医疗影像分析、工业大模型等关键领域的应用与部署。

这意味着,国产计算基础设施已具备支撑AGI(通用人工智能)时代规模化、高效率、高可靠模型生产的关键能力。

当前摩尔定律收入、研发费用不断增加。招股书显示,2022年、2023年、2024年,摩尔线程营业收入分别为0.46亿元、1.24亿元、4.38亿元,三年营业收入复合增长率208.44%,累计营收6.09亿元;三年研发费用分别为11.16亿元、13.34亿元、13.59亿元,累计研发费用超过38亿元。

(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

无人机真是中国领先吗?为何战场上被打下的,全都是中国无人机

安安说
2026-03-19 13:00:22
袁家军会见王兴兴

袁家军会见王兴兴

新京报政事儿
2026-03-26 16:45:34
油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

油价反转!95号汽油破9元后迎下调,4月7日调价最新预测

复转这些年
2026-03-26 09:40:14
78年深圳失业女征婚!称未婚未育,找45岁左右优质熟男,引发热议

78年深圳失业女征婚!称未婚未育,找45岁左右优质熟男,引发热议

火山詩话
2026-03-24 07:34:43
马筱梅儿子满月太冷清,满月宴只有6个菜,兰姐缺席孙子满月仪式

马筱梅儿子满月太冷清,满月宴只有6个菜,兰姐缺席孙子满月仪式

阿废冷眼观察所
2026-03-27 03:43:51
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

白宫坚称美伊仍在谈判,威胁伊朗“切勿误判”;伊朗外长:美国谈论“谈判”无异于承认“失败”,伊朗放声开新战线

每日经济新闻
2026-03-26 17:08:49
人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

人过五十才懂:和子女最好的相处,不是给钱出力,而是守住这条线

荷兰豆爱健康
2026-03-23 01:42:20
碘伏再次成为关注对象!医生发现:使用碘伏,千万多留意这几点

碘伏再次成为关注对象!医生发现:使用碘伏,千万多留意这几点

39健康网
2026-03-25 16:00:38
巴西女生来中国旅游,回国后感叹:巴西与中国的差距一目了然

巴西女生来中国旅游,回国后感叹:巴西与中国的差距一目了然

千秋文化
2026-03-26 21:22:48
上海53岁独居女子离世续:遗物封存,当地有专班处置身后事

上海53岁独居女子离世续:遗物封存,当地有专班处置身后事

南方都市报
2026-03-26 11:58:07
中东大战,真正让特朗普害怕的是:中国的已读不回!

中东大战,真正让特朗普害怕的是:中国的已读不回!

似水流年忘我
2026-03-26 02:13:59
所有人都在盯中东打仗,中国却悄悄干了件大事:欧洲突然赚麻了

所有人都在盯中东打仗,中国却悄悄干了件大事:欧洲突然赚麻了

青青子衿
2026-03-26 01:37:03
封神战在即!德约出战蒙特卡洛,冲击史无前例三圈“金大师”!

封神战在即!德约出战蒙特卡洛,冲击史无前例三圈“金大师”!

田先生篮球
2026-03-26 13:33:00
一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

每日经济新闻
2026-03-26 19:00:13
伊朗首都德黑兰遭空袭 多地传出爆炸声

伊朗首都德黑兰遭空袭 多地传出爆炸声

财联社
2026-03-26 19:44:11
封海4天!中国不再给菲蹦跶的机会,高市早苗急了,日菲连遭重击

封海4天!中国不再给菲蹦跶的机会,高市早苗急了,日菲连遭重击

张鼋卤说体育
2026-03-25 20:04:06
悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

火山詩话
2026-03-24 18:23:32
小心牢底坐穿! 2022年云南花鸟市场卖10元1条, 被抓时已卖30多条

小心牢底坐穿! 2022年云南花鸟市场卖10元1条, 被抓时已卖30多条

万象硬核本尊
2026-03-26 19:01:49
伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

纵相新闻
2026-03-25 21:56:04
2026-03-27 04:44:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
131382文章数 862014关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
旅游
房产
教育
时尚

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

教育要闻

2026年高考可能“扎堆报考”的五大专业:就业缺口大,稳定且高薪

400万人爱过的女孩,被黄谣网暴180天后

无障碍浏览 进入关怀版