【IC风云榜候选企业10】摩尔线程：以全功能GPU构建新一代AI算力基石|gpu

【IC风云榜候选企业10】摩尔线程：以全功能GPU构建新一代AI算力基石

2025-11-03 16:03:17　来源: 爱集微

福建举报

分享至

【编者按】自2020年举办以来，IC风云榜已成为半导体行业的年度盛事。今年进一步扩容升级，共设立三大类73项重磅大奖，覆盖投资、上市公司、市场、AI、具身智能、职场、知识产权、汽车、海外市场九大核心领域，全方位挖掘半导体产业各赛道的标杆力量。评委会由超过100家半导体投资联盟会员单位及500+行业CEO组成。获奖名单将于2026半导体投资年会暨IC风云榜颁奖典礼上揭晓。

【候选企业】摩尔线程智能科技（北京）股份有限公司（以下简称：摩尔线程）

【候选奖项】年度AI技术突破奖、年度AI优秀创新奖

【候选产品】夸娥（KUAE）智算集群

在全球人工智能浪潮奔涌、大模型技术迭代周期缩短至数月的今天，高性能、高稳定性的AI算力基础设施已成为推动产业智能化升级的核心驱动力。摩尔线程作为一家成立于2020年、拥有自主知识产权的全功能GPU企业，凭借其系统级的技术创新与全栈产品布局，正加速构建面向未来的“AI工厂”，为中国AI算力自主化进程注入强劲动能。

作为国家级“专精特新”小巨人企业，摩尔线程已成功推出四代GPU架构与智能SoC产品，形成覆盖AI智算、专业图形加速、桌面级图形加速与智能边缘计算的完整产品矩阵。该公司研发人员占比近80%，累计获得发明专利468项、软件著作权 33 项和集成电路布图设计专有权 37项（截至 2025 年 6 月 30 日），展现出深厚的技术积累与持续的创新能力。

摩尔线程产品体系布局完整，覆盖多元应用场景：

AI智算产品：提供从AI训练智算卡、推理卡到AI超节点服务器及夸娥（KUAE）智算集群的全栈方案，支撑大模型训练、推理部署及GPU云服务等核心场景；

专业图形加速产品：涵盖MTT S3000/S2000/S1000等系列，服务于工业设计、数字孪生、AI云电脑等高端领域；

桌面级图形加速产品：包括MTT S80/S70/S50/X300等系列显卡及工作站，全面兼容Windows、麒麟OS、统信UOS等主流操作系统，以及Intel、AMD、海光、飞腾等多平台CPU，主要应用于AI PC、游戏PC及办公PC等场景；

智能SoC产品：面向AI PC、边缘智能、具身智能、智能汽车、低空经济等新兴场景，满足其对于端侧和边缘类AI场景的需求，同时可与公司的AI智算产品结合，实现“云-边-端”一体化协同，赋能AI训练-推理全流程。

摩尔线程凭借“夸娥（KUAE）智算集群”竞逐本届“IC风云榜”年度AI技术突破奖、年度AI优秀创新奖并成为候选企业。

在全球人工智能进入大模型驱动的时代，AI训练正面临从千卡级向万卡级规模演进的关键节点。主流模型迭代周期缩短至3个月，这种高频迭代不仅体现在大型语言模型（LLM）上，还同步扩展至多模态模型、语音模型、世界模型等前沿模型领域。面对模型高强度、多类型的迭代需求，构建高效、稳定、可扩展的智算基础设施成为产业发展的核心挑战。在这一背景下，摩尔线程推出的夸娥（KUAE）智算集群，以全功能GPU为硬件核心，构建软硬一体的系统级算力解决方案。该集群为智算中心提供端到端解决方案，支持万卡级规模扩展，单集群可部署超1000个计算节点，通过3D全互联拓扑实现亚微秒级通信延迟，为大模型预训练提供稳定高效的算力支撑。

摩尔线程创新性提出“AI工厂”理念，以生产智能和提升有效算力为目标，通过系统级创新，致力于为AGI时代打造生产先进模型的“超级工厂”。摩尔线程基于全功能GPU、MUSA架构、MUSA软件栈、KUAE集群及零中断容错技术五大核心要素，构建起完整的“AI工厂”体系，实现从底层芯片架构创新、到集群整体架构的优化，再到软件算法调优和资源调度系统的全面升级，为AI大模型训练提供全栈基础设施支持。在完善训练能力的同时，该公司通过自研的MT Transformer、TensorX等自研推理引擎及vLLM-MUSA推理框架，打造覆盖LLM、视觉与生成类模型的全流程推理方案，实现从训练、验证到部署的无缝闭环，为模型产业化提供高性能支撑。

（夸娥智算集群实拍图）

夸娥集群的创新体现在五大核心技术体系的协同突破：

-在全功能GPU架构上，基于MUSA架构的突破性设计实现了“功能完备”与“精度完整”的通用性底座，单芯片即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力，支持从FP64至INT8的完整精度谱系，并通过FP8混合精度技术在大模型训练中实现20%-30%的性能跃升；

在芯片有效算力方面，自研MUSA架构通过计算、内存、通信三重突破，显著提升单GPU运算效率。摩尔线程采用创新的多引擎、可伸缩GPU架构，在保障通用性的同时显著提升了资源利用率。计算方面，AI加速系统全面支持多种混合精度计算，让计算性能显著提升。作为国内首批实现FP8算力量产的GPU厂商，其FP8技术通过快速格式转换、动态范围智能适配等创新设计，将Transformer计算性能显著提升约30%。内存系统方面，通过多精度近存规约引擎等技术实现50%带宽节省和60%延迟降低，通信和互联领域，独创的ACE异步通信引擎减少了15%的计算资源损耗，MTLink2.0互联技术提供高出行业平均水平60%的带宽。

在单节点计算效率优化上，MUSA全栈系统软件实现多项突破，核函数启动时间缩短50%，GEMM算子算力利用率达98%，Flash Attention算子算力利用率突破95%，MCCL通信库实现RDMA网络97%带宽利用率，基于异步通信引擎优化计算通信并行，集群性能提升10%；基于Triton-MUSA编译器 + MUSA Graph 实现DeepSeek R1推理加速1.5倍；

在集群效率方面，创新的5D大规模分布式并行计算技术整合数据、模型、张量、流水线和专家并行，配合自研的Simumax性能仿真工具，为DeepSeek等模型缩短训练周期提供科学依据。秒级备份恢复技术将百GB级备份恢复时间从数分钟压缩至1秒，大幅提升GPU有效算力利用率。

在集群稳定性保障上，零中断容错技术实现故障发生时仅隔离受影响节点组，备机无缝接入，全程无中断，使KUAE集群有效训练时间占比超99%；同时，通过结合多维度训练洞察体系，异常处理效率提升50%，结合集群巡检与起飞检查，训练成功率提高10%。

夸娥智算集群已支持DeepSeek、Qwen、Llama等主流开源大模型，并与智源研究院、智谱AI、无问芯穹等多家大模型合作伙伴完成深度适配与测试验证，能够为千亿和万亿参数的大模型训练提供坚实的算力支撑。该产品已被纳入《北京市2024年第三批首台（套）重大技术装备目录》，在半导体GPU领域获得国家级认可。

立足当前，摩尔线程以全功能GPU为核心，持续为全球客户提供计算加速基础设施与一站式解决方案；面向未来，公司致力于成为具备国际竞争力的GPU领军企业，以“为美好世界加速”为愿景，为构建融合人工智能与数字孪生的数智世界打造先进的计算加速平台。

【奖项申报入口】

2026半导体投资年会暨IC风云榜颁奖典礼将于2025年12月在上海举办，奖项申报已启动，目前征集与候选企业/机构报道正在进行，欢迎报名参与，共赴行业盛宴！

【年度AI技术突破奖】

旨在表彰2025年度在人工智能基础理论、核心算法或关键应用领域取得重大原始创新，技术达到国际先进/领先水平，对推动我国人工智能技术自主创新和产业发展具有重大意义的企业或科研机构。

【报名条件】

1、在人工智能某一细分领域（如大模型、计算机视觉、自然语言处理等）取得重大技术突破；
2、创新成果已形成论文发表、专利授权或产品落地；
3、技术具有显著的应用价值和产业化前景。

【评选标准】

1、技术的原创性和突破性（50%）；
2、技术指标的国际领先程度（30%）；
3、潜在的经济社会效益（20%）。

【年度AI优秀创新奖】

旨在表彰2025年度推出的具有技术创新性和市场竞争力的AI产品，特别是在填补国内空白或实现技术替代方面表现突出的产品。

【报名条件】

1、产品在2025年内完成研发并上市；
2、具有自主知识产权和核心技术；
3、已实现一定规模的商业化应用。

【评选标准】

1、产品的技术创新性（40%）；
2、市场表现和用户反馈（30%）；
3、产品的社会价值（30%）。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.