网易首页 > 网易号 > 正文 申请入驻

2025 AI 芯片年终盘点:通用GPU v.s. 推理芯片,从算力竞赛到效率突围

0
分享至

2025 年岁末,英伟达(NVIDIA)宣布以 200 亿美元收购 AI 芯片新锐 Groq,这场创纪录的收购案如同一场深冬地震,彻底打破了硅片世界的宁静。此前,Groq 凭借比传统 GPU 快 10 倍以上的推理速度被称为“地表最强推理芯片”,而英伟达的此番出手,被业内视为算力范式转型的分水岭。

它向全球释放了一个明确信号:AI 芯片的战争策源地正从“训练”向“推理”剧烈迁移。当大模型走出实验室,进入万千应用场景,推理成本和速度将直接决定 AI 产业的生死。在 2025 年的宏观视野下,这场“变天”不仅标志着行业逻辑的重构,更预示着推理算力已成为大国博弈与科技竞速的下一个制高点。

回望 2025 年,算力需求已从单纯的“参数竞赛”转向“应用落地”,这种变化直接引发了国产 AI 芯片企业在资本市场的集体“突围”。即便在中美科技博弈的冷峻背景下,国产芯片力量依然展现出惊人的韧性。

继地平线、黑芝麻于2024年登陆港股后,2025 年迎来了真正的“上市大年”:摩尔线程、沐曦科技正式登陆A股科创板,天数智芯、壁仞科技也纷纷登陆港股。资本的持续加注与数个万卡级国产算力集群的规模化交付,标志着中国芯片产业正从“补位者”向“核心力量”跃迁。站在岁末观察,AI 芯片江湖已由最初的浑沌状态,清晰地演化为“通用 GPU 派”与“推理派”两大阵营。

第一派:追求生态护城河的“通用 GPU 派”

这一派系依然是全球算力体系的“底座”,致力于在云端构建超大规模的计算资源池,是所有巨量参数模型诞生的”摇篮”。国际市场上,英伟达凭借 Blackwell 架构(B200)及其深度集成的 NVLink 高速互联技术,构建了近乎垄断的硬件性能壁垒;但其真正的“杀手锏”在于经营二十余年的 CUDA 生态,这种软硬一体的深度绑定,使得全球数百万开发者早已习惯于英伟达的底层逻辑,形成了极高的迁移成本。

作为挑战者,AMD 正通过开源 ROCm 生态与 MI300 系列的性价比优势,在高性能计算与特定云厂商的定制需求中艰难寻找裂缝,试图打破“一超”格局。

视角转回国内,摩尔线程、壁仞科技、沐曦科技等企业作为此路线的坚定践行者,在 2025 年完成了从“性能跑分”到“万卡集群实测”的关键跨越。他们不仅致力于在底层架构上实现对主流软件生态的无缝兼容,更在分布式计算效率、全功能 GPU 架构的普适性上投入重金。

对于国产大模型开发者而言,这一派系的存在具有极高的战略意义:他们通过大算力、高通用性的优势,在重重封锁下为国产算力的迭代保留了珍贵的种子,解决了从 0 到 1 的“算力有无”问题。他们更像是算力荒时代的“开山斧”,专注于在云端攻克超大规模参数量下的并行计算难题,为后续全行业、全场景的应用爆发夯实了最沉稳、最厚实的数字化底座。

技术上,摩尔线程选择了较为激进的“全功能GPU”方向,基于其自主研发的MUSA统一架构,在一张显卡上同时实现AI训练与推理、图形渲染、视频处理等多场景能力。基于MUSA统一体系,摩尔线程新一代全功能GPU架构“花港”在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破。

壁仞科技和沐曦股份则聚焦通用GPU,针对云端算力市场。壁仞科技定位“高端通用GPU”,凭借Chiplet异构集成技术,推出性能对标英伟达H100的BR100芯片,成为国产GPU“技术天花板”的代表企业。

沐曦科技以自主研发的GPU IP为核心,突破了“高性能计算+AI训练”双场景兼容难题,其MXMACA软件栈兼容CUDA生态,可直接迁移英伟达GPU上的应用程序,解决了“生态迁移成本高”的行业痛点,有望迅速“消化”一部分英伟达留下的国内市场。

作为国内首家实现训练与推理通用 GPU 量产企业,天数智芯秉持长期主义,历经多代产品迭代,实现通用GPU 从 “跟跑” 到 “并跑” 的跨越,其通用GPU产品全面兼容 TensorFlow、PyTorch、PaddlePaddle 等国内外主流 AI 框架及各类深度学习加速库,通过标准化接口将应用迁移时间降低50%以上。

当前,国内通用 GPU 市场正迎来 “需求爆发 + 国产替代” 双重红利。2024 年市场规模达1546 亿元,预计 2029 年将增至7153 亿元,国产厂商市场占比预计将超过 50%。随着全维度竞争力的不断增强,国内通用 GPU企业有望在千亿替代市场中进一步扩大份额,推动国产通用 GPU 产业从追随者向引领者的转变。

第二派:深耕效能长板的“推理派”

当大模型进入大规模商用阶段,行业焦点正迅速从“如何训练”转向“如何落地”,由此催生了异军突起的“推理派”。

不同于训练端对“暴力计算”的痴迷,推理侧更强调单位成本下的处理效能、确定性时延以及极致的能效比。在这个赛道上,谷歌的 TPU、亚马逊的 Inferentia 均在通过自研架构寻求效率最优解。这种市场转向的背后,是 AI 产业从“实验室投入”向“商业化产出”转型的必然结果。

推理芯片之所以被寄予厚望,核心逻辑在于其直接决定了 AI 应用的“Token 经济学”。随着长文本处理、实时语音对话以及多模态生成需求的爆发,算力消耗已不再是一次性的研发投入,而是伴随每一次用户交互的持续运营成本。通用 GPU 虽然强大,但在执行单一推理任务时往往存在计算资源浪费和高昂的功耗代价。相比之下,专门针对推理负载优化的芯片通过精简逻辑控制、优化显存带宽与算力配比,能够提供数倍于通用架构的性价比。这意味着,只有让推理成本下降到企业和个人“用得起”的区间,AI 的普惠化才具备现实基础。

在这股能效比竞赛中,中国本土芯片力量展现出了敏锐的市场洞察力与极强的场景渗透力。华为昇腾系列、寒武纪以及云天励飞等国产领军厂商,正通过架构创新在这一差异化赛道上加速突围。不同于单纯追求通用性能指标的传统思路,这些企业更倾向于在“算力、功耗、成本”的黄金三角中寻找最优平衡点,从而在推理效能的“长板”上构筑起深厚的技术壁垒。这种立足于本土超大规模应用场景的深度适配,正加速推动国产芯片从单纯的硬件交付转向全栈式的能效服务,为未来万亿级的推理市场预留了极具韧性的增长空间。

与英伟达基于通用集成集成电路设计的GPU有所不同,华为昇腾系列芯片属于专用集成集成电路架构的NPU,专为处理AI神经网络计算任务设计。从2019年开始,华为已经发布多款昇腾910系列芯片,包括910B、910C多款产品,该系列是基于华为自研的达芬奇架构,以集群化、规模化弥补单芯片性能不足,专为云端AI训练和推理使用。

作为“国产AI芯片第一股”,寒武纪的核心优势在于“全栈技术布局”与“规模化落地能力”,是目前唯一实现“云边端一体”的国产GPU企业,技术上采用“软硬件协同+训推融合”架构,自主研发智能处理器指令集与微架构,核心技术壁垒高,一举成为国产芯片领域的“现象级企业”。

云天励飞聚焦AI推理赛道,致力于打造“中国版TPU”。其自主研发的GPNPU基于“算力积木”架构,兼顾通用性与高效率,能够在国产工艺下实现算力单元的灵活扩展,满足多样化场景需求。公司“深界”“深穹”“深擎”等芯片目前已在智算中心、具身智能等领域应用,为各行业客户打造标杆级AI应用提供国产强力支持。

在AI技术从实验室走向规模化落地的进程中,推理环节正成为决定体验与成本的核心竞争——专门为推理优化的芯片,已然成为科技行业的新风口。

训练时代,英伟达是当之无愧的王者,也是标准制定者。在训练赛道上追赶,我们不得不面对先进制程受限和CUDA生态高墙的现实,差距是客观存在的,然而推理赛道将呈现的是另一番景象。在推理时代,“所有人都站在同一条新的起跑线上。谁能在成本、效率和系统能力上建立优势,谁就有机会。”云天励飞董事长兼CEO陈宁说。

展望未来:从“暴力计算”转向“精细化运营”

成本,是横在AI规模化面前最现实的一座山。展望 2026 年,AI 芯片产业将不再迷信单一的绝对性能,而是全面进入专业化、精细化的新纪元。最显著的趋势是“训推分离”的彻底化:过去用昂贵的训练芯片承担简单推理任务的“资源错配”模式将被终结,专门针对推理优化的芯片将成为市场的主流选择。

同时,PD 分离(Prefill 与 Decode 分离)等前沿架构的规模化落地,将针对大模型生成过程中不同阶段的负载特性进行“精细化手术”。这种技术演进不仅提升了算力的吞吐上限,更极大降低了 AI 应用的边际成本。

在这个大博弈时代,算力不仅是技术的竞争,更是主权的象征。当推理规模化的大幕拉开,以云天励飞为代表的国产推理芯片领军力量,正以自主可控的底层技术,为中国 AI 产业构筑起一个算得稳、用得起、行得远的“新底座”。这不仅是企业间的胜负,更是中国在智算时代掌握数字主权、驱动千行百业实现质变的关键支点。

推理芯片的赛道,比的正是这种赋予AI以“现实感”的能力。在这里,中国公司第一次与全球竞争者站在了相近的起跑线上。这场竞赛的终局,或许不是诞生一个替代英伟达的单一巨头,而是成长起一批能在政务、金融、工业等“粮食产区”深耕,提供稳定、可靠、划算算力服务的新力量。

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
读博7年仅发表1篇论文?湖大博士崩溃痛哭,3天就跟导师闹掰了

读博7年仅发表1篇论文?湖大博士崩溃痛哭,3天就跟导师闹掰了

妍妍教育日记
2026-01-28 19:28:30
可以仅取三胜,也可以取16胜?快船的表现令众多媒体球迷感到迷惑

可以仅取三胜,也可以取16胜?快船的表现令众多媒体球迷感到迷惑

大漠风光
2026-01-29 03:55:06
中日航线切断后安理会交锋,中方发出四大灵魂拷问

中日航线切断后安理会交锋,中方发出四大灵魂拷问

掉了颗大白兔糖
2026-01-29 03:27:15
两个85后,腾讯投了,市值887亿!

两个85后,腾讯投了,市值887亿!

笔记侠
2026-01-28 21:38:04
东京男性每6人就有1人「搭电车被性骚扰」 ,4成来自同性「男人摸」,4成来自女性,还有2成性别不明……

东京男性每6人就有1人「搭电车被性骚扰」 ,4成来自同性「男人摸」,4成来自女性,还有2成性别不明……

日本物语
2026-01-27 20:53:09
郭晶晶代言风波后,令人担心的事发生了,霍启刚的做法让人意外

郭晶晶代言风波后,令人担心的事发生了,霍启刚的做法让人意外

未曾青梅
2026-01-27 21:33:53
Netflix必刷十大神剧!

Netflix必刷十大神剧!

追剧九号厅
2026-01-28 12:04:08
谁属这3生肖恭喜了,腊月开始横财接二连三来,越来越富!

谁属这3生肖恭喜了,腊月开始横财接二连三来,越来越富!

人閒情事
2026-01-24 10:37:58
才播4集热度破16000,江疏影令观众成功入坑,都市剧又出黑马了

才播4集热度破16000,江疏影令观众成功入坑,都市剧又出黑马了

草莓解说体育
2026-01-29 03:16:10
马筱梅说出玥儿箖箖不能回北京上学原因,表示老三会在北京上学

马筱梅说出玥儿箖箖不能回北京上学原因,表示老三会在北京上学

到此为止的印象
2025-12-31 03:40:43
徐艺洋机场被偶遇,生图五官优越有星味,棉袄又薄又皱好廉价

徐艺洋机场被偶遇,生图五官优越有星味,棉袄又薄又皱好廉价

往史过眼云烟
2026-01-28 19:41:23
二战结束男女比例失调,为解决女子生活问题,苏联想出一个小妙招

二战结束男女比例失调,为解决女子生活问题,苏联想出一个小妙招

叹为观止易
2026-01-17 09:55:42
马英九第一智囊:统一最后时刻到大陆想谈也准备战争!台美得想好

马英九第一智囊:统一最后时刻到大陆想谈也准备战争!台美得想好

误落风尘
2026-01-29 01:25:31
李思思现身邢台主持,又矮又胖,1米7看着就像1米5,脸还变圆润了

李思思现身邢台主持,又矮又胖,1米7看着就像1米5,脸还变圆润了

小娱乐悠悠
2026-01-26 11:36:45
我38岁被裁员,公司补偿了我75万,手续办完后,财务总监追了出来

我38岁被裁员,公司补偿了我75万,手续办完后,财务总监追了出来

五元讲堂
2025-12-23 11:21:19
46岁霍建华和朋友在北京聚餐,他穿牛仔裤皮靴,侧脸好像霸总感觉

46岁霍建华和朋友在北京聚餐,他穿牛仔裤皮靴,侧脸好像霸总感觉

老吴教育课堂
2026-01-04 04:47:54
笑不活了!汪小菲硬核喊看娃,马筱梅秒下播,乐乐原地懵圈

笑不活了!汪小菲硬核喊看娃,马筱梅秒下播,乐乐原地懵圈

日不西沉
2026-01-27 21:00:23
14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

14岁陈佳铭已昏迷超30天,上海专家会诊后,确认无生还希望

李健政观察
2026-01-26 16:54:58
武汉理工毕业的保安遭辞退:老婆是副教授,武汉有两套房副业过万

武汉理工毕业的保安遭辞退:老婆是副教授,武汉有两套房副业过万

汉史趣闻
2026-01-28 21:18:24
肯德基,被迫改名PFK

肯德基,被迫改名PFK

设计癖
2026-01-24 12:13:41
2026-01-29 04:32:49
经济观察报 incentive-icons
经济观察报
经济观察报是专注于财经新闻与经济分析的全国性综合财经类媒体。聚焦商道、商技和商机。
112776文章数 1606391关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

本地
手机
家居
公开课
军事航空

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

手机要闻

HyperOS 3.1淘汰名单:REDMI K60、POCO F5在列,有你的手机吗

家居要闻

跃式别墅 包络石木为生

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗竖起巨幅宣传画:一艘美军航母被炸

无障碍浏览 进入关怀版