网易首页 > 网易号 > 正文 申请入驻

“买显存送核心”,AI芯片竞赛进入“内存为王”!智能体大时代,中国AI芯片有何机会?

0
分享至

曾经,云服务厂商买AI芯片,关注GPU(图形处理器)算力大小,而如今,可能更多的是看重显存大小,比如是40GB还是80GB。

甚至有人调侃“买显存送核心”,即买一张GPU算力卡,更看重的是显存带宽和容量,而不是GPU算力大小。

如今,内存芯片一两个月价格翻倍的大涨潮,正是对AI芯片进入“内存为王”的集中体现。

AI云基础设施厂商PPIO相关专家告诉每经记者:“HBM(高带宽内存)及CoWoS(基板上晶圆、芯片)封装产生的成本已经超过纯GPU芯片,HBM成本已经‘碾压’核心,‘买显存送核心’已成为现实。”

某GPU芯片企业技术负责人李明(化名)对每经记者表示:“结合我们硬件设计与供应链经验,CoWoS封装GPU中,当前HBM显存成本已接近甚至超过GPU核心,是整卡成本最高的单一组件。”

懂芯创始人张慧娟告诉每经记者:“AI芯片的竞争已从单纯的算力竞赛,转向了内存带宽和内存容量的双重竞赛。HBM通过先进封装技术与GPU裸片集成在同一封装内,实现了计算与存储的紧耦合,极大地缓解了内存难题,越来越成为业界追捧的主要方向。”


图片来源:每经媒资库

智能体大时代:内存需求强劲

2025年下半年以来,存储芯片持续涨价成了半导体行业最热门的话题。进入2026年,存储芯片仍保持上涨趋势,且涨幅惊人。

而这背后,是AI芯片已进入“内存为王”的时代。

2023年,ChatGPT石破天惊,人类社会进入大模型时代。进入2026年,大模型已然从思考转向应用,智能体、Skill以及“养虾”成了热门话题。

人工智能的发展,也对AI芯片有了新的要求。随着大模型参数的增加,训练和推理对显存(内存的一种)的需求也与日俱增。

张慧娟表示:“我们已经见证了模型参数量的指数级增长,从GPT-3的1750亿到万亿级MoE(混合专家模型),直接推动了HBM需求的爆发。这也逐步造成,制约算力的瓶颈往往不是芯片算力本身,而是数据从内存传输到计算核心的速度,因为参数必须被加载到计算单元附近的高速存储介质中,计算单元才能以极低的延迟调用它们进行运算。”

李明认为:“大模型的参数量与内存需求之间存在着直接的正向关系。在2026年的技术背景下,虽然模型架构(如MoE混合专家模型)和量化技术(Quantization)在不断优化,但‘参数量越大,内存需求越高’依然是AI领域的基本物理定律。除了模型权重需要的静态显存占用以外,大模型运行时需要的KV Cache和激活值等都会额外占用显存。在训练任务中,还需要额外显存来保存梯度和优化器状态等信息。”

但大模型对内存的强劲“渴望”,不仅仅局限于参数的增长。

智能体的快速发展,令AI推理对AI芯片的需求大增。业界普遍认为,未来AI推理对AI芯片的需求将大幅超越AI训练。

PPIO专家表示:“大模型推理场景中,GPU内存主要用于两个方面,一是保存大模型的权重,另一个是推理过程中用于存储中间状态,也就是KV Cache缓存。前者由大模型参数量决定,后者取决于会话的上下文长度。大模型发展至今,参数量已经趋于稳定,不会大幅增加。而会话的上下文长度还在持续增加,特别是Agent(智能体)场景下,1百万Token的上下文长度已成为主流。这样进一步增加对内存的开销,长上下文成为内存需求的主要因素。”

参数、长上下文,这两大因素的作用下,内存的重要性已然超越GPU计算核心。

成本结构:内存>算力

不仅仅客户需求侧更加看重内存。在成本结构中,内存的成本也大幅高于纯粹的GPU核心。

PPIO专家称:“一张GPU的成本构成主要分成三部分,一是HBM内存,容量越大成本越高;二是GPU核心(逻辑计算芯片);三是先进封装工艺(CoWoS)。高端GPU,由于HBM内存容量更大,其HBM的成本更高,以B200(英伟达GPU)为例,其总生产成本的构成中,HBM内存占比约45%,CoWoS封装及良率损失占比约34%,GPU核心芯片占比只有14%左右。”

即英伟达B200的成本结构中,45%源自向SK海力士、三星、美光等厂商购买HBM,14%源自台积电代工的GPU裸芯,34%源自台积电代工的CoWoS封装及良率损失。

而HBM由多层DRAM(动态随机存取存储器)堆叠而成。HBM需求大增,意味着SK海力士这类厂商将越来越多的DRAM产能用于制造HBM,相应用于消费级的DRAM产能便少了。

PPIO专家表示:“三大存储巨头(三星、SK海力士、美光)已经将70%的产能转移到HBM上,用于消费电子的GDDR产能反而会下降。因此我们首先看到消费领域的GeForce GPU的价格普遍上涨,大内存GPU减产甚至停产,这是由于GDDR内存减产以优先保障HBM内存导致的。”

那么,若未来存储行业产能提升,消费电子领域存储价格是否也将率先受到冲击?

张慧娟认为:“消费电子往往是最先感知到波动的领域。特别是对于存储来说,比如手机、PC(个人电脑)用的LPDDR(低功耗内存)、SSD(固态硬盘)等接近于标准品,价格弹性大。一旦上游晶圆产能提升,最先反映在现货价上的是这些产品。”

李明认为:“未来存储产能提升后,最先受到影响的是消费电子用存储。消费级存储认证周期短、需求弹性大、替换灵活,新产能可快速导入消费端,价格波动也最为明显。而数据中心用存储认证流程通常需要6—18个月,新产能导入速度较慢,且存储厂商会优先保障数据中心的产能供给,因此它受产能提升的影响最晚、幅度最小。总体而言,产能提升的影响会先平抑消费端价格,再逐步传导至企业级市场。”

简而言之,存储产能提升后,将率先平抑消费端存储芯片价格。

HBM需求强劲,产能严重不足

值得一提的是,三星、SK海力士未来将有两座晶圆厂陆续投产,这将缓解内存“缺货涨价”吗?若P4L(三星电子)和M15x(SK海力士)提前投入运营,是否将对存储芯片价格带来冲击?

张慧娟认为:“P4L和M15x新增产能,很大程度上是为HBM和高性能DDR5(第五代计算机内存规格)准备的,而不是传统的DDR4(第四代计算机内存规格)或NAND(闪存)。这些属于高端产能。”

其补充表示:“对HBM的价格冲击可能不大,甚至不会降价。因为AI芯片开发周期长,且市场处于供不应求的局面。新增产能是为了填平供需缺口,有望抑制价格进一步大涨,但难以带来大幅降价。对普通DRAM而言,假设HBM需求不及预期,或者厂商将部分产线切换回通用DRAM,那么会对消费电子内存价格带来压力。但目前看,晶圆厂更倾向于优先保证高利润的HBM生产。”

李明对每经记者表示:“从存储芯片供应链与GPU硬件配套的角度分析,三星P4L与SK海力士M15x即便提前投产,短期内对存储芯片价格的冲击也较为有限。核心原因在于,这两座工厂的新产能主要聚焦于HBM、先进制程DDR等高端存储产品,并未直接扩产消费级存储。”

李明补充表示:“当前AI需求呈爆发式增长,高端存储仍处于供需紧张状态,因此短期价格将维持高位。中长期来看,随着产能逐步释放,高端存储的供给压力会有所缓解,但新产能将优先配套AI与数据中心需求,普通消费级存储不会出现大幅降价,整体呈现结构性缓和态势。此外,各大厂商的存储优化技术,也能进一步平衡供需,避免全品类存储价格出现大幅波动。”

PPIO认为:“HBM的产能严重不足以及AI数据中心对GPU的旺盛需求是造成HBM内存成本远高于GPU核心的主要因素。市场的供需不平衡会促使更多内存厂商扩大生产,尤其是增加HBM的生产和供给,不过短期很难改变供需失衡的现状,未来HBM内存价格还将继续上涨,但趋势会放缓。”

在AI算力相对不稀缺而HBM短缺的背景下,中国AI芯片厂商有何机会?

据记者了解,国内AI芯片厂商除了自身产品和技术解决方案,还在基础软件层面联合各大人工智能基础设施公司、大模型厂商和互联网等生态伙伴一同研究例如低精度量化、专家预测加载等工程优化技术,来系统性地降低实际大模型部署和应用过程中对内存的需求。

即在工程化领域,中国工程师红利或将凸显。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5种“夺命花”不要养,家里要有赶快扔,谁不听劝谁吃亏

5种“夺命花”不要养,家里要有赶快扔,谁不听劝谁吃亏

三农老历
2026-03-26 09:42:30
闭眼隔扣+戏耍两人后嘲讽拉满!41岁詹皇23+9+9 在场+24湖人封王

闭眼隔扣+戏耍两人后嘲讽拉满!41岁詹皇23+9+9 在场+24湖人封王

颜小白的篮球梦
2026-03-26 09:40:23
被抓后家中查出20吨黄金?秘密移民国外?赵本山身上的谣言太离谱

被抓后家中查出20吨黄金?秘密移民国外?赵本山身上的谣言太离谱

潮鹿逐梦
2026-03-24 17:58:35
美国最大的失误就是一上来就把宋江给干掉了

美国最大的失误就是一上来就把宋江给干掉了

仰望星空的一粒沙子
2026-03-14 16:25:14
萨巴伦卡等人会师迈阿密站女单四强,半决赛世界前二将直接对话

萨巴伦卡等人会师迈阿密站女单四强,半决赛世界前二将直接对话

生活新鲜市
2026-03-26 16:30:08
“能劝一个是一个,海肠捞饭就是智商税”

“能劝一个是一个,海肠捞饭就是智商税”

风味人间
2026-03-26 13:32:37
“只要决心够大,诺贝尔奖不在话下!”

“只要决心够大,诺贝尔奖不在话下!”

槽逻辑
2026-03-24 18:46:27
为什么建议你多做俯卧撑?6个被低估的好处

为什么建议你多做俯卧撑?6个被低估的好处

增肌减脂
2026-03-25 11:53:14
史诗级!曝1.7亿“顶星”空降阿森纳!两大攻击手遭“打包”放逐

史诗级!曝1.7亿“顶星”空降阿森纳!两大攻击手遭“打包”放逐

头狼追球
2026-03-26 13:48:03
伊朗警告:情报显示敌对势力在“某地区国家”支持下准备占领伊朗岛屿,若敌人胆敢采取行动,将对该地区国家所有重要基础设施进行猛烈攻击

伊朗警告:情报显示敌对势力在“某地区国家”支持下准备占领伊朗岛屿,若敌人胆敢采取行动,将对该地区国家所有重要基础设施进行猛烈攻击

极目新闻
2026-03-26 09:09:58
我退休金5780,儿子叫我去上海带娃,吃饭时儿媳每月交2400生活费

我退休金5780,儿子叫我去上海带娃,吃饭时儿媳每月交2400生活费

艺鉴在线
2026-03-26 12:54:44
14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

红星新闻
2026-03-24 23:25:19
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
杨鸣指出广东男篮两大问题,杜锋迷恋小阵容,用人问题明显!

杨鸣指出广东男篮两大问题,杜锋迷恋小阵容,用人问题明显!

中国篮坛快讯
2026-03-26 17:45:38
ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

ATP的灾难:无趣的辛纳和事业心不足的阿尔卡拉斯

网球之家
2026-03-26 13:25:06
亚洲杯抽签仪式将延期进行,国足明战库拉索,重点演练定位球

亚洲杯抽签仪式将延期进行,国足明战库拉索,重点演练定位球

五星体育
2026-03-26 17:41:30
欧洲芯片巨头官宣:我已在中国大陆,制造40nm芯片了

欧洲芯片巨头官宣:我已在中国大陆,制造40nm芯片了

互联网.乱侃秀
2026-03-25 09:45:10
江苏一男子为控制血糖,每天坚持走路9000步,半年后他的身体咋样

江苏一男子为控制血糖,每天坚持走路9000步,半年后他的身体咋样

徐医生健康讲坛
2026-03-26 13:57:18
曝信达证券所长猥亵员工,长得很老实,女方颜值出众,合影曝光

曝信达证券所长猥亵员工,长得很老实,女方颜值出众,合影曝光

180视角
2026-03-25 17:34:12
“鸟面妈妈”王小妞:不听劝阻生二胎,儿子遗传其外貌,现如何

“鸟面妈妈”王小妞:不听劝阻生二胎,儿子遗传其外貌,现如何

观察者海风
2026-03-24 23:04:30
2026-03-26 18:16:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1518917文章数 2724758关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
时尚
房产
手机
亲子

数码要闻

苹果MacBook Neo将重塑整个笔电行业!分析师纷纷强调:打不过

皮衣+裙,高级到炸

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

手机要闻

顶配Ultra旗舰!vivo X300 Ultra配置公布:骁龙8E5+2K/144Hz直屏、8.19mm机身

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被立案调查!

无障碍浏览 进入关怀版