网易首页 > 网易号 > 正文 申请入驻

AI进入Agent时代,CPU何以站上“算力C位”?

0
分享至

《科创板日报》1月31日讯 在很长一段时间内,市场始终将GPU和AI算力划上等号,然而随着AI行业步入由智能体驱动的强化学习时代,CPU正逐渐演变为算力“木桶效应”下的新短板。

最新研究显示,在完整的Agent执行链路中,工具处理相关环节在CPU上消耗的时间占端到端延迟的比例最高可达90.6%。在高并发场景下,CPU端到端延迟从2.9秒跃升至6.3秒以上。其结果揭示了在大量Agentic场景中,系统吞吐受限的并非GPU计算能力,而是CPU的核心数并发调度问题。

就在日前,GPU的超级玩家英伟达主动掏出20亿美元追加认购CoreWeave股票,并声称后者将在其平台上部署Vera CPU——一款专为“代理式推理(Agentic Reasoning)”设计,且在大规模AI工厂最具能效优势的CPU。据悉,因ARM CPU瓶颈,英伟达已计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支持。

东吴证券指出,英伟达主动提升CPU权重,等同于在系统层面确认:在长上下文与高并发Agent场景中,大内存CPU是承载海量KV Cache(键值缓存)的最优容器

与此同时,由于超大规模云服务商“扫货”,英特尔与AMD在2026全年的服务器CPU产能已基本售罄。为了应对供需极端失衡并确保后续供应稳定,两家公司均计划将服务器CPU价格上调10-15%。其中,英特尔甚至紧急将产能转向服务器端,一度导致消费电子端交付受阻。

在英特尔2025年第四季度财报电话会上,CEO陈立武表示,尽管AI时代带来了前所未有的半导体需求,但短期内,“我对未能完全满足市场需求感到遗憾”。

▌对话靠GPU,执行靠CPU

是什么让CPU从AI算力界的“冷板凳”上站起,成为需要被单独规划的核心资源池?国金证券等多个机构总结道,Agent对CPU需求提升主要来自三方面,即应用调度压力、高并发工具调用成为瓶颈,以及沙箱隔离抬升刚性开销

应用调度压力较好理解,当AI智能体层出不穷,服务器端整体调用频次与覆盖面显著升高,便会带来更多系统请求、数据搬运与控制流开销。

至于为何CPU负载高于GPU,在东吴证券看来,Agent时代AI由“纯对话”转向了“执行任务”,因此产生大量if/else判断,这种“分支类任务”倘若由GPU执行,会因控制流发散导致算力利用率急剧下降。与之相比,CPU的微架构却能够适应此类任务。

另据广发证券,Agent时代下,大语言模型叠加了决策编排器与多类外部工具,整体计算流程演化为“感知-规划-工具调用-再推理”的闭环结构。由于工具调用、任务调度、信息检索等关键环节均依赖CPU完成,随着Agent渗透率与工具调用密度提升,CPU作为中间调度枢纽的占用线性放大。

此外,在Agent场景下,长上下文推理会快速耗尽GPU HBM容量。为解决这一问题,业界采用KV CacheOffload技术将数据迁移至CPU内存。如此一来,CPU搭配大容量DDR5/LPDDR5承载KV Cache与部分参数,便成为了兼顾吞吐、扩展性与成本效率的主流架构选择。

从投资层面来看,招商证券表示,海外CPU巨头在国内的合作商将从这一轮CPU涨价行情中直接受益。此外,国内AI全产业链自主可控仍在不断推进,硬件端与软件端的生态适配正同步跟进,生态架构的升级将会对其中的各个环节提供性能上和产量上的双重要求,并带来明显的边际变化。

国海证券指出,超大规模数据中心已进入“升级周期”,CPU架构有较大替换需求,预计2026年服务器CPU出货量有望增长25%。服务器CPU是AI算力与数据中心升级的核心受益环节,正进入存量升级+国产替代+模型迭代三重共振周期,或将迎来价值重估机会。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑希怡住复式豪宅,客厅能打匹克球,丈夫慢热,婚姻却稳如老狗

郑希怡住复式豪宅,客厅能打匹克球,丈夫慢热,婚姻却稳如老狗

喜欢历史的阿繁
2026-02-01 01:14:40
反转了!居然是演的!视频已删除

反转了!居然是演的!视频已删除

深圳晚报
2026-01-31 23:01:48
特朗普:将对伊朗发动大规模打击

特朗普:将对伊朗发动大规模打击

亚太观澜
2026-01-29 20:40:03
勇救跳桥女子的浙江理想车主找到了!李想公开喊话要请他吃饭,当事人回应:他是偶像,我不敢想

勇救跳桥女子的浙江理想车主找到了!李想公开喊话要请他吃饭,当事人回应:他是偶像,我不敢想

极目新闻
2026-01-31 15:15:16
今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

阿龙美食记
2026-01-29 11:03:56
1988年授衔前,赵南起被匿名举报为“韩国间谍”,为何仍被授上将

1988年授衔前,赵南起被匿名举报为“韩国间谍”,为何仍被授上将

墨说古今
2026-01-18 22:56:11
分享一套既显身材又适合咱们普通人的打扮

分享一套既显身材又适合咱们普通人的打扮

牛弹琴123456
2026-01-31 19:54:14
浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

不写散文诗
2026-01-30 15:17:13
不要上当:赶农村大集记住6不买,因为都是假的,别忘转告家人

不要上当:赶农村大集记住6不买,因为都是假的,别忘转告家人

神牛
2026-01-30 19:33:36
《生命树》首播,被观众要求下架,理由很一致:毁了女警形象

《生命树》首播,被观众要求下架,理由很一致:毁了女警形象

银河史记
2026-01-31 20:04:27
手机建议买口碑好的,2026近乎无差评的3款手机,512GB轻松用六年

手机建议买口碑好的,2026近乎无差评的3款手机,512GB轻松用六年

科技阿维
2026-01-31 18:40:46
老朱家血统可能不干净……

老朱家血统可能不干净……

汉周读书
2026-01-31 12:55:06
黄埔五期为何没出名将:好样的都投了红军,留级生都归了老蒋

黄埔五期为何没出名将:好样的都投了红军,留级生都归了老蒋

青途历史
2026-01-31 13:49:32
不打伊朗了?俄武器到货,美调转枪口,逼中国外交官收拾包袱走人

不打伊朗了?俄武器到货,美调转枪口,逼中国外交官收拾包袱走人

揽星辰入梦
2026-02-01 03:24:47
正式退出,21岁陈芋汐遗憾,官宣决定,原因曝光,全红婵祝福

正式退出,21岁陈芋汐遗憾,官宣决定,原因曝光,全红婵祝福

懂球社
2026-01-31 14:08:33
金晨遭遇交通事故后面部受伤,手术仅一个月后亮相北影节,红毯状态被指无手术痕迹,“金晨变美了”当天热搜

金晨遭遇交通事故后面部受伤,手术仅一个月后亮相北影节,红毯状态被指无手术痕迹,“金晨变美了”当天热搜

大风新闻
2026-01-30 22:40:06
简直不敢相信,莫言竟将日本侵华战争比作“兄弟争夺家产”

简直不敢相信,莫言竟将日本侵华战争比作“兄弟争夺家产”

雪中风车
2026-01-18 17:08:39
当所有人都在期待德约和阿尔卡拉斯的澳网决赛时,只有他能“抢戏”

当所有人都在期待德约和阿尔卡拉斯的澳网决赛时,只有他能“抢戏”

上观新闻
2026-01-31 19:29:12
美国再次下令,驱逐中方外交官,手握军权的委代总统,会反抗吗?

美国再次下令,驱逐中方外交官,手握军权的委代总统,会反抗吗?

知鉴明史
2026-01-31 18:46:29
中英领导人会见,中方提出“大历史观”有何深意

中英领导人会见,中方提出“大历史观”有何深意

环球网资讯
2026-01-31 21:06:36
2026-02-01 04:16:49
财联社 incentive-icons
财联社
以“准确、快速、权威、专业”为新闻准则,为投资者提供专业的投资资讯。
679994文章数 1017316关注度
往期回顾 全部

科技要闻

SpaceX申请部署百万卫星 打造太空数据中心

头条要闻

新年"打虎"不停歇 三天落马两个正部级

头条要闻

新年"打虎"不停歇 三天落马两个正部级

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

李维嘉、吴昕、汪涵现身魏文彬追悼会

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

本地
游戏
亲子
家居
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

B社大佬:《老滚6》必须好好学《博德3》!

亲子要闻

儿童祛疤膏全攻略!2026年10款温和高效儿童祛疤膏实测推荐榜

家居要闻

蓝调空舍 自由与个性

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版