网易首页 > 网易号 > 正文 申请入驻

有模型厂商CPU需求提高5倍!计算设备迎来非人类用户:智能体

0
分享至

智能体需要什么样的硬件?这是硬件行业近期思考最多的问题之一。

第一财经记者近日参加的一场行业论坛上,一名物联网公司技术负责人说,智能硬件正迎来人类之外的第二类用户,即智能体。

此前常被定位为GPU霸主的英伟达已看到这一趋势,准备在秋季拿出一款为智能体设计的个人电脑芯片。而在数据中心,智能体带来的冲击已经开始,CPU成为承接智能体计算的主要平台,逐渐站回数据中心“C”位。

业界展望,给智能体“使用”的计算设备,可能会与人用的设备截然不同。为抢夺新的用户,处理器厂商开始了新一轮竞速。


CPU需求井喷

很多业内人士近期开始讨论,数据中心CPU的数量相比GPU,要如何从1:8向1:1演进。

近日一场采访中,英特尔数据中心集团副总裁兼中国区总经理陈葆立谈到CPU需求增大,称业内CPU需求短期存在供应紧张,英特尔已在尽量提升产能,但市场非常火爆,需求是所有供应商都无法快速满足的。他表示,国内某家大模型厂商反馈,从去年至今,该公司的CPU需求提高了5倍。

智能体应用爆发是CPU需求迎来拐点的原因。Arm边缘AI事业部执行副总裁Chris Bergey告诉记者,很多智能体依托专属CPU驱动,还有大量与AI工作负载相关的数据库操作用于管理上下文及整个运行过程,同样是高度依赖CPU的计算密集型任务。

而据腾讯云计算产品运营总监周驰观察,涌入云平台的很多自动化任务用于处理日常琐事,不需要很多GPU,更需要CPU的调度、高并发执行大量小脚本能力。

一些业界人士认为CPU需求会倍数增长。Arm CEO Rene Haas近日表示,按出货量计算,CPU需求增长比原本预想的更快,他无法预计增长倍数是4、6还是8,但数字在变大。陈葆立认为,目前还难以定论未来CPU和GPU的比例是不是1:1,但基本逻辑是给AI更多任务,多数任务执行者是CPU。

数据中心的“C位”也在悄然变化。资本市场上,英伟达的股价自2022年底ChatGPT面世后经历了暴涨。CPU厂商AMD、英特尔以及与CPU关系密切的IP设计厂商Arm,股价迅猛提拉的时间点则在年内,这三家厂商年内股价都翻倍增长。

业界近期判断,以CPU需求增长为代表的数据中心计算硬件变迁只是开始,智能体将更加彻底地改变硬件的运行方式乃至形态。

Chris Bergey告诉记者,为支撑AI产业变革,芯片硬件层面配套算力与存储组件的设计复杂度、研发成本大幅攀升,同时产品还要面临严苛的功耗限制。随着AI成为核心工作负载,系统内每一类计算单元,都要尽可能强化AI任务的运行能力。因此,市场将会出现全新的计算硬件。

智能体呼唤什么样的硬件?

一些业界人士认为,面向智能体,CPU将变得与以往截然不同,新的工作负载对CPU的效率、能力、核心数都提出新要求。

智能硬件基础设施厂商云尖信息副总裁张欢军表示,运行智能体时,要解决的核心痛点是“单颗CPU处理业务的能力”,即单台设备能否承载更多智能体、每个智能体的运行成本和效率是否足够好。

要承载更多智能体,一种方式是增加CPU的核数(一种计算单元),以增强并行计算能力。陈葆立认为,智能体需要更高的CPU核数,一些智能体适合使用核数极多、单核性能要求不太高的轻量核处理器。目前英特尔至强6+可以在单个CPU核心上同时运行3到4个用于处理简单日常工作的智能体。

上周Arm与英伟达合作推出的RTX Spark个人电脑芯片则搭载了20颗Arm处理器内核,是目前采用统一内存架构的PC类产品中CPU核心数最多的产品。“我们在云端和边缘侧都看到对更多CPU、对更高性能的强烈需求。大家真正需要的是更高的CPU密度,也就是更好的能效比 (performance per watt)。”Chris Bergey告诉记者。

智能体在边缘硬件运行还面临一个难以回避的挑战:内存空间有限。创通联达CTO黄小严在近日高通与极视角主办的端侧AI开发者技术开发日上表示,智能体开始成为硬件的核心用户,智能体场景涉及多轮对话,需要长时间记忆,但移动端的内存容量受成本约束,内存紧缺且有算力约束,容易导致上下文溢出,由此形成AI智力鸿沟。

芯片厂商已在探索更多方法,让边缘硬件的存储空间能被更好地利用。

英伟达与Arm合作开发的RTX Spark采用了Grace CPU、Blackwell RTX GPU及统一内存紧密耦合的方式。Chris Bergey告诉记者,行业迈入智能体阶段,用户需要高性能GPU与CPU之间的紧密结合,统一内存是为了让CPU和GPU能完整调用全部DRAM(动态随机存取存储器)及带宽资源,并让系统设计不再依赖PCIe或CXL等传统传输接口,提升CPU与GPU间的传输带宽。统一内存技术正在推动边缘计算变革。

应对显存和闪存资源紧缺,英特尔则采用QAT(快速辅助技术)和IAA(内存分析加速)技术。

陈葆立表示,AI运行时,海量KV Cache(一种大模型优化技术,通过缓存向量避免冗余计算)需要存,100万上下文约等于10G以上KV Cache,是一大笔闪存开销,而通过QAT技术可以让压缩比达到50%,节省闪存成本。多个智能体运行时,IAA则能实时性压缩内存数据以节省内存。

除了内存问题,黄小严还提到,智能体在移动计算设备上不停歇运行,设备需要在省电、高唤醒率之间找到平衡。传统物联网软件架构失效,设备必须重构,以便智能体理解和调用,智能体安全也需要新的保障。为解决这些问题,他所在的公司使用了高通开发工具链等,在软硬件和系统平台层面进行了设计,搭建了端侧智能体中间件运行平台等。

智能体专用硬件平台兴起

今年初,OpenClaw爆火带动了Mac Mini这类计算设备销售,人们买Mac Mini更多是为了让智能体在本地运行,而不是自己上手操控电脑。这是智能体专用设备的雏形。现在,真正为智能体设计的个人计算设备也开始出现了。

今年秋季将上市、搭载了RTX Spark芯片的笔记本和台式电脑,将由联想、华硕、Microsoft Surface等厂商推出。对这款芯片,英伟达CEO黄仁勋形容为“重新发明了个人电脑的工作方式”。

Arm也看到,个人电脑行业将发生巨大改变。“PC需求分化为两种,一种是电池好、随处可连接网络,就像一个大号手机加一个键盘,能用来工作;另一种需要有非常极致的性能,能运行智能体、模型或做开发工作。”Rene Haas上周表示。

Chris Bergey向记者进一步解释,以往的PC从入门级向高性能产品延伸演进,整体产品架构相对一致,高端机型靠提升主频、扩充核心数、选用更强性能内核来实现迭代。而随着智能体专用硬件平台兴起,现在对PC市场的区分已截然不同。

“用户对此类设备有明确需求:PC能7×24小时不间断运行智能体;设备依托高性能硬件,以高吞吐规格运行各类大模型;除了支出设备采购、供电及网络接入成本,不产生额外算力费用,模型本地运行,用户隐私数据留存本机。”Chris Bergey说,传统PC一天内只使用一小部分时间,新一代硬件作为本地token(词元)生成引擎,则要全时段输出算力。

Chris Bergey告诉记者,当下人们正在使用的传统PC还会继续迭代,整机趋于轻薄紧凑,主打便携属性。另一类可供智能体使用的设备便携性偏弱,可留在家中不间断运行。两种产品在外观、摆放结构等物理设计层面也有差异。

高通技术公司(中国)资深产品市场经理朱元堃则认为,个人用户使用AI的方式也会发生改变。以往人们以手机为核心使用AI,耳机、眼镜、手表等穿戴设备作为附属连接,未来将转向以AI和用户为中心的多终端体验,AI不再绑定某个具体的设备,而是通过多设备灵活协同服务用户。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
经常喊累的人,都有个共性

经常喊累的人,都有个共性

十点读书
2026-06-24 21:46:10
心理学上有个词叫“空椅子技巧”:讨厌一个人时,其实不必闹翻脸,最高级的处理方式就是用“空椅子技巧”

心理学上有个词叫“空椅子技巧”:讨厌一个人时,其实不必闹翻脸,最高级的处理方式就是用“空椅子技巧”

心理观察局
2026-06-16 07:47:21
收下2160万!他打了13年没进全明星,却赚了3亿,比韦德司机还多

收下2160万!他打了13年没进全明星,却赚了3亿,比韦德司机还多

大西体育
2026-06-25 23:03:52
贾浅浅的事最新回应来了

贾浅浅的事最新回应来了

大张的自留地
2026-06-24 18:47:36
别被镜子骗了!你这副没毛的身体是地球演化史上最可怕的生物武器

别被镜子骗了!你这副没毛的身体是地球演化史上最可怕的生物武器

心中的麦田
2026-06-23 11:10:20
史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

小莜读史
2026-06-24 13:27:56
震惊!广东物理类全省前10屏蔽生里,深中占5人,断层领跑引热议

震惊!广东物理类全省前10屏蔽生里,深中占5人,断层领跑引热议

火山詩话
2026-06-25 05:18:05
今年夏天太反常!6月不热早晚凉,老话的征兆别不当回事

今年夏天太反常!6月不热早晚凉,老话的征兆别不当回事

三农雷哥
2026-06-24 16:54:34
凉山小伙首回合KO日本拳手夺冠 本人回应:赛前曾遭对手挑衅 他小时候曾是放牛娃

凉山小伙首回合KO日本拳手夺冠 本人回应:赛前曾遭对手挑衅 他小时候曾是放牛娃

红星新闻
2026-06-25 20:23:49
2026年河北高考最高分的榜单走红网络!网友:衡水中学跌落神坛了

2026年河北高考最高分的榜单走红网络!网友:衡水中学跌落神坛了

火山詩话
2026-06-25 15:32:30
乌克兰跨境攻入俄罗斯本土!炸掉别尔哥罗德军事工厂

乌克兰跨境攻入俄罗斯本土!炸掉别尔哥罗德军事工厂

项鹏飞
2026-06-25 22:18:13
成都石室(文庙)已有2名学生取得四川高考历史类前10名成绩

成都石室(文庙)已有2名学生取得四川高考历史类前10名成绩

封面新闻
2026-06-25 21:44:02
“霉霉”被曝7月3日举办婚礼:婚礼地点泄露,纽约一街道将封街3天,最多999人参加;特朗普曾发帖祝福

“霉霉”被曝7月3日举办婚礼:婚礼地点泄露,纽约一街道将封街3天,最多999人参加;特朗普曾发帖祝福

鲁中晨报
2026-06-25 21:23:16
听过最恐怖的故事是什么 看网友讲述 我身上的汗毛倒竖人间地狱啊

听过最恐怖的故事是什么 看网友讲述 我身上的汗毛倒竖人间地狱啊

侃神评故事
2026-06-25 11:02:06
0-0战平+红牌:伊朗升至榜首,比利时陷绝境

0-0战平+红牌:伊朗升至榜首,比利时陷绝境

简简单单的说
2026-06-22 22:58:49
世界杯为何同时开球?源于1982年“希洪丑闻”

世界杯为何同时开球?源于1982年“希洪丑闻”

绿茵狂热者
2026-06-25 00:07:55
胖点的女生真的不用怕,这样打扮确实很有魅力

胖点的女生真的不用怕,这样打扮确实很有魅力

美女穿搭分享
2026-06-24 17:42:43
美国女子嫌弃中国麻将丑,高调发明白人麻将,改图案、删汉字

美国女子嫌弃中国麻将丑,高调发明白人麻将,改图案、删汉字

怪味历史连连看
2026-06-25 11:31:41
霍福德2年1400万留守勇士!ESPN评级B+:风险极小物超所值

霍福德2年1400万留守勇士!ESPN评级B+:风险极小物超所值

罗说NBA
2026-06-25 22:27:56
“建议取消私生子继承权!”专家话炸翻全网:凭什么要为背叛买单

“建议取消私生子继承权!”专家话炸翻全网:凭什么要为背叛买单

一丝不苟的法律人
2026-06-25 11:22:53
2026-06-25 23:31:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
257210文章数 622780关注度
往期回顾 全部

科技要闻

存储成本压力山大!苹果罕见全球提价

头条要闻

33岁男子赴泰考察后失联 曾打电话给妻子称"被人按着"

头条要闻

33岁男子赴泰考察后失联 曾打电话给妻子称"被人按着"

体育要闻

世界杯最动人一吻:我若离世 你就改嫁吧

娱乐要闻

这国产剧太装了,居然还热播第一?

财经要闻

又有纸尿裤送检后被检测出甲酰胺!

汽车要闻

一汽-大众迈腾PHEV、探岳L PHEV双车上市 16.99万起

态度原创

时尚
手机
家居
公开课
军事航空

今年夏天最流行的阔腿裤,配这5双鞋时髦又松弛

手机要闻

探到苹果iPhone 18 Pro/华为Mate 90/小米18新消息,先抖点能说的

家居要闻

绿意盎然 自然之境

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:现在到了关注朝鲜问题的时候了

无障碍浏览 进入关怀版