网易首页 > 网易号 > 正文 申请入驻

智能体AI浪潮重塑数据中心架构设计

0
分享至


智能体AI的快速普及正迫使芯片和系统架构师从头开始重新思考数据中心的设计方式。过去以GPU吞吐量为核心的优化思路已不再适用,如今的系统需要CPU承担长时间推理循环的编排任务,同时管理上下文、内存和数据移动,而GPU及加速器则专注于最繁重的数值计算。这一转变仅是整体架构拼图的一部分。

CPU角色的根本性转变

Arm云AI业务部门全球云与AI基础设施芯片负责人Satadal Bhattacharjee表示:"智能体AI的兴起正在重塑对CPU的需求。随着AI系统日趋复杂,CPU正逐步成为持续运行的智能循环中的编排与执行引擎,负责管理上下文、工具调用、内存移动、安全边界以及加速器的利用率。"

Arm预测,智能体AI将要求数据中心在相同功耗范围内提供高达四倍的CPU核心密度,但这并不意味着加速器的重要性有所下降。Bhattacharjee强调:"这凸显了一个关键现实:加速器性能越来越依赖于整个系统的效率、响应速度和平衡性。"

与此同时,智能体工作负载带来了更难以预测的控制流、不规则的内存访问模式、同步需求以及更高的I/O强度。Bhattacharjee指出:"要避免系统级停顿,就需要更紧密的CPU-加速器耦合、更高效的数据移动、更高带宽的内存访问,以及能够支持一致性、隔离性和扩展性的系统互联架构。PCIe、CXL、芯片间相干互联以及先进的互联IP等技术,为系统设计师提供了在灵活性、带宽、延迟和效率之间灵活权衡的新途径。"

从数据加载到数据编排

西门子EDA产品负责人Sathishkumar Balasubramanian对这一变化有着更为直观的描述:"过去谈到AI,GPU主要用于矩阵运算和数值计算,但这一切正在改变。随着智能体工作流的兴起,CPU的角色从数据加载器转变为数据编排器。整个编排层由CPU负责处理。Intel的需求之所以在上升,正是因为人们意识到需要CPU来完成大量智能体工作流任务,而只在必要时才调用GPU。数据编排将成为新的核心能力,我们正在从数据卸载转向数据编排,这就是新型计算集群的本质。"

他进一步指出,以往GPU和CPU分处不同机架,但这种布局带来了严重的内存访问延迟问题。"因此,现在处理器开发商正在尝试将GPU和CPU放置在同一机架中,就像服务器厂商过去所做的那样。"

这一趋势在近期多项重大产品发布中清晰可见,包括英特尔代号为"Panther Lake"的Core Ultra Series 3移动处理器、搭载Arm CPU的英伟达RTX Spark PC芯片、苹果的Fusion架构、AMD的APU,以及英伟达的Vera Rubin平台等。

从历史角度来看,英特尔早在2010年1月便推出了集成CPU与GPU的SoC,但如今两者的交互方式已发生根本性变化。早期SoC将集成GPU视为辅助组件,而今天面向智能体AI的SoC则专为持续、异步、多步骤执行循环而设计,衍生出过去SoC设计中不曾存在的全新架构创新。

Balasubramanian说:"它们被集成在同一个芯片上,共享内存协议和带宽,因此可以访问统一内存。延迟大幅降低,CPU和GPU两端的工作量都显著增加。整个架构正在发生根本性变革。即使是PC也将朝这个方向发展,配备更强大的GPU和CPU,因为你需要在本地全天候运行自己的智能体,这对本地计算和数据中心都提出了很高的要求。"

边缘计算的新机遇

Quadric首席营销官Steve Roddy则从更宏观的视角审视这一变化:"智能体AI真正的冲击,将体现在云端与边缘计算的整体格局变化上,AI服务公司将首当其冲。以当前Token需求的增长速度,即便超大规模云厂商每年投入1万亿美元资本支出,数据中心的计算供给也难以跟上需求。这促使业界越来越关注将更多生成式AI算力下沉到新一代AI边缘设备。"

Roddy认为,市场需要一种售价低于1000美元、功耗与普通家电或台式电脑相当的专用智能体Token服务器。"不久的将来,我们将看到PetaOp级推理能力出现在适合家用和办公的被动风冷设备中。如果能有1亿台这样的智能体Token引擎分布在千家万户,其集体算力将超过Zetta-Op级推理计算,而无需大规模数据中心建设或新建发电站。"

他强调,实现这一新型计算范式的关键在于两点:一是AI模型向去中心化计算模型的适配,使对话型AI和开发者的智能体工作流都能将计算分配在大规模集中参数模型与本地1000亿以上参数模型之间;二是专为边缘设计的、高能效、完全可编程的推理处理能力,而非将GPU改作他用。

延迟压力与互联架构

Synopsys PCIe与CXL产品管理总监Antonio Costa指出,过去几年间,数据中心设计几乎完全以GPU为中心,用于大语言模型训练和云端推理。在那个阶段,CPU负责将数据送入GPU,PCIe作为传输通道,带宽是最重要的指标,延迟并不关键。

"但智能体AI的引入改变了一切。CPU不再仅仅是数据馈送者,而是整个系统的编排者。CPU需要与文件、网络、磁盘进行大量交互,而GPU则扮演'大脑'的角色,根据CPU提供的指令决定下一步行动,CPU则负责执行这些行动。"

他以创建PPT为例进行说明:需要打开应用程序,调用大语言模型获取内容,再将数据写入文档——这是一个高度以CPU为中心的操作流程。

Costa表示,延迟在智能体AI场景中变得至关重要。"如果响应太慢,你的智能体就会显得迟钝。PCIe在延迟方面具有良好的适配性,而且所需的连接数量正在急剧增加。我们看到有客户设计的芯片需要多达100条PCIe通道,相比AI训练时的16条通道,需求量至少增加了5倍。"

智能体AI SoC的验证挑战

验证层面的挑战同样不容忽视。Balasubramanian指出:"单个智能体AI芯片中存在两种不同的计算范式,需要验证它们能够协同工作、不产生冲突。内存架构如何规划,数据如何读取,指令如何排队,都需要进行深入验证。"

他进一步分析称,验证工作涉及三个层面:

第一,功能验证。每当硬件架构发生重大变化,就需要同步开发软件和硬件。"这意味着需要模拟和FPGA原型验证。"

第二,性能验证。"需要确保内存到处理器再到GPU的整个链路能够满足高需求场景的要求。"

第三,3D-IC物理效应的处理。"未来的芯片都将采用3D-IC堆叠方式。高速切换总线会带来怎样的热图分布?堆叠在上方的HBM会不会因过热而损坏晶圆?这些都是必须解决的问题。"

此外,随着业界对安全风险的认知不断深化,硬件安全设计的需求也在迅速升温。"对于智能体来说,如何在硬件层面实现受保护的访问控制是一大挑战。内置的安全监控器和可靠性监控器变得不可或缺,确保智能体不会执行不受信任的代码。复杂架构使得安全与硬件监控的难度大幅提升。"

结语

Arm的Bhattacharjee总结道:"AI基础设施正从以加速器为中心的服务器,向异构机架级系统演进,其中针对智能体工作流各个阶段优化的专用系统将各司其职、协同运作。"

智能体AI正在将数据中心转变为高度集成、持续编排的系统,CPU驱动的工作流、CPU-GPU混合架构以及硬件级安全,都需要作为一个整体进行工程设计和验证。对于芯片架构师而言,真正的竞争力将取决于他们能否将计算、内存、封装和验证流程协同设计,在快速演进的智能体工作负载面前,既不牺牲可靠性,也不失去对系统的掌控力。

Q&A

Q1:智能体AI为什么会让CPU重新变得重要?

A:在传统AI架构中,CPU主要负责将数据送入GPU,角色相对被动。但智能体AI需要复杂的编排、工具调用和推理循环,CPU必须持续与文件系统、网络、存储设备交互,并协调GPU的工作。Arm预测,智能体AI将要求数据中心在相同功耗范围内提供高达四倍的CPU核心密度。因此,CPU正从"数据加载器"转变为整个系统的"编排引擎",在智能体AI架构中重新占据核心地位。

Q2:智能体AI对PCIe互联提出了哪些新要求?

A:过去AI训练场景下,PCIe主要关注带宽,延迟并非关键指标。但在智能体AI中,CPU需要频繁与GPU、网卡、SSD等设备交互,响应速度直接影响智能体的执行效率,因此延迟变得至关重要。此外,所需的PCIe连接数量也大幅增加——部分客户的芯片设计已需要多达100条PCIe通道,相比AI训练时的16条,需求至少增加了5倍。

Q3:验证智能体AI芯片面临哪些主要挑战?

A:智能体AI芯片将CPU和GPU集成在同一芯片中,验证难度显著提升,主要体现在三个方面:一是功能验证,需通过模拟和FPGA原型确保CPU与GPU协同工作无冲突;二是性能验证,需确保内存、处理器和GPU之间的数据链路满足高并发需求;三是3D-IC物理效应,需评估堆叠芯片在高负载下的热分布是否会导致硬件损坏。此外,硬件层面的安全监控也成为不可忽视的新挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
海军潜艇全核化,解放军效仿美军,常规潜艇淘汰,4大型号支撑?

海军潜艇全核化,解放军效仿美军,常规潜艇淘汰,4大型号支撑?

地球记
2026-07-05 02:44:11
潜艇也有第五代了!萨博这款产品有点意思,艇艏开了一个“大洞”

潜艇也有第五代了!萨博这款产品有点意思,艇艏开了一个“大洞”

战刃
2026-07-04 20:06:12
39岁女子扮男子炸伤受乌克兰制裁富豪,国际刑警组织发出红色通缉

39岁女子扮男子炸伤受乌克兰制裁富豪,国际刑警组织发出红色通缉

红星新闻
2026-07-04 15:53:16
莫斯科遭大规模袭击

莫斯科遭大规模袭击

第一财经资讯
2026-07-04 20:32:13
85亿收购十年后关停,微软怎样搞砸昔日通讯王牌

85亿收购十年后关停,微软怎样搞砸昔日通讯王牌

全栈遛狗员
2026-07-02 01:01:40
3年开了150家店!丑了整整37年的土大牌,正在血洗中国男人的钱包

3年开了150家店!丑了整整37年的土大牌,正在血洗中国男人的钱包

介知
2026-07-04 12:17:01
半年巨亏1500亿,老牌巨头轰然倒下,比亚迪顺势登顶全球第四

半年巨亏1500亿,老牌巨头轰然倒下,比亚迪顺势登顶全球第四

青眼财经
2026-06-02 18:54:49
油价跌4次大降超2元/升,今年大涨的油价已大跌,7月17日或再下跌

油价跌4次大降超2元/升,今年大涨的油价已大跌,7月17日或再下跌

油价早知道
2026-07-05 03:41:30
世界杯:巴西vs挪威,安切洛蒂表示“我们的队伍还需要不断提升”

世界杯:巴西vs挪威,安切洛蒂表示“我们的队伍还需要不断提升”

天下说球A
2026-07-05 10:16:46
如何最快了解一个县城的财政状况?

如何最快了解一个县城的财政状况?

画生笔记
2026-06-23 08:46:53
新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

新型出轨太会了:不发消息不打电话,只靠这两种方式联系,真藏得太深了

心理观察局
2026-06-26 07:37:08
是怎么发现家里那位又“恋爱”了?网友:有一天串台了,叫我丫头

是怎么发现家里那位又“恋爱”了?网友:有一天串台了,叫我丫头

另子维爱读史
2026-07-03 20:19:49
心理学有个残忍发现:暖昧中突然撤退的人,不是遇到更好的,也不是突然不爱了,而是察觉到你身上这两种成瘾性缺失_

心理学有个残忍发现:暖昧中突然撤退的人,不是遇到更好的,也不是突然不爱了,而是察觉到你身上这两种成瘾性缺失_

心理观察局
2026-07-05 06:49:04
四川舰最新进展:阻拦索已安装、电磁弹射已就位

四川舰最新进展:阻拦索已安装、电磁弹射已就位

看看新闻Knews
2026-07-05 14:52:03
堂妹高考685分嘲笑我考了596分,我上大学,她的结果让人出乎意料

堂妹高考685分嘲笑我考了596分,我上大学,她的结果让人出乎意料

程哥讲堂
2025-06-18 15:46:06
罗晋离婚传闻终结,近况曝光,难堪处境似辛柏青

罗晋离婚传闻终结,近况曝光,难堪处境似辛柏青

书慧我心
2026-07-04 10:26:59
新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

律法刑道
2026-04-01 10:15:47
证据已经有了:山海经显示,三星堆文明,极有可能是夏朝遗民

证据已经有了:山海经显示,三星堆文明,极有可能是夏朝遗民

抽象派大师
2026-07-05 04:41:50
游客称在河南新乡万仙山景区遇霸道民宿,不住店尾随3小时;民宿老板:我们报备了游客的车才能进,跟车是护送游客到景区口重新进

游客称在河南新乡万仙山景区遇霸道民宿,不住店尾随3小时;民宿老板:我们报备了游客的车才能进,跟车是护送游客到景区口重新进

大风新闻
2026-07-02 15:36:30
榜眼首秀28分8失误!探花首秀15分4板4助!状元迪班萨没有退路

榜眼首秀28分8失误!探花首秀15分4板4助!状元迪班萨没有退路

世界体育圈
2026-07-05 11:40:35
2026-07-05 15:36:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19861文章数 49715关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

特朗普:我很惊讶 悼念哈梅内伊的伊朗民众"全是假哭"

头条要闻

特朗普:我很惊讶 悼念哈梅内伊的伊朗民众"全是假哭"

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

王力宏成都舞台受伤 仍然坚持三小时

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

健康
亲子
本地
公开课
军事航空

听说少吃点能抗衰老?专家讲解!

亲子要闻

在@我是机灵姐家里,我看到有爱的家庭养出了孩子最好的模样。

本地新闻

国内足球之旅?这座小城给你高分答案

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京与特朗普通话85分钟 细节公布

无障碍浏览 进入关怀版