过去在大规模训练集群中,CPU与GPU的比例通常是1:8,推理任务基本都往加速器上堆。但英特尔最新判断认为,进入智能体时代后,这个比例可能快速走向1:4、1:2甚至1:1。也就是说,数据中心里CPU的数量要翻着跟头往上涨。这背后的推手,正是英特尔刚刚发布的至强6+处理器——一颗最高288核、采用Intel 18A工艺的x86芯片,目标直指智能体AI的调度和编排。
6月1日,英特尔一口气公布了数据中心产品线的多项更新:全新的至强6+处理器、以太网E835控制器及网络适配器,还预告了下一代数据中心GPU Crescent Island的路线图。这组发布想讲的故事很明确——多智能体时代,瓶颈不再是单点算力,而是系统级的协同。CPU、网络、GPU、内存、I/O和软件栈怎么配合,将决定智能体AI能不能规模化落地。
![]()
1. 288核能效核、18A工艺,规格直接拉满
至强6+是至强6家族的新成员,也是第一款用上Intel 18A制程的数据中心CPU。它瞄准云原生、5G核心网、智能体AI和网络密集型负载,走的是高密度、高能效路线。芯片最多塞进288个能效核,支持最高8000 MT/s的DDR5内存,末级缓存(LLC)高达576MB,比上一代直接提升了超过5倍。同时它还提供12通道DDR5、96条PCIe Gen 5通道和CXL能力,目的就是拉高内存带宽,让异构基础设施里的数据流动不再卡脖子。
制程上,Intel 18A带来了PowerVia和RibbonFET两项关键技术。PowerVia用更短、更直接的供电路径把功耗往下压,RibbonFET则帮助降低待机功耗并提升性能一致性。英特尔还特意在至强6+里加入“应用能效遥测”(Intel AET)功能,让数据中心运营人员可以实时看到每个工作负载的CPU核心功耗与运行状态,从而做更精准的资源调度、成本分摊和能效优化。对于电信、云和企业数据中心来说,这种细粒度的能耗可见性,正在成为降低TCO的硬需求。
2. 智能体改变游戏规则,CPU重新夺回控制平面
智能体不是简单的一次模型调用。它往往要执行多步骤任务、多智能体协作、子智能体派生、工具调用、沙箱启动与销毁、上下文管理、跨系统数据访问,甚至长时间持续执行。GPU在推理和生成环节依然忙碌,但更复杂的编排、调度、执行和系统管理,全都压到了CPU身上。英特尔公司执行副总裁兼数据中心事业部总经理Kevork Kechichian说得直接:AI的扩展不是简单堆GPU、CPU和网络器件,而是靠系统协同。随着AI迈向智能体时代,编排、并发和数据流动成了新限制,CPU作为现代AI基础设施控制平面的核心地位反而变强了。
英特尔数据中心芯片工程团队负责人Tim Wilson进一步给出了一组配比变化的预测。过去训练集群里CPU与GPU的比例可能是1:8,但在智能体工作流中CPU任务变多,比例会逐渐向1:4、1:2甚至1:1靠拢。在某些强化学习或特别复杂的智能体场景里,CPU的需求还可能继续上探。这意味着,数据中心的采购清单上,CPU的订货量要重新算账了。
英特尔强调,这正是至强处理器的机会。企业的大量业务负载、软件栈和基础设施早就搭建在x86和至强平台上。智能体要在企业落地,通常不是推倒重来,而是在现有系统、数据库、应用服务、网络和云原生环境里自然扩展。因此,作为系统控制平面的CPU仍要扮演关键角色。英特尔预计,到2030年,基础工作负载与AI工作负载的增长大致各占一半,现有数据中心架构仍将承载接近一半的工作负载。也就是说,AI时代的数据中心不会只由加速器话事,x86架构仍会在传统业务、推理和智能体AI工作负载里守住重要阵地。
3. 9:1服务器整合,把电力和机架空间省给AI集群
至强6+打出的另一张牌是数据中心整合。英特尔宣称,相比第二代至强处理器,至强6+最高可实现9:1的服务器整合比例,即原本9台服务器干的活,现在1台就能扛下来。英特尔数据中心集团技术产品总监杨锦文进一步披露,这还能带来约80%的空间节省和约73%的能源节省。
对于那些数据中心里已经趴着大量传统工作负载的企业,这笔账相当划算。把传统业务消耗的机架空间、电力和散热压缩下去,就能为AI集群腾出宝贵的资源。换句话说,至强6+不仅是在提升老负载的运行效率,更可能间接帮企业“变出”部署新AI设备的容量,而不必急着扩建数据中心或增加电费预算。
至于至强6+的定位,英特尔至强产品总监Kira Boyko点出,现代5G核心网和云原生工作负载正在倒逼基础设施升级,行业的需求集中在三点:在更少机架空间里处理更多任务、提升每瓦性能以降低总拥有成本,以及为关键业务部署提供更高可靠性。至强6+正是冲着这三样来的。
4. 爱立信实测:同核心数性能涨30%,机架功耗降38%
至强6+已经进入电信网络基础设施的实测。英特尔透露,爱立信在运营商部署中测试了至强6+用于分组核心网。和上一代E-core相比,在相同核心数量下,性能提升约30%,每瓦性能提升超过60%,运行时机架功耗降低38%。5G流量尤其是上行流量还在持续增长,这类能效提升对运营商控制成本和功耗意义重大。目前,华硕、戴尔科技、爱立信、技嘉、慧与、联想、超微等厂商都已经开始提供或采用基于至强6+的服务器、网络和集成方案。
5. 288核能扛多少智能体?并发密度与内存瓶颈的平衡术
面对智能体场景,英特尔SoC架构专家曾义对InfoQ进一步拆解了至强6+的适配逻辑。他指出,在Agent任务中经常会出现多个Agent和多个Sub Agent同时调用的情况,系统可能在短时间内频繁启动和销毁大量Agent或沙箱。这就要求CPU不但并发密度要高,短期响应能力也得跟上。至强6+单颗SoC最高288核心,正好能以比较好的TCO撑住这类高密度需求。
按照常见云服务的配置习惯——2个核心配4GB内存,或者1个核心配2GB内存——杨锦文表示,在至强6+ 288核心的平台上,常规操作就能轻松部署400到500个以上的Agent,具体上限还得看客户配置、任务类型和服务等级协议。但Agent并发不只是考验核心数量,内存带宽和容量同样闯关。曾义补充,当Agent数量摊开后,每个Agent都需要对应的内存带宽和容量。光有带宽而容量不够,或者容量足够但带宽跟不上,都会形成瓶颈。英特尔的策略是通过DDR技术、更多的内存通道和更高的内存速率,
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.