![]()
亚马逊云科技(AWS)近日正式宣布其搭载Graviton5处理器的Amazon EC2 C9g与C9gd实例全面上线,将最新一代Arm架构处理器引入计算优化型实例,面向AI推理、高性能计算、分布式分析及其他CPU密集型工作负载。
AWS表示,C9g实例相较上一代C8g系列,每个vCPU的性能提升幅度高达25%,同时支持DDR5-8800内存、五倍L3缓存容量、PCIe Gen 6连接以及高达三倍的数据包处理性能。此外,AWS还通过最新一代Nitro平台推出了多项平台级更新,其中包括Nitro隔离引擎——这是一项基于Rust语言开发的安全能力,内置于Nitro Hypervisor中,用于管控对内存、CPU寄存器状态及I/O设备的访问,从而强化虚拟机隔离能力。
对云基础设施运营者的意义
此次发布不仅仅是一次常规的处理器升级迭代。
尽管GPU仍是模型训练和大规模推理的核心引擎,但整个AI技术栈正加速向能够规划任务、调用工具、执行多步骤工作流的智能体系统演进。这一趋势对CPU在编排调度、内存管理、任务调度与并发处理等方面提出了更高要求,运营商需要在算力、内存、网络与存储之间做好平衡,确保昂贵的加速器始终保持高效运转。AWS此次推出C9g/C9gd,正是为了承担这一角色。
CPU设计向AI演进
行业分析师指出,AWS的举措折射出一种更宏观的架构趋势。
Moor Insights & Strategy数据中心技术副总裁兼首席分析师Matt Kimball在接受Data Center Knowledge采访时表示:"AI赋能已经成为未来每一款CPU的设计基准。尽管GPU占据了大量关注,但CPU的需求将继续以极快的速度增长。"
他指出,Graviton5的设计目标是同时服务于成熟的企业级工作负载与新兴AI应用。更大的缓存容量、更快的内存速度以及更高带宽的I/O接口,不仅有益于数据库、分析和HPC场景,该处理器架构同样适合推理、任务分解、并发处理等CPU密集型AI任务。
此次发布延续了AWS更大范围内推进Graviton在云平台中战略价值的布局。今年早些时候,AWS曾推出搭载Graviton的Amazon Redshift RG实例,旨在提升AI时代数据分析场景的性能与经济性。C9g系列的推出,进一步将这一战略深入到基础设施层,专门针对AI推理周边那些对编排调度和内存消耗要求较高的路径进行CPU优化。
HyperFrame Research半导体与深科技分析师Stephen Sopko表示,这一转变反映的是AI工作负载本身性质的演变,而非加速器地位的下降。
"模型推理或许运行在加速器上,但编排调度、工具调用和多步骤推理本质上仍是CPU密集型的,"Sopko说,"CPU并不是要取代加速器,而是在智能体规划任务、调用工具、维护状态的同时,保证加速器始终有活可干。"
Sopko预计,随着企业部署规模更大的智能体AI系统,这种协同关系将愈发关键。"智能体AI让CPU从配角重新回到联合主角的位置,"他说,"C9g就是亚马逊为这一转变搭建的控制面基础设施。"
竞争格局超越x86范畴
在围绕AI重新设计服务器处理器这条路上,AWS并不孤单。
英伟达的Grace CPU与其AI平台深度集成,Arm在Neoverse路线图中全面强调AI能力,高通也推出了面向编排调度、通用计算及AI头节点功能的服务器CPU产品线。
Kimball认为,Graviton5目前最直接的竞争对手仍是AMD EPYC和英特尔至强系列,而非AI加速器。即便如此,他预计随着市场对优化数据移动、内存管理及GPU协同编排的处理器需求持续增长,各大主要CPU产品线将持续围绕AI工作负载演进。
产品规格与上线区域
C9g/C9gd支持PCIe Gen 6及最新一代Nitro平台,提供从中等规格到48xlarge共11种实例尺寸,并包含裸金属选项。据AWS介绍,最大规格实例可提供高达100 Gbps的网络带宽和最高72 Gbps的Amazon EBS带宽。C9gd实例还配备本地NVMe SSD存储,适用于需要高速缓存或临时存储空间的工作负载。
目前,上述实例已在AWS美国东部(北弗吉尼亚和俄亥俄)、美国西部(俄勒冈)及欧洲(法兰克福)区域上线,更多区域将陆续开放。
Q&A
Q1:AWS Graviton5相比上一代Graviton4有哪些性能提升?
A:Graviton5驱动的C9g实例相较上一代C8g系列,每vCPU性能提升最高达25%,支持DDR5-8800内存,L3缓存容量增至五倍,采用PCIe Gen 6连接,数据包处理性能最高提升三倍。同时引入基于Rust开发的Nitro隔离引擎,进一步强化虚拟机隔离安全性。
Q2:CPU在AI工作负载中扮演什么角色,和GPU如何分工?
A:GPU主要负责模型训练和大规模推理计算,而CPU则承担AI系统中的编排调度、内存管理、工具调用和多步骤任务推理等工作。在智能体AI系统中,CPU负责"控制面",确保GPU等加速器始终高效运转,两者是协同关系而非替代关系。
Q3:EC2 C9g实例目前在哪些地区可以使用?
A:EC2 C9g与C9gd实例目前已在AWS美国东部(北弗吉尼亚和俄亥俄)、美国西部(俄勒冈)以及欧洲(法兰克福)区域正式上线,AWS计划后续在更多区域陆续开放访问。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.