网易首页 > 网易号 > 正文 申请入驻

起猛了!Arm推出首个自研CPU,黄仁勋贴大脸发言

0
分享至


智东西
作者 ZeR0
编辑 漠影

属实没想到,卡着全世界移动芯片脖子的Arm,突然发布了自研CPU!

智东西3月24日旧金山现场报道,刚刚,3500亿颗芯片背后的半导体IP巨头Arm,推出首款由Arm自主设计的数据中心CPU——Arm AGI CPU


▲Arm CEO Rene Haas展示AGI CPU芯片

这是Arm发展35年来,首次推出对外销售的自研芯片,也是Arm全新数据中心芯片产品线的首款产品,标志着Arm正式进军数据中心芯片领域,将其高能效架构规模化引入AI基础设施。

Arm AGI CPU专为AI智能体基础设施打造,采用台积电3nm制程工艺、双Chiplet设计,单颗CPU集成136个Arm Neoverse V3高性能核心,配备2MB L2缓存,支持3.7GHz主频,提供每核心6GB/s内存带宽,内存时延低于100ns,采用96通道PCIe Gen 6接口,支持CXL 3协议,TDP达300W


Arm将其称作“全球最高能效的智能体CPU”,围绕性能、规模、能效三个原则来设计。


英伟达创始人兼CEO黄仁勋的巨脸出现在大屏幕上,祝贺Arm发布第一款数据中心芯片。


Arm AGI CPU的单核、系统级芯片、刀片式服务器及机架各层级均实现行业领先的性能表现。

通过更多可用线程与更高单线程处理能力相互叠加,该芯片可实现单机架性能达到x86平台的2倍以上,每1GW的AI数据中心算力资本支出节省高达100亿美元


它支持高密度1U服务器机箱的风冷部署方案,单机架可支持多达8160个计算核心;也支持液冷系统,单机架可实现超过45000个核心的部署规模。


Arm CEO Rene Haas分享说,按其估算,自人类诞生以来,大约共有1170亿人生活在这个星球上。而Arm芯片累计出货量已超过3500亿颗,足足是有史以来人类总数的3倍,是所有非Arm架构CPU累计出货量总和的7倍,平均每个全球家庭拥有160颗Arm芯片。

现在,Arm的核心业务包括三大块:IP授权、CSS(计算子系统)方案,以及自主设计的芯片产品


Arm AGI CPU现已开放订购,已交到客户手中,正在由客户评估,计划在年底前实现量产


Arm与永擎电子、联想、广达电脑、Supermicro等头部OEM厂商及ODM厂商展开合作,早期系统现已推出,永擎电子、联想及Supermicro已开放商用系统订购,更广泛的商用部署预计将于今年下半年落地


▲联想HR650A V3 2U机架服务器,配备两颗Arm AGI CPU

Arm还披露了后续产品规划,AGI CPU与Arm Neoverse CSS产品路线图将并行推进,计划2027年发布Arm AGI CPU 2和CSS V4,未来发布Arm AGI CPU 3和CSS V5,确保所有Arm数据中心客户在平台架构与软件兼容性方面实现协同发展。


在会后媒体问答环节,Rene Haas谈道,研发AGI CPU只是Arm商业模式的自然延伸,市场需求严重未被满足,中国可能是非常好的市场。

另据Arm云AI事业部执行副总裁Mohamed Awad分享,Arm也在认真研究NVLink等互连技术,已宣布将在未来版本的CSS中支持NVLink。

一、采用简化架构,没有多线程,摆脱x86 CPU的额外开销与复杂性

Rene Haas谈道,智能体的爆炸式增长催生更大的CPU需求。智能体本质上是一个工作流,大量工作涉及调度,这正是CPU所擅长的工作,是加速器做不了的。

打个比方,加速器负责生成token,就像推一辆翻斗车,需要有人去搬运那些土,CPU就是搬运土的设备。


根据Arm的估算,数据中心对每GW功耗提供的CPU算力需求将增长至当前的4倍以上,在相同功耗范围内,以前需要3000万CPU核心,现在需要塞入约4倍的1.2亿个CPU核心。

功耗是宝贵的,所需资本也是宝贵的。试图将如此多的额外CPU塞进一个已经被加速器和执行核心工作的CPU塞得满满当当的数据中心,是一道难题。


对此,Arm打造了其首款对外销售的自研芯片——Arm AGI CPU

为什么要做这件事?Rene Haas谈道,随着智能体AI走向主流,所有支撑其运转的工作都依赖CPU,这颗CPU必须天生就具备在电池供电下运行的基因。

x86架构背负着执行开销和对遗留功能的支持负担,选择了聚焦于模块化、支持大量不同市场和小众用例。而Arm专注于提升能效、降低延迟。


Arm AGI CPU从零开始设计,围绕三个原则:性能、规模、能效


(1)性能

高IPC(每周期指令数)一直是Arm的强项。传统CPU有时会试图通过提高主频、进入Boost模式来在这一维度上竞争,但提高主频,功耗也随之上升,这些Boost模式无法长期持续,也无法在整颗芯片上持续。而AGI CPU能提供全时间、可持续的满血性能。

(2)规模

Arm在核心数量上实现线性扩展,内存和IO子系统经过专门设计,与核心高度匹配。

一些传统架构采用多线程。多线程的实质是向同一个核心丢两个任务,但IO和带宽并不会因此翻倍,只是把瓶颈转移到了别处,而且CPU还必须承担管理这种来回切换的负担,导致性能下降,最终导致进程饥饿。

Arm反复观察到,数据中心运营商不得不超额配置数据中心30%甚至更多,来应对这种非线性扩展的问题。

Arm以无需这样做为傲。


▲AGI CPU与x86 CPU运行同一任务的表现对比

(3)能效

Arm对能效有着近乎偏执的专注。AGI CPU是专为目标场景打造的,没有任何遗留架构的包袱,不浪费任何一个周期,不存在搁浅的算力,不浪费任何一瓦的功耗。

在实测中,AGI CPU可提供持续性能,没有因超出功耗预算而导致的性能降频,没有内存或IO争用。


上图中,左边的AGI CPU和中间的x86 CPU柱形均在SMT(同步多线程)禁用的情况下测得,仅对比了单线程核心表现。

一个常见说法是,多线程能改善性能,带来更好的可扩展性。但如果开启多线程,结果如图中第三个柱形所示,性能下降、现实中每机架大量线程闲置、能效略有提升但不足以改变整体的算法取舍。

Arm云AI事业部执行副总裁Mohamed Awad解释说,如果对内存带宽的需求很低,SMT是合理的,因为可以共享带宽,当一个线程在等待时,可将CPU资源让给另一个线程。

但在智能体AI场景中,有大量线程需要同时支撑,有昂贵的加速器和昂贵的基础设施在等待,最不希望发生的事情就是分割I/O带宽或内存带宽,而是希望将那些I/O和内存带宽精确地专用给对应的进程。

“我们认为,这个最优值约为每秒4~6GB的带宽分配给每个核心,这正是我们的设计目标。在这类场景下,不实现SMT是更合适的选择,因此我们目前没有采用SMT的计划。”他谈道。

二、详解AGI CPU规格:3nm、136核、3.7GHz主频

从运行频率到内存及I/O架构,Arm AGI CPU每一处设计都经过专门优化,在高密度机架部署场景下,支持大规模并行、高性能的智能体AI工作负载。

AGI CPU采用台积电3nm制程工艺,基于标准Arm Neoverse V3计算子系统,单颗CPU集成136个Arm Neoverse V3高性能核心,配备2MB L2缓存,支持高达3.7GHz的主频。


该芯片提供每核心6GB/s内存带宽。领先的内存带宽使每个机架能支持更多高效执行的线程。相比之下,x86 CPU在持续高负载下会因核心争抢资源而导致性能下降。


Arm将整个系统设计为低延迟架构,使内存访问延迟低于100纳秒

为此,AGI CPU采用了双Chiplet设计,每个Chiplet将所有内存和IO直接集成其上,无需担忧复杂的NUMA域和跨硅片的多次跳转。

在互联方面,Arm AGI CPU采用96通道PCIe Gen 6接口,支持CXL 3协议,可连接任意加速器,同时支持内存扩展等功能。


其TDP(热设计功耗)为300W,每线程独立核心,可在持续负载下提供确定性性能,避免降频与线程闲置。

三、支持风冷和液冷,单机架性能达x86系统的2倍以上

为加速产品采用,Arm推出Arm AGI CPU1OU双节点参考服务器。该服务器采用符合OCP(开放计算项目,Open Compute Project)的DC-MHS标准规格设计。


Arm的参考服务器采用1OU双节点设计,每台刀片服务器中集成2颗CPU芯片,并配备独立内存与I/O,共计272个核心


AGI CPU支持高密度1U服务器机箱的风冷部署方案。下图是一个标准OCP风冷机架。这些刀片服务器可在标准风冷36kW机架中满配部署,30台双节点1OU刀片服务器可提供总计8160个核心


在该配置下,Arm AGI CPU可实现单机架性能达到最新x86系统的2倍以上。


此外,Arm与Supermicro合作推出200kW液冷设计方案,可容纳336颗Arm AGI CPU,提供超过45000个核心

Arm计划向OCP社区贡献该参考服务器设计方案及配套固件,并进一步提供包括系统架构规范、调试框架及适用于所有Arm架构系统的诊断与验证工具等资源。

这些贡献将惠及整个生态系统,对所有基于Arm的平台均有裨益。

更多细节将在即将举办的OCP EMEA峰会上公布。

四、与Meta联合开发,还有多家首发合作伙伴

Meta、OpenAI高管均来到Arm Everywhere大会现场并登台分享。

Meta作为Arm AGI CPU的早期合作伙伴与客户,参与该CPU的联合开发,旨在为Meta全系应用优化GW级规模基础设施,并与Meta自研MTIA推理加速器协同运行,从而在大规模AI系统中实现更高效的编排与调度。


“这场联姻,我个人认为是双赢的,非常令人振奋,看到从单纯的IP授权提供商,走向真正参与构建生产级、生产就绪产品的行列,”Meta基础设施负责人Santosh Janardhan谈道,“我认为最甜蜜的事情需要一些时间,而我们现在就要到了。”

他说Meta和Arm谈合作,核心理由是想在每瓦内放入更多的核心,但不想在性能上有任何妥协。

现在每天有约35亿人使用Meta的产品。每一次交互、每一篇帖子、每一个信息流、每一通电话,都建立在Meta后端构建的基础设施之上,即定制数据中心、定制硬件和定制芯片。

大约两年半前,Meta先做了市场调研,看看是否有哪款CPU能满足规格要求,结果要么满足了性能、功耗不满足,要么满足了功耗、性能不达标。

而Arm提供的可扩展性,让Meta能够注入更多算力,做到了优化每瓦性能、每千兆瓦性能、优化Meta全平台性能。

双方承诺将围绕Arm AGI CPU的多代芯片产品展开长期深度合作

其他首发合作伙伴包括Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、SAP及SK电讯

这些客户将在智能体CPU核心应用场景中部署Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级API、任务与应用托管等领域。

在大会展区,SK电信旗下Rebellions展示了使用Arm AGI CPU作为头节点,在同一台服务器中有一批加速器的实例。


Arm展示了强大的“朋友圈”。超大规模计算服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的50余家行业龙头企业,均对Arm计算平台向芯片领域拓展表示支持。


英伟达、谷歌、微软、亚马逊云科技、博通、Marvell、美光、微软、三星、SK海力士、台积电等企业的高管一通猛夸,认为Arm AGI CPU是整个生态系统发展的重要里程碑,将带来新一代定制化计算能力,进一步释放Arm生态系统的潜力,让更多客户能够便捷地获取Arm的计算能力,为所有基于Arm构建智能未来的合作伙伴创造新的重大机遇。

“我们很自豪能与Arm共同构建这个开放、可扩展、高能效的AI未来。加速计算并没有让CPU变得无关紧要,它让CPU成为不可或缺的合作伙伴。Arm架构已经成为我们所有平台的基础。”黄仁勋说,“Arm的适应性和可定制性,真正使我们能够将Arm整合至所有平台之中。”

结语:云端AI业务有望成Arm最大支柱,未来剑指1万亿美元市场

“全球没有任何一家公司的生态系统,能像我们这样从边缘端到云端贯通服务。”Rene Haas说。

他预测,云端AI业务可能在几年内成为Arm最大的业务。

如今数以万计的公司在云端运行其软件于Arm之上,依托已向全球数据中心交付的超过12.5亿个Arm Neoverse核心。这一增长仍在加速。


三十多年来,产业界基于Arm计算平台持续创新,在数千亿台设备上实现了可扩展、高能效的计算能力。整个生态系统正寻求大规模部署Arm技术的方案。


“今天标志着Arm计算平台迈入全新发展阶段,也成为公司发展的重要里程碑。”Rene Haas谈道,AI从根本上重塑了计算的构建与部署,智能体计算正加速这一变革,随着Arm AGI CPU芯片推出,Arm将助力智能体AI基础设施实现全球规模化部署。

在审视智能体AI发展、CPU需求增长、高能效CPU为数据中心带来的价值后,Arm预判这在未来将代表约1000亿美元的TAM。


“将我们在所有市场上积累的成果,从边缘到云端,从毫瓦到千兆瓦,我们有机会在一个1万亿美元量级的市场中大展身手。”Rene Haas说。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
白酒一哥也扛不住了……

白酒一哥也扛不住了……

Mask的小酒馆
2026-05-25 07:35:57
“男性相亲避雷表”横空出世!网友:百发百中,基本没有猜错的

“男性相亲避雷表”横空出世!网友:百发百中,基本没有猜错的

火山詩话
2026-05-25 06:33:21
简直非人类!文班亚马爆砍33+8+5+3!惨败21分,亚历山大再度拉胯

简直非人类!文班亚马爆砍33+8+5+3!惨败21分,亚历山大再度拉胯

Tracy的篮球博物馆
2026-05-25 10:59:54
最应被铭记的中国矿难事故:死亡数全球第一,震惊国内外

最应被铭记的中国矿难事故:死亡数全球第一,震惊国内外

网易新闻出品
2026-05-25 13:17:51
他是黎家盈丈夫,放弃事业迁居北京照顾3孩子,难怪妻子能上太空

他是黎家盈丈夫,放弃事业迁居北京照顾3孩子,难怪妻子能上太空

舍长阿爷谈事
2026-05-24 23:02:06
王芳、徐巧林、李小明、姚永红、解红梅、李来松,终身免票!

王芳、徐巧林、李小明、姚永红、解红梅、李来松,终身免票!

吉刻新闻
2026-05-24 20:22:04
周冬雨“拔萝卜”的瓜!

周冬雨“拔萝卜”的瓜!

八卦疯叔
2026-05-23 11:01:00
“榛树”导弹打出去,俄罗斯更加没牌了

“榛树”导弹打出去,俄罗斯更加没牌了

山河路口
2026-05-24 19:54:50
广西皮卡坠河遇难村民家属:嫂子39岁,家里5个孩子,此行是第一次去帮工种红薯,一天能挣160元

广西皮卡坠河遇难村民家属:嫂子39岁,家里5个孩子,此行是第一次去帮工种红薯,一天能挣160元

黄河新闻网吕梁
2026-05-25 09:36:16
A股7家半导体上市公司集体宣布:股东减持!套现金额可达127亿元,有公司股价刚创新高

A股7家半导体上市公司集体宣布:股东减持!套现金额可达127亿元,有公司股价刚创新高

上观新闻
2026-05-25 06:59:17
NBA官宣最佳阵容:亚历山大约基奇全票一阵 杜兰特小卡进二阵

NBA官宣最佳阵容:亚历山大约基奇全票一阵 杜兰特小卡进二阵

罗说NBA
2026-05-25 07:27:26
纳税起征点调整!2026年1月1日起执行

纳税起征点调整!2026年1月1日起执行

新浪财经
2026-05-25 03:41:31
超市里这6样东西,尽量不要买,懂行的人很少碰

超市里这6样东西,尽量不要买,懂行的人很少碰

复转这些年
2026-05-24 18:24:08
穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

残梦重生来
2026-05-25 04:29:17
武契奇刚下飞机就去长城了 在纪念品商店买买买

武契奇刚下飞机就去长城了 在纪念品商店买买买

看看新闻Knews
2026-05-24 21:47:25
倒计时!神舟二十三号即将发射,九阳太空厨房护航

倒计时!神舟二十三号即将发射,九阳太空厨房护航

中国家电网
2026-05-23 15:12:17
神剧情!38岁小法封神:率队冲入意甲2年拿到欧冠席位 创119年历史

神剧情!38岁小法封神:率队冲入意甲2年拿到欧冠席位 创119年历史

风过乡
2026-05-25 06:35:45
90后女教师穿JK上课露底裤,被偷拍后成网红,怒怼家长:穿衣自由

90后女教师穿JK上课露底裤,被偷拍后成网红,怒怼家长:穿衣自由

蝴蝶花雨话教育
2026-05-25 00:05:18
王健林、王思聪父子,同时惹上麻烦了!

王健林、王思聪父子,同时惹上麻烦了!

新浪财经
2026-05-25 00:04:43
原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

原来她是黎家盈的姐姐,祖籍广东移居香港,主动替妹妹扛起上一代

阿凫爱吐槽
2026-05-25 10:54:40
2026-05-25 13:40:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11886文章数 117083关注度
往期回顾 全部

科技要闻

华为发表半导体演进新定律

头条要闻

媒体:对于日本订购的400枚"战斧"导弹 美国发出警告

头条要闻

媒体:对于日本订购的400枚"战斧"导弹 美国发出警告

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

洪涛回应歌手淘汰庾澄庆:难以理喻

财经要闻

退市!33年“A股不死鸟”落幕

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

本地
艺术
时尚
亲子
公开课

本地新闻

用云锦的方式,打开江苏南京

艺术要闻

他把葡萄画成了美少女

伊姐周日热推:电视剧《盛唐奇案》;电视剧《我的王室死对头》......

亲子要闻

孩子提高免疫力吃什么牌子维生素?小金维他vs汤臣倍健vs康恩贝

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版