网易首页 > 网易号 > 正文 申请入驻

ARM的AI叙事:AGI路径与CPU复兴

0
分享至

在AI叙事中,GPU一度吞噬了一切,但那些曾被边缘化的角色,逐步重新成为瓶颈。正如黄仁勋反复强调的那样,CPU已经成为限制英伟达“AI工厂”吞吐token速度的关键所在。换句话说,它是系统性能的阿姆达尔定律(Amdahl's law)极限所在。

现在,长期坚持身居幕后的Arm公司,终于也决定亲自下场。Arm推出的首款面向外部销售的数据中心CPU,命名为Arm AGI CPU,充分体现了其野心。AGI(通用人工智能)是整个AI行业的长期叙事制高点,智能体是“递归式”通往AGI的重要路径。而Arm AGI CPU正是面向高性能智能体AI系统而设计的。

它性能强劲、易于扩展,而且功耗低。在发布会上,公司高管直斥x86架构CPU是AGI路线的技术债务。


根据官方资料,这款CPU拥有136个Neoverse V3核心,最高主频可达3.7GHz,由两个Chiplet组合而成,采用台积电3纳米工艺。每个核心配备2MB的L2缓存,并共享128MB的系统级缓存(SLC),内存带宽825 GB/s,设计热功率(TDP)为300W

它已经超过了英伟达目前主打的Grace CPU。后者基于ARM Neoverse V2核心,无论是主频、L2缓存、内存带宽都落后了不少。

Meta与OpenAI,这些原本围绕AI推理芯片构建体系的玩家,如今开始为CPU预留位置;叫板英伟达的芯片初创企业Cerebras,也是它的客户之一。它们现在就可以订购,年底实现量产;明年,就迭代到第二代;AGI CPU 3也已在规划中。

智能体式(Agentic)AI的兴起,为CPU带来了新的价值。ARM首席执行官Rene Haas在发布会上称,随着AI从现有工作负载,演进到智能体式工作模式,数据中心对CPU的需求可能增长四倍,相当于每GW算力的CPU核心数,从当前的3000万个跃升至1.2亿个。相比传统x86架构CPU,AGI CPU能省下高达100亿美元/GW的电费和资本支出。

然而,能省电费也许不是CPU复兴的主要原因,避免GPU价值被浪费才是。随着GPU算力日益强大,其空闲或未充分利用的也越来越不可接受。AI工厂吞吐token的交互速度,如果从每秒400个token向1000个token延伸,那么,每百万token的价格可以从45美元提升至150美元,这不是线性的增长。

在GTC 2026期间,黄仁勋接受专访时称,英伟达专注于加速计算,目标从来不是取代CPU,而是最大化整个系统的性能。那些立错目标的竞争对手已经消失在历史里。在现代AI系统中,系统性能始终受阿姆达尔定律制约,GPU、网络、内存和CPU都会成为潜在瓶颈,英伟达正在一手抓。

过去10年,CPU的设计主要围绕超大规模云计算展开(Cloud-Native CPU),更强调核心数量。在智能体兴起前,AI主要用于生成内容,CPU作为GPU控制节点(Head Node CPU),负责管理GPU并持续为其提供数据,追求更高单核性能。不过,数据调度、任务编排、工具调用和系统交互,甚至操作没有API接口的应用程序,如浏览网页、点击界面元素等,在CPU与GPU的交互中,占比仍然不显著。英伟达的Grace CPU,主要就是GPU控制节点。

但是,随着智能体能力不断提升,它可以完成越来越多复杂任务,也将触及更多无法并行的工作负荷。一旦CPU性能不足,这部分“不可加速”的工作,就会成为整个系统的瓶颈。要求CPU确保数据、任务和工具调用能够高效流动,也就需要更强大的单核性能与IO能力。

既然AGI离不开CPU,那么,黄仁勋要打造最高效的“AI工厂”,自然也希望把CPU的命运,牢牢抓在自己手里。在上周的GTC 2026上,英伟达大力宣传了下一代基于Arm架构的自研CPU,卖点就在于专为智能体式AI打造。

它摆脱了ARM的Neoverse核心,采用深度自研的Olympus核心,号称单核性能最强。该CPU的每核私有L2缓存也提升至2MB,内存带宽更是达到了1.2TB/s。Vera CPU的下一代,将是Rosa CPU,也已经早早宣布。

尽管这次黄仁勋为ARM AGI CPU美言了几句,但事情正在变得微妙。黄仁勋为了解决AI工厂的“阿姆达尔瓶颈”,已经收购了Mellanox与Groq。在2020年,英伟达也曾动过400亿美元收购ARM的念头,但最终在所有人的反对下,于2022年宣告终止推进协议。

智能体正在改变AI叙事的竞争格局。ARM AGI CPU就是CPU复兴最直接的一击。去年,英伟达推出NVLink Fusion功能,允许只要CPU或GPU来自英伟达旗下,就能互联互通,也许就预见到了这一刻。

事实上,英伟达也开始出售自己的CPU。一开始,单独出售的Grace CPU,主要用于超级计算机和其他高性能计算应用。今年2月,英伟达与Meta达成了一项多年协议,其中包括首次大规模部署Grace CPU,而下一代的Vera CPU也在接受Meta的评估。

但是,Meta正是ARM AGI CPU的首位大客户,事实上也是这款芯片的设计合作者。在硅谷巨头中,即使是CPU领域,Meta的自研布局也相对落后。而其他几乎所有的重要玩家,已经都自研了ARM架构的CPU,包括亚马逊AWS的Graviton系列,微软Azure的Cobalt系列,谷歌云的Axion系列等等。

不过,它们在AI算力集群中的作用尚不明显,动作最快的,也主要是处于GPU控制节点的阶段,而非转为智能体式AI优化。

亚马逊是首家推出自研CPU的超大规模云厂商,2018年就发布了Graviton。去年底,在发布的Trainium3芯片后,亚马逊曾透露,基于该芯片的算力集群,将由自己的Graviton5驱动。谷歌两年前发布的Axion芯片,目前覆盖了大约30%的内部应用,未来,谷歌也会设计用于TPU集群的Axion CPU,以支撑Gemini模型。微软基于Maia 200的算力集群仍然由英特尔CPU驱动。

看来,正如推理时代AI芯片走向定制,智能体时代的CPU复兴,谁都想掺和一把。这可关系到AGI的实现呢。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陕西道协会长被实名举报:隐婚20多年,情人成群,挪用庙产买路虎

陕西道协会长被实名举报:隐婚20多年,情人成群,挪用庙产买路虎

葱哥说
2026-05-05 12:17:28
反制高价勒索!不止中国,还有这么多国家拒绝为世界杯买单

反制高价勒索!不止中国,还有这么多国家拒绝为世界杯买单

十点街球体育
2026-05-05 23:10:03
公安部提醒:换身份证后别急着走!这3个关键步骤多数人忽略

公安部提醒:换身份证后别急着走!这3个关键步骤多数人忽略

老特有话说
2026-05-04 16:04:22
世乒赛最新战报:梁靖崑王楚钦狂轰3-0,8强赛对阵出炉,龙队观赛

世乒赛最新战报:梁靖崑王楚钦狂轰3-0,8强赛对阵出炉,龙队观赛

凡知
2026-05-05 20:53:17
终于,一位接地气的专家说了大实话:中国老百姓的负担太重了

终于,一位接地气的专家说了大实话:中国老百姓的负担太重了

巢客HOME
2026-04-28 05:25:03
当年的东北“地下市长”,霸占过20多位女明星,狠起来连自己都砍

当年的东北“地下市长”,霸占过20多位女明星,狠起来连自己都砍

为什么有冬天夏天
2024-05-08 23:38:12
卢放评传统豪华品牌搬老车卖情怀,称中国新能源靠创新突围

卢放评传统豪华品牌搬老车卖情怀,称中国新能源靠创新突围

IT之家
2026-05-06 07:57:12
伊朗外长专机落地北京,美国人终于发现:中国,绕不开了

伊朗外长专机落地北京,美国人终于发现:中国,绕不开了

顾蔡卫
2026-05-06 00:15:38
蒋介石抓了不敢杀,日军不敢惹,彭老总见了他就躲,他到底是谁?

蒋介石抓了不敢杀,日军不敢惹,彭老总见了他就躲,他到底是谁?

历史龙元阁
2026-05-05 06:45:10
32℃!雷雨、7级大风!江苏最新天气预测

32℃!雷雨、7级大风!江苏最新天气预测

江南晚报
2026-05-06 02:58:45
生活中的陈伯达是怎么样一个人?

生活中的陈伯达是怎么样一个人?

莫地方
2026-05-06 00:05:05
特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

侃故事的阿庆
2026-05-03 02:32:23
奢靡淫逸的白马会所:性交易泛滥,让富婆挥金如土,最终一夜覆灭

奢靡淫逸的白马会所:性交易泛滥,让富婆挥金如土,最终一夜覆灭

浮光惊掠影
2026-02-20 23:15:25
把最佳球员奖投给B费,记者:这是我自1999年最容易选的一次

把最佳球员奖投给B费,记者:这是我自1999年最容易选的一次

懂球帝
2026-05-06 01:20:08
曾被U17国足打哭!印尼三个月后翻盘,绝杀后全队疯狂庆祝

曾被U17国足打哭!印尼三个月后翻盘,绝杀后全队疯狂庆祝

奥拜尔
2026-05-06 02:44:50
伊朗公布新地图

伊朗公布新地图

大风新闻
2026-05-04 21:03:03
洋相还得看洋人出!纽约这一日:大瘤子、石像人、一个比一个炸裂

洋相还得看洋人出!纽约这一日:大瘤子、石像人、一个比一个炸裂

嫹笔牂牂
2026-05-06 07:44:08
直奔现场,湖南省委书记来了

直奔现场,湖南省委书记来了

阿振观点
2026-05-06 05:47:28
0-1爆冷!4-0大胜!U17亚洲杯乱了:中国队被打回原形,排名更新

0-1爆冷!4-0大胜!U17亚洲杯乱了:中国队被打回原形,排名更新

大秦壁虎白话体育
2026-05-06 07:37:31
【人物】“00后”冠军吴宜泽:一个中国斯诺克家庭为他押上了一切

【人物】“00后”冠军吴宜泽:一个中国斯诺克家庭为他押上了一切

界面新闻
2026-05-05 11:06:08
2026-05-06 08:27:00
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
369文章数 63关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

小伙去理发被店家弄到VIP房间后脸白了 联系父母要钱

头条要闻

小伙去理发被店家弄到VIP房间后脸白了 联系父母要钱

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

内娱真情谊!杨紫为谢娜演唱会送花篮

财经要闻

套现约455亿,李嘉诚又卖了

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

艺术
时尚
健康
数码
军事航空

艺术要闻

这些劳动图画最美!

衣服不用准备太多,找到一些实用的单品才最重要,百搭又有性价比

干细胞治烧烫伤面临这些“瓶颈”

数码要闻

曝三星、SK海力士、美光DDR6内存研发启动,速度有望达DDR5两倍

军事要闻

特朗普威胁伊朗不要向美国船开火

无障碍浏览 进入关怀版