网易首页 > 网易号 > 正文 申请入驻

亚马逊部署100万自研芯片,预言下一代

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。


来 源: 内容 编译自 nextplatform 。

只需看看英伟达数据中心业务令人难以置信的收入和利润,就能明白全球最大的计算客户——超大规模数据中心运营商、云服务提供商,以及现在最大的模型提供商——需要改变性价比曲线,以提高自身的利润。

亚马逊的 Trainium AI 加速器似乎用于进行 AI 推理以及 AI 训练,这也是该公司 SageMaker 和 Bedrock AI 技术栈中该产品名称的由来。这似乎意味着 AWS 在 GenAI 时代正在搁置相关的 Inferentia 系列推理加速器。(或许他们应该直接叫它AInium?)

在与华尔街分析师讨论亚马逊及其亚马逊网络服务云的财务业绩的电话会议上,数据中心的核心主题是 Trainium2 进展非常顺利,而与模型构建者和紧密合作伙伴 Anthropic 共同开发的 Trainium3 加速器(该加速器已于去年 12 月在 re:Invent 2024 大会上进行了预览)也即将投入使用。

我们在2023年12月就对Trainium2芯片进行了预览,现在需要更新芯片的实际规格。关于Trainium3,我们了解不多,只知道它采用台积电3纳米工艺制造,性能是现有Trainium2芯片的两倍,能效提升40%(我们推测这意味着每瓦浮点运算次数更高)。

与其他云服务商一样,亚马逊也在努力寻求平衡:一方面利用自研加速器提升利润并支撑人工智能平台服务;另一方面,为那些希望在云端构建自有平台的用户提供来自英伟达(有时也包括AMD)的海量GPU算力。目前,只有谷歌的TPU和AWS的Trainium广泛部署了自主研发的AI训练加速器。微软仍在研发其Maia芯片,Meta Platforms的MTIA加速器的训练版本也尚未完成。(中国的超大规模数据中心和云服务商也在不同程度上研发自研CPU和XPU,或者与华为旗下的海思半导体等第三方厂商合作,以摆脱对英伟达GPU的依赖。)

现任亚马逊首席执行官安迪·杰西(Andy Jassy)曾担任AWS首席执行官十余年,他表示Trainium2的容量已全部预订完毕,目前代表着一项年收入达数十亿美元的业务,其收入较第二季度环比增长了2.5倍。

Jassy表示,少数大型客户正在使用其云平台上大部分的Trainium2容量,他声称,与其他方案相比,Trainium2在AI工作负载方面性价比高出30%到40%。由于客户在生产环境中部署AI应用时希望获得更高的性价比,因此AWS上的Trainium2实例需求量很大。Jassy补充道,“Amazon Bedrock中大部分的tokens使用量已经在Trainium上运行”,我们认为他的意思是,Bedrock上处理的大部分上下文tokens和生成的大部分输出tokens都是由Trainium2(有时也包括Trainium1或Inferentia2)上的计算处理和生成的。

Jassy 还表示,Anthropic 正在使用该公司于 2024 年 12 月发布的“Project Ranier”超级集群训练其最新的 4.X 代 Claude 模型。当时,AWS 和 Anthropic 表示,Project Ranier 将拥有“数十万个”Trainium2 芯片,其性能将是 Anthropic 用于训练其 Claude 3 代模型的 GPU 集群的 5 倍。

事实证明,Ranier 比人们想象的还要强大,据 Jassy 称,该公司拥有 50 万个 Tranium2 芯片,并计划在今年年底前将其扩展到 100 万个 Tranium2 芯片。

关于 Trainium3,Jassy 表示它将在年底前推出预览版(这意味着我们可以在 12 月的 re:Invent 2025 大会上看到更多相关信息),正如他所说,“更大规模的部署将在 2026 年初到来”。他还补充道,AWS 拥有许多“对 Trainium3 非常感兴趣的大中型客户”。如果 AWS 上的实例能够提供 Trainium2 UltraCluster 4 倍的总容量和 2 倍的单芯片容量,那么这种兴趣也就不难理解了。像 Anthropic 这样的公司可以像 OpenAI 一样,将规模更大的实例集群串联起来,就像 OpenAI 过去在 Microsoft Azure 上获得的集群规模远超其他客户所能租用的规模一样。

“所以我们当然得交付芯片,”杰西打趣道,他指的是Trainium3。“我们必须批量交付,而且要快速交付。我们还必须继续完善软件生态系统,它一直在不断进步。随着我们拥有更多像Project Rainier那样的成功案例,以及Anthropic在Trainium2上所做的工作,Trainium的信誉度也在不断提升。我认为客户对它非常看好。我也一样。”

杰西在与华尔街的电话会议上谈到的另一个有趣之处在于AWS正在上线的数据中心容量。杰西表示,“在过去一年里”(我们认为他指的是过去十二个月,亚马逊经常使用这一指标),AWS已经启用了3.8吉瓦的数据中心容量,并且第四季度还将新增1吉瓦。杰西没有给出AWS数据中心总装机容量的具体数字,但他表示,到2027年底,总装机容量将翻一番。而从2022年底到现在,总装机容量已经翻了一番。

“所以我们今天新增了相当多的产能,”杰西解释说。“就整个行业而言,瓶颈可能在于电力。我认为在某个时候,瓶颈可能会转移到芯片上,但我们正在大幅增加产能。而且,我们目前的产能增长速度,也让我们能够将其转化为收益。”

鉴于此,假设AWS在2022年底拥有4GW的数据中心总容量,到2025年底将达到10GW。这意味着两年后总容量可能达到20GW左右。对于AI数据中心而言,英伟达基础设施的成本约为每GW 500亿美元,而像Trainium这样的自研加速器的成本约为每GW 370亿美元。假设GPU和Trainium各占一半,那么新增的10GW容量意味着2026年和2027年数据中心支出将达到约4350亿美元。这听起来简直不可思议。

为了匹配2026年和2027年GW容量仅40%的增长,假设AWS在2025年将在IT设备上投入1067亿美元——这笔支出占其预计当年1250亿美元资本支出的绝大部分,而且几乎全部用于AI基础设施——那么到2022年底,其容量必须达到1.95 GW,到2025年底达到5.9 GW,这意味着到2027年底将达到11.8 GW,而2026年和2027年(含2026年和2027年)的IT支出将达到2567亿美元。这听起来相对合理,同时也意味着,在过去一二十年里,兆瓦级容量曾是大型数据中心的容量,但在如今的GenAI时代,兆瓦级容量已经显得微不足道了。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4212期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今年的蒙古国已经乱到没边了,首都乌兰巴托的街头全是抗议的人群

今年的蒙古国已经乱到没边了,首都乌兰巴托的街头全是抗议的人群

南权先生
2025-11-05 16:42:59
周四收盘:今天涨到4008,做好准备了,周五很可能将迎来关键变盘

周四收盘:今天涨到4008,做好准备了,周五很可能将迎来关键变盘

好贤观史记
2025-11-06 15:00:23
副院长出轨眼科主任后续:院方回应,纪检部门介入,两人均已停诊

副院长出轨眼科主任后续:院方回应,纪检部门介入,两人均已停诊

千言娱乐记
2025-11-06 16:41:49
单价近35万元/平、总价1.99亿元 瑞慈医疗在上海入手一套豪宅

单价近35万元/平、总价1.99亿元 瑞慈医疗在上海入手一套豪宅

财联社
2025-11-06 11:54:06
义乌10岁搞钱小孩哥突然爆火全网,我才顿悟一个家庭最大的财富是什么!

义乌10岁搞钱小孩哥突然爆火全网,我才顿悟一个家庭最大的财富是什么!

脆皮先生
2025-11-06 20:29:25
县城险象环生,你千万不要被表面的平静给蒙蔽了。

县城险象环生,你千万不要被表面的平静给蒙蔽了。

流苏晚晴
2025-10-31 20:55:43
小鹏机器人里面是不是真人?全球网友吵翻了,CEO 现场「扒开衣服」自证

小鹏机器人里面是不是真人?全球网友吵翻了,CEO 现场「扒开衣服」自证

AppSo
2025-11-06 17:03:00
又一知名演员被骂到抑郁!于和伟仗义出面,求观众给条活路

又一知名演员被骂到抑郁!于和伟仗义出面,求观众给条活路

木子爱娱乐大号
2025-11-06 15:35:28
红军城覆灭进入倒计时,乌军发起空降作战,瞬间上演送人头大戏

红军城覆灭进入倒计时,乌军发起空降作战,瞬间上演送人头大戏

子桑说
2025-11-06 19:50:11
那年,我受命去调查于幼军

那年,我受命去调查于幼军

霹雳炮
2025-11-02 19:38:51
CCTV5直播!王楚钦男单、男团大战樊振东!王曼昱遭遇陈梦!全运会签表出炉!

CCTV5直播!王楚钦男单、男团大战樊振东!王曼昱遭遇陈梦!全运会签表出炉!

好乒乓
2025-11-06 12:56:13
神二十3名航天员、4鼠乘组将夜间返回地球,为何不延期白天回家?

神二十3名航天员、4鼠乘组将夜间返回地球,为何不延期白天回家?

环球科学猫
2025-11-04 11:29:07
成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

科学发掘
2025-10-31 14:06:52
女儿百日宴公公给8.8块,半年后公公70大寿,我送上了“寿礼”

女儿百日宴公公给8.8块,半年后公公70大寿,我送上了“寿礼”

如烟若梦
2025-10-20 19:00:09
阿富汗地震损伤惨重,全球集体沉默,无人支援?中国紧急发声!

阿富汗地震损伤惨重,全球集体沉默,无人支援?中国紧急发声!

历史有些冷
2025-11-06 19:55:03
陈佩斯三兄妹罕见同框!75岁大哥老得认不出,妹妹年轻富态有活力

陈佩斯三兄妹罕见同框!75岁大哥老得认不出,妹妹年轻富态有活力

小徐讲八卦
2025-11-06 05:50:36
普京下死命令,他明白:中俄关系再好,他也必须为俄罗斯未来考虑

普京下死命令,他明白:中俄关系再好,他也必须为俄罗斯未来考虑

凉羽亭
2025-11-05 18:31:40
副院长和眼科医生为爱鼓掌17分钟,背后还有更大的瓜,官方回应

副院长和眼科医生为爱鼓掌17分钟,背后还有更大的瓜,官方回应

温柔看世界
2025-11-06 17:09:27
孙东旭已从东方甄选直播间消失201天,其社交账号简介仍是“东方甄选的孙美丽”,有粉丝曾于4月飞拉萨见他最后一场直播

孙东旭已从东方甄选直播间消失201天,其社交账号简介仍是“东方甄选的孙美丽”,有粉丝曾于4月飞拉萨见他最后一场直播

极目新闻
2025-11-06 18:13:22
原来明星私底下聚会也是素颜出席呀

原来明星私底下聚会也是素颜出席呀

动物奇奇怪怪
2025-11-06 12:14:15
2025-11-06 21:15:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12161文章数 34696关注度
往期回顾 全部

科技要闻

小鹏机器人里藏真人?何小鹏发一镜到底视频

头条要闻

重庆一套百平米"凶宅"191万上架法拍 欠缴物业费超3万

头条要闻

重庆一套百平米"凶宅"191万上架法拍 欠缴物业费超3万

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

“黑料缠身”的白百何 谁给她的勇气?

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

房产
数码
艺术
手机
公开课

房产要闻

锚定居住新趋势!广佛新世界重构湾区“理想生活投资学”

数码要闻

华为FreeBuds Pro 5正式亮相!首款获得星闪音频认证的 TWS 耳机

艺术要闻

预定年度十佳!49岁的舒淇,杀疯了

手机要闻

荣耀500 Pro曝光:骁龙8至尊版芯片+8000mAh电池+2亿像素主摄

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版