网易首页 > 网易号 > 正文 申请入驻

亚马逊强势推出Trainium3芯片,AI训练推理增添新选项!

0
分享至

当地时间 12 月 2 日,亚马逊云计算服务(AWS)在美国拉斯维加斯举办的年度云计算盛会“AWS re:Invent 2025”上发布了全新的自研Trainium3 芯片,以及采用 Trainium3 芯片的 Trainium3 UltraServer 服务器。

根据首席执行官Matt Garman的介绍,新款 Trainium3 芯片的性能是前代产品的 4 倍,并采用台积电 3 纳米工艺制造。每个芯片都配备了 144 GB 的 HBM3E 内存,内存带宽为 4.9 TB/s,提供 2.52FP8 PFLOPs的算力。


(来源:社交媒体 X)

Trainium3UltraServer 单机最多集成144Trainium3 芯片,总共配备 20.7 TB HBM3E、706 TB/s 内存带宽,可提供最高 362 FP8 PFLOPS 的算力,时延降低 4 倍,可更快训练超大模型,并大规模支撑推理服务。

其计算性能比 Trainium2 UltraServer 高出 4.4 倍,能源效率高出 4 倍,内存带宽也高出近 4 倍。在使用 OpenAI 的开源大模型 GPT-OSS 进行测试时,Trainium3UltraServer 的单芯片吞吐量可提升 3 倍,推理响应速度提升 4 倍。这意味着企业可以在更小的基础设施规模下应对峰值需求,显著优化用户体验,同时降低每次推理请求的成本。

AWS 以垂直整合方式打造Trainium3UltraServer,从芯片架构到软件栈全链路协同。核心之一是新一代网络基础设施,用于消除传统分布式 AI 计算的通信瓶颈:NeuronSwitch-v1 提供 2 倍 的 UltraServer 内部带宽;增强型Neuron Fabric将芯片间通信延迟降低至 10 微秒以内。

这种强大的配置使得它非常适合处理下一代最前沿的 AI 工作负载,例如:训练大规模AI模型,可以将复杂模型的训练时间从数月缩短至数周;处理高并发的 AI 推理请求,以低延迟实时处理数百万用户的请求,例如智能对话、视频生成等;运行特定复杂任务,如智能体系统、专家混合模型和大规模强化学习等。

包括 Anthropic、Karakuri、Metagenomi、NetoAI、Ricoh、Splash Music 等客户,已经借助 Trainium将训练和推理成本降低最多 50%。其中,Decart 在实时生成式视频方面实现了 4 倍推理速度提升,成本仅为 GPU 的一半;而 Amazon Bedrock 已经在生产环境中使用 Trainium3 提供服务。


(来源:社交媒体 X)

对于需要更大规模的客户,EC2 UltraCluster 3.0 可连接数千台 UltraServer,构成拥有多达 100 万颗 Trainium 芯片的集群——是上一代的 10 倍。这使得此前完全不可能的任务成为现实:从在万亿级 token 数据集上训练多模态模型,到为数百万并发用户提供实时推理服务。

自研芯片是亚马逊的重要战略项目之一,目标是避免过度依赖昂贵的英伟达硬件。而对于 Trainium3 来说,一个关键问题在于:有多少大型外部客户会愿意采用这套硬件。尤其是在谷歌旗下的 TPU 持续抢占 AI 芯片市场的背景下。

另一个重要变量是 AI 初创公司 Anthropic 的芯片采购分配。今年 10 月,Anthropic 宣布与谷歌达成合作,将使用多达 100 万颗谷歌 TPU 芯片,以实现除亚马逊和英伟达之外的供应多元化。

Anthropic 表示,亚马逊仍是其主要训练合作伙伴与云服务提供商。该公司预计,到今年年底,将使用超过 100 万颗 Trainium 2 芯片,其中包括运行在拥有近 50 万颗 Trainium 处理器的 Project Rainier 超级计算机之上。

此外,AWS 也预告了下一代 AI 训练芯片Trainium4的研发进展。其在各方面都将实现大幅性能跃升,包括处理性能(FP4)至少提升 6 倍、FP8 性能提升 3 倍、内存带宽提升 4 倍。结合持续的软硬件优化,其实际性能提升将远超基准数值。


其中,FP8 提升 3 倍是一次基础性飞跃。模型训练至少快 3 倍,推理吞吐量也至少提升 3 倍,并且随着软件优化将获得进一步加成。FP8 已成为现代 AI 工作负载在精度与效率之间的行业标准格式。

为进一步提升单机扩展性能,Trainium4 将支持NVIDIA NVLink Fusion高速互联技术。该能力将使 Trainium4、AWS Graviton 处理器及 Elastic Fabric Adapter(EFA)能在统一MGX机架内协同工作,为客户提供支持 GPU 与 Trainium 的成本更优、性能更强的机架级 AI 基础设施。

这一整合将构建一个灵活、高性能的平台,优化应对未来对训练与推理都极其苛刻的 AI 工作负载。

https://www.aboutamazon.com/news/aws/trainium-3-ultraserver-faster-ai-training-lower-cost

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
森林狼主帅:赢马刺靠强硬的身体对抗,文班离场后我们有点松懈

森林狼主帅:赢马刺靠强硬的身体对抗,文班离场后我们有点松懈

懂球帝
2026-05-11 15:30:07
我刚搬进新家,就听楼上情侣折腾了一夜,没忍住加了楼上帅哥

我刚搬进新家,就听楼上情侣折腾了一夜,没忍住加了楼上帅哥

古怪奇谈录
2026-05-11 15:42:49
玉渊谭天丨美国总统时隔9年再访华

玉渊谭天丨美国总统时隔9年再访华

上观新闻
2026-05-11 13:34:12
结不起还是结不动?一季度全国结婚登记再创纪录新低

结不起还是结不动?一季度全国结婚登记再创纪录新低

听心堂
2026-05-10 17:04:06
谈判破裂!央视回绝国际足联报价,中国球迷还能看到世界杯吗?

谈判破裂!央视回绝国际足联报价,中国球迷还能看到世界杯吗?

米老鼠的世界
2026-05-11 08:59:16
中国证实去年印巴战争期间,曾向巴基斯坦空军提供援助

中国证实去年印巴战争期间,曾向巴基斯坦空军提供援助

照亮你的前行之路
2026-05-10 10:05:55
常州高架通车,别让“迷信”活动开了“倒车”

常州高架通车,别让“迷信”活动开了“倒车”

清哲木观察
2026-05-11 15:14:04
39+35+33!队史第1!这就是尼克斯给他1.57亿美金大合同的原因

39+35+33!队史第1!这就是尼克斯给他1.57亿美金大合同的原因

世界体育圈
2026-05-10 19:03:04
调查发现:男性若长期不喝酒,用不了2个月,身体或出现5大改变

调查发现:男性若长期不喝酒,用不了2个月,身体或出现5大改变

摇感军事
2026-05-04 18:24:49
倒计时2天,中方终于官宣,特朗普松了一口气,高市早苗彻底傻眼

倒计时2天,中方终于官宣,特朗普松了一口气,高市早苗彻底傻眼

无情有思ss
2026-05-11 15:19:21
顺治只活了23岁,并且只宠爱董鄂妃,那他14个孩子都是谁生的?

顺治只活了23岁,并且只宠爱董鄂妃,那他14个孩子都是谁生的?

铭记历史呀
2026-05-10 19:20:42
年报临时改、突然戴*ST!12.5万散户被闷杀,连吃6跌停

年报临时改、突然戴*ST!12.5万散户被闷杀,连吃6跌停

财经智多星
2026-05-11 12:05:34
辽宁男篮动态更新!付豪合同到期开练,三名小将将升入第一梯队,球队不会放赵继伟离开

辽宁男篮动态更新!付豪合同到期开练,三名小将将升入第一梯队,球队不会放赵继伟离开

凯丰侃球
2026-05-11 09:15:04
被传绯闻22年,杨紫和张一山终于现身回应,彼此家长都见过了

被传绯闻22年,杨紫和张一山终于现身回应,彼此家长都见过了

落雪听梅a
2026-05-08 16:23:37
中美之间似乎正在复制美日广场协议,美元继续升值对美国是灾难

中美之间似乎正在复制美日广场协议,美元继续升值对美国是灾难

掉了颗大白兔糖
2026-05-05 15:18:03
央一48集新剧《主角》开播!2名配角太优秀,连张嘉益都被抢风头

央一48集新剧《主角》开播!2名配角太优秀,连张嘉益都被抢风头

八斗小先生
2026-05-11 12:40:33
建议中老年:生活别太节俭,这3种“软黄金”该吃就吃,体力足

建议中老年:生活别太节俭,这3种“软黄金”该吃就吃,体力足

阿龙美食记
2026-04-10 10:30:57
“东尼这么一个烂大街的名字,咱也不知道它是品牌啊”,英国一公司起诉山东小理发店商标侵权,代理律师曾否认恶意碰瓷,已有多家店被判赔

“东尼这么一个烂大街的名字,咱也不知道它是品牌啊”,英国一公司起诉山东小理发店商标侵权,代理律师曾否认恶意碰瓷,已有多家店被判赔

扬子晚报
2026-05-11 07:36:46
成本3.5亿,预计亏损超2亿,《寒战1994》失败的原因找到了

成本3.5亿,预计亏损超2亿,《寒战1994》失败的原因找到了

影视高原说
2026-05-11 14:39:34
宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

快科技
2026-05-09 20:16:11
2026-05-11 16:43:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16686文章数 514940关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

体育要闻

尼克斯横扫费城:唐斯恩比德的命运与角色

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

手机
时尚
亲子
家居
数码

手机要闻

母亲节文案惹争议!OPPO再致歉,高管被问责连降两级

伊姐周日热推:电视剧《主角》;电视剧《良陈美锦》......

亲子要闻

一转眼儿子3岁了,从出生到现在带来太多快乐幸福,生日快乐!

家居要闻

多元生活 此处无声

数码要闻

小米“米家保温杯口袋版”新增三色可选,42.9元

无障碍浏览 进入关怀版