网易首页 > 网易号 > 正文 申请入驻

Google推出Ironwood TPU和Axion实例满足AI推理需求激增

0
分享至


Google今天宣布为云客户推出定制的Ironwood芯片,发布的张量处理单元可以在单个系统中扩展到9,216个芯片,成为该公司迄今为止最强大的AI加速器架构。

这些新芯片将在未来几周内向客户提供,同时还将推出基于Arm架构的新Axion实例,承诺提供比当前基于x86架构替代方案高达两倍的性价比。

Google自己的前沿模型,包括Gemini、Veo和Imagen,都是使用TPU进行训练和部署的,还有Anthropic公司的Claude等同样规模庞大的第三方模型。该公司表示,需要深度推理和高级任务管理的AI智能体的出现,正在定义一个新时代,在这个时代中,推理(活跃模型的运行时智能)极大地增加了对AI计算的需求。

Ironwood:Google的AI强力芯片

这家科技巨头在4月的Google Cloud Next 2025大会上首次发布了Ironwood,并将其誉为公司有史以来构建的最强大的TPU加速器。

下一代架构允许公司在单个服务器系统中扩展至9,216个芯片,通过芯片间互连技术连接在一起,提供高达每秒9.6太比特的带宽。它们可以连接到庞大的1.77拍字节共享高带宽(HBM)内存。

芯片间互连(ICI)充当芯片的"数据高速公路",使它们能够像单个AI加速器大脑一样思考和行动。这一点很重要,因为现代AI模型需要大量的处理能力,但它们无法装入单个芯片,必须分布在数百或数千个处理器上进行并行处理。就像城市中拥挤在一起的数千座建筑一样,这种系统面临的最大问题是交通拥堵。有了更多的带宽,它们可以更快地通信,延迟更少。

HBM维护AI模型在训练或处理用户查询时需要"记住"的大量实时数据。据Google介绍,在单个统一系统中可访问的1.77拍字节数据在业界领先。单个拍字节(即1,000太字节)大约可以代表40,000部高清蓝光电影或数百万本书的文本。一次性访问所有这些数据,让AI模型能够利用大量知识即时智能地响应。

该公司表示,基于Ironwood的新系统架构可以提供比最接近的竞争对手多118倍的FP8 ExaFLOPS性能,在训练和推理方面比上一代TPU Trillium高4倍的性能。

Google在这一先进硬件之上包含了一个新的软件层,该软件层是为最大化Ironwood的能力和内存而共同设计的。这包括Google Kubernetes Engine中的新集群管理器功能,该功能为更好的过程调度启用高级维护和拓扑感知。

在预训练和后训练方面,该公司宣布对MaxText进行增强,这是一个用于实现强化学习技术的高性能开源大语言模型训练框架。Google最近还宣布了vLLM的升级,以支持GPU和TPU之间的推理切换,或采用混合方法。

作为Ironwood早期用户的Anthropic表示,这些芯片提供了令人印象深刻的性价比收益,使他们能够大规模提供大型Claude模型服务。这家领先的AI模型开发商和提供商上个月底宣布,计划访问多达100万个TPU。

Anthropic计算负责人James Bradbury表示:"从财富500强公司到初创企业,我们的客户都依赖Claude完成他们最关键的工作。随着需求持续指数级增长,我们正在增加我们的计算资源,同时推动AI研究和产品开发的边界。"

Axion通过N4A和C4A裸机实例进行扩展

Google还宣布通过两个预览版新服务扩展其Axion产品:N4A(其第二代Axion虚拟机)和C4A裸机(该公司首个基于Arm架构的裸机实例)。

Axion是该公司定制的基于Arm架构的中央处理器,旨在为通用工作负载提供节能性能。Google高管指出,Axion设计理念的关键在于其与公司工作负载优化基础设施战略的兼容性。它利用Arm在高效CPU设计方面的专业知识,相比传统x86处理器,在性能和功耗使用方面提供显著增强。

Google Cloud AI和计算基础设施副总裁兼总经理Mark Lohmeyer在Google Cloud Next 2024期间在SiliconANGLE Media直播工作室theCUBE的独家广播中表示:"Axion处理器将比目前云中可用的最快Arm处理器性能高30%。与可比较的x86一代处理器相比,它们的性能将高50%,与基于x86的可比较实例相比,能效高60%。"

Axion为现代通用AI工作流程提供了大幅提高的效率,可以与新的专门Ironwood加速器配合使用来处理复杂的模型服务。新的Axion实例旨在提供运营支柱,如大容量数据准备、摄取、分析和运行托管智能应用程序的虚拟服务。

N4A实例支持多达64个虚拟CPU和512千兆字节的DDR5内存,支持自定义机器类型。新的C4A裸机提供专用物理服务器,配备多达96个虚拟CPU和768千兆字节内存。这两个新服务加入了该公司此前宣布的专为一致高性能设计的C4A实例。

Q&A

Q1:Ironwood TPU有什么特别之处?

A:Ironwood是Google最强大的TPU加速器架构,可以在单个系统中扩展到9,216个芯片,提供每秒9.6太比特的带宽和1.77拍字节的共享高带宽内存。相比最接近的竞争对手,它能提供超过118倍的FP8 ExaFLOPS性能,比上一代Trillium在训练和推理方面性能高4倍。

Q2:Axion处理器相比传统处理器有什么优势?

A:Axion是Google定制的基于Arm架构的处理器,专为通用工作负载设计。它比目前云中最快的Arm处理器性能高30%,比可比较的x86处理器性能高50%,能效比基于x86的实例高60%。主要用于数据准备、分析和托管智能应用程序等运营工作。

Q3:谁在使用这些新的Google AI芯片?

A:Google自己的前沿模型Gemini、Veo和Imagen都在使用TPU进行训练和部署。第三方用户包括Anthropic公司,他们使用这些芯片为Claude模型提供服务,并计划访问多达100万个TPU。从财富500强公司到初创企业的客户都依赖这些技术完成关键工作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
温州一单位退休职工大闹!太难了

温州一单位退休职工大闹!太难了

温百君
2025-11-10 22:12:00
特斯拉Cybertruck主管离职 销量暴跌63%引发高层震荡

特斯拉Cybertruck主管离职 销量暴跌63%引发高层震荡

新浪财经
2025-11-10 19:30:08
住建部新定调:房龄满22年的老破小,一律按新规处理!业主迎利好

住建部新定调:房龄满22年的老破小,一律按新规处理!业主迎利好

巢客HOME
2025-11-10 10:50:03
汉堡王中国业务易主!CPE源峰3.5亿美元获得83%股权

汉堡王中国业务易主!CPE源峰3.5亿美元获得83%股权

澎湃新闻
2025-11-10 20:34:27
10月中国汽车出口82.8万辆 增长42% 奇瑞4万辆居第二

10月中国汽车出口82.8万辆 增长42% 奇瑞4万辆居第二

手机中国
2025-11-10 18:18:04
3名女生吃饭忘付钱,离开1小时想起,回去付钱48岁老板一句话泪目

3名女生吃饭忘付钱,离开1小时想起,回去付钱48岁老板一句话泪目

金哥说新能源车
2025-11-11 01:43:11
我国台湾岛东边太平洋上有一个大岛—兰屿,面积约 45 平方公里…

我国台湾岛东边太平洋上有一个大岛—兰屿,面积约 45 平方公里…

福建平子
2025-11-10 10:13:12
向太曝光刘德华夫妇隐私!晒出与朱丽倩聊天记录,刘德华爱称曝光

向太曝光刘德华夫妇隐私!晒出与朱丽倩聊天记录,刘德华爱称曝光

八星人
2025-11-10 15:32:29
赵少康和黄国昌举办便当会,称2028一定要下架民进党,蓝白须紧密合作

赵少康和黄国昌举办便当会,称2028一定要下架民进党,蓝白须紧密合作

海峡导报社
2025-11-10 21:55:03
王心凌再回应与吴克群绯闻:他一直都是我很好的朋友

王心凌再回应与吴克群绯闻:他一直都是我很好的朋友

半岛晨报
2025-11-10 17:50:56
吃相难看!41岁舞都跳不动还开演唱会,本想回馈粉丝却被质疑捞金

吃相难看!41岁舞都跳不动还开演唱会,本想回馈粉丝却被质疑捞金

凡知
2025-09-24 19:12:57
敢为人先!上海鼓励事业单位人员创业,全职兼职都行,亏钱可回岗

敢为人先!上海鼓励事业单位人员创业,全职兼职都行,亏钱可回岗

火山诗话
2025-11-09 10:01:43
668米!投资721亿!曾经规划的中国第一高楼!有望复工!

668米!投资721亿!曾经规划的中国第一高楼!有望复工!

小虎新车推荐员
2025-11-10 11:32:10
俄罗斯多名航空技术人员坠机身亡

俄罗斯多名航空技术人员坠机身亡

每日经济新闻
2025-11-09 18:58:06
腾讯云智能体:DeepSeek-V3/DeepSeek-R1模型将于11月24日下线

腾讯云智能体:DeepSeek-V3/DeepSeek-R1模型将于11月24日下线

界面新闻
2025-11-10 15:43:42
里外里21分,火箭是怎么逆转的,乌度卡及时觉醒,一招就奏效了

里外里21分,火箭是怎么逆转的,乌度卡及时觉醒,一招就奏效了

体坛大辣椒
2025-11-10 07:20:47
曝光!一居民“约炮”出事了!

曝光!一居民“约炮”出事了!

澄海圈
2025-11-09 20:14:52
按照7831元执行!山东最新通知

按照7831元执行!山东最新通知

芭比衣橱
2025-11-10 10:45:00
心酸!65岁港星沦落景区打工,当年不输刘德华,如今却成了酒糟鼻

心酸!65岁港星沦落景区打工,当年不输刘德华,如今却成了酒糟鼻

东方不败然多多
2025-10-30 09:16:42
进攻红军城失败的俄军突击小组阵亡画面曝光!尸体被炸得残缺不全

进攻红军城失败的俄军突击小组阵亡画面曝光!尸体被炸得残缺不全

环球热点快评
2025-11-10 21:57:07
2025-11-11 02:59:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
14627文章数 49674关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

头条要闻

德军司令:柏林已做好与莫斯科开战的准备

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

北大医药董事长被抓 巨额资金去向不明

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

游戏
教育
本地
房产
手机

游戏喜加一 / Steam 商店页面 UI 全新上线

教育要闻

传说中的“死亡211”,你的目标院校在里面么?

本地新闻

这届干饭人,已经把博物馆吃成了食堂

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

手机要闻

一加Ace 6T被确认:骁龙8 Gen5+8000mAh,联名款悬念拉满

无障碍浏览 进入关怀版