网易首页 > 网易号 > 正文 申请入驻

深度|抗衡英伟达 NVLink!微软、谷歌、Meta 以及 AMD 等硅谷巨头联手成立 UALink 制定统一标准

0
分享至

许多人认为 Nvidia 的 AI 系统之所以占据主导地位,只是因为 GPU 或 CUDA 软件,其实 Nvidia 还拥有一系列技术,可用于在多个 GPU 和系统上扩展工作负载,其中包括其片上和封装互连、用于服务器或 POD 中 GPU 到 GPU 通信的 NVLink、用于扩展POD 之外的 Infiniband 以及用于连接到更广泛基础设施的以太网。

如今,微软、谷歌以及 Meta 等硅谷科技巨头正在成立新的行业组织 UALink(Ultra Accelerator Link)小组以推动数据中心 AI 加速器芯片的组件开发,通过开放标准对 Nvidia 进行反击,其他成员还包括 AMD、英特尔、惠普企业(HPE)、博通以及思科。

▍UALink 联盟及标准

本周四,UALink 宣布已联手开发一项新的行业标准,致力于推进数据中心内连接的大规模 AI 系统的高速和低延迟通信。AI 加速器包括从 GPU 到定制解决方案的各种芯片,用于加速 AI 模型的训练、微调和运行。

此外,UALink 将在第三季度成立一个联盟,即 UALink 联盟,以监督 UALink 规范未来的发展。UALink 和行业规范对于标准化下一代 AI 数据中心和实现的 AI 和机器学习、HPC 和云应用程序接口至关重要,该小组将制定一项规范,定义 AI 计算舱中加速器和交换机之间扩展通信的高速、低延迟互连。

提议标准的第一个版本 UALink 1.0 连接多达 1024 个 AI 加速器(仅限 GPU)。

据悉,UALink 1.0 基于包括 AMD 的 Infinity Fabric在内的开放标准 ,将允许在连接到 AI 加速器的内存之间进行直接加载和存储,并且与现有互连规范相比,通常可以提高速度并降低数据传输延迟。

UALink 的一大优势是,让业内所有人都有机会与 Nvidia 保持同步。Nvidia 现在有能力制造NVSwitch盒并将这些 NVSwitch 托盘放入Nvidia DGX GB200 NVL72等产品中。

Ultra Ethernet 仍将用于扩展到更多节点。博通可能会在 800Gbps 的 Thor 产品中推出一款早期的 Ultra Ethernet NIC,但仅根据规范标准化的程度,可能还需要一代才能获得完整的 UEC 支持。

UALink 1.0 将在同一时间向加入该联盟的公司提供,带宽更高的更新规范 UALink 1.1 将于 2024 年第四季度推出。

▍Nvidia 未加入,AWS 保持观望

NVLink 是加速系统中 GPU 和 CPU 处理器的高速互连,可将数据和计算转化为可操作的结果。

第五代 NVLink 极大地提高了大型多 GPU 系统的可扩展性。单个 NVIDIA Blackwell Tensor Core GPU 支持多达 18 个 NVLink 100 GB/s 连接,总带宽为 1.8 TB/s — 比上一代带宽高 2 倍,比 PCIe Gen5 带宽高 14 倍以上。GB200 NVL72 等服务器平台利用这项技术为当今最复杂的大型模型提供更高的可扩展性。

借助 NVLink Switch,NVLink 连接可以跨节点扩展,以创建无缝、高带宽、多节点 GPU 集群,从而有效地形成数据中心大小的 GPU。

NVLink Switch 可在一台 NVL72 中实现 130TB/s 的 GPU 带宽,以实现大型模型并行。具有 NVLink 的多服务器集群可以平衡 GPU 通信与增加的计算量,因此 NVL72 可以支持的 GPU 数量是单个八 GPU 系统的 9 倍。

据悉,目前 UALink 成员名单中没有 Nvidia,而 Nvidia 是迄今为止最大的 AI 加速器生产商,估计占据了80 % 至 95% 的市场份额。目前,Nvidia 提供其专有的互连技术,用于连接数据中心服务器内的 GPU。

在 Nvidia 最近的财季,数据中心销售额(包括其 AI 芯片的销售额)较去年同期增长了 400% 以上。如果 Nvidia继续保持目前增长势头,将在今年某个时候超越苹果成为全球第二大市值公司。因此,Nvidia 可能不太愿意支持基于竞争对手技术的规范。

此外,AWS 是唯一一家没有为 UALink 做出贡献的公有云巨头,AWS 正在逐步削减内部的各种加速器硬件工作,或是 AWS 希望牢牢控制云服务市场,或认为与 Nvidia 对抗没有多大战略意义。

英特尔今年的 AI 加速器销售额达数亿美元,可能意味着它只卖出几万台加速器,而 AMD 今年将销售数十亿美元的 MI300X,但这仍然远不及 Nvidai 的 AI 规模。

▍微软、谷歌以及 Meta 等或是最大受益者

对于 AMD 和英特尔等公司来说,UALink 提供了一条复制 NVLink 和 NVSwitch 功能并与其他公司共享开发成果的途径。此外,拥有 UALink 允让博通这样的公司制造 UALink 交换机来帮助其他公司扩大规模。

AMD 数据中心解决方案总经理 Forrest Norrod 表示,行业需要一种能够快速推进的开放标准,这种开放标准允许多家公司为整个生态系统增加价值;行业需要一种标准,允许创新不受任何一家公司的束缚,快速推进。此外,首批 UALink 产品将在未来几年推出。

博通数据中心解决方案事业部副总裁 Jas Tremblay 表示,博通很荣幸成为 UALink 联盟的创始成员之一,得益于长期将大规模 AI 技术引入数据中心,支持开放的生态系统协作对于通过各种高速和低延迟解决方案实现网络扩展至关重要。

思科通用硬件集团执行副总裁 Martin Lund 表示,随着 AI 工作负载的规模和范围不断增长,超高性能互连变得越来越重要 ;思科将共同致力于开发 UALink,这将是一个可扩展且开放的解决方案,可帮助克服构建 AI 超级计算机的一些挑战。

此外,UALink 最大受益者可能是微软、谷歌以及 Meta,它们总计花费了数十亿美元购买 Nvidia GPU 来支持其云并训练其不断增长的 AI 模型,这些公司都希望摆脱对这家在 AI 硬件生态系统中占据主导地位的供应商的依赖。

谷歌拥有用于训练和运行 AI 模型的定制芯片、 TPU 和 Axion;亚马逊拥有多个 AI 芯片 系列;微软去年推出了Maia 和 Cobalt,加入竞争行列;Meta 正在完善自己的加速器阵容。

此外,微软及其密切合作伙伴 OpenAI 也计划投入 1000 亿美元建造超级计算机,用于训练 AI 模型,该超级计算机将配备未来版本的 Cobalt 和 Maia 芯片,这些芯片需要某种东西将它们连接起来,或是 UALink。

Newin 行业交流群

添加小助手微信加交流群

最新活动

1 、 AIEC 联盟在哈佛大学无锡校友会和全球华人常春藤校友联盟理事会的倡议和指导下成立,是直属于哈佛大学无锡校友会的分支机构。

2024 世界 AIEC 峰会即将在 6 月 29 日于无锡举办!首批合作组织已正式揭晓,新会员招募计划已正式启动,详情点击下方海报咨询:

2、如果你是 26 岁及以下具有开发、设计、营销三大核心能力之一的“当代嬉皮土”,这场 AdventureX 组织的线下黑客松活动不容错过!

这场今年最“硬核”的黑客松将在 7月 15~19 日在杭州良渚,你将在 5 天时间内组成2~4 人的小队,并在极限的时间内舍弃睡眠创造出你脑海中最疯狂的产品,或许下一个改变世界的产品就此诞生,访问: https://adventure-x.org 报名!

最新资讯

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
财经观察丨黄金白银,暴跌!网友:刚买了4克黄金,跌没了

财经观察丨黄金白银,暴跌!网友:刚买了4克黄金,跌没了

半岛官网
2026-01-30 15:24:12
深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

时尚的弄潮
2026-01-30 16:46:36
金晨道歉后,喜之郎、娇韵诗恢复代言广告;律师解读:因就医离开不构成肇事逃逸

金晨道歉后,喜之郎、娇韵诗恢复代言广告;律师解读:因就医离开不构成肇事逃逸

930老友记
2026-01-30 22:22:23
浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

浙江卫视炸了!7000万网红怒怼评委:你15年没歌凭啥说我?

乐悠悠娱乐
2026-01-28 11:29:21
河南泌阳冻货争议持续发酵,货主损失近20万,纪委加紧调查

河南泌阳冻货争议持续发酵,货主损失近20万,纪委加紧调查

科学发掘
2026-01-30 11:22:02
1939年,李德返回苏联后,对在中国的老婆和年幼的儿子不管不顾

1939年,李德返回苏联后,对在中国的老婆和年幼的儿子不管不顾

古书记史
2026-01-12 21:59:25
王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

姜大叔侃球
2026-01-30 20:08:18
特朗普想通了,美军连夜通告全球,对中国不能来硬的,要上点手段

特朗普想通了,美军连夜通告全球,对中国不能来硬的,要上点手段

boss外传
2026-01-30 06:00:03
新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

新加坡急了,外长几乎是拍着桌子,让中国“尊重”马六甲的地位。

南权先生
2026-01-26 15:41:26
Meta豪掷60亿美元锁定光纤供应链!这些光通信龙头迎黄金时代

Meta豪掷60亿美元锁定光纤供应链!这些光通信龙头迎黄金时代

Thurman在昆明
2026-01-31 02:35:36
网友春节回家转发好房东视频想减房租,可惜遭到无情拒绝

网友春节回家转发好房东视频想减房租,可惜遭到无情拒绝

映射生活的身影
2026-01-29 02:44:47
两家A股公司同日公告:被证监会立案调查!

两家A股公司同日公告:被证监会立案调查!

每日经济新闻
2026-01-30 22:05:05
世界5大禁片,全看完的人,心理素质堪比特种兵

世界5大禁片,全看完的人,心理素质堪比特种兵

i书与房
2026-01-26 15:07:05
今年广东江苏很多工厂纷纷取消年会,员工:形式化的年会不如发钱

今年广东江苏很多工厂纷纷取消年会,员工:形式化的年会不如发钱

捣蛋窝
2026-01-29 15:01:04
90%的广东人都不知道这样随礼是犯了大忌

90%的广东人都不知道这样随礼是犯了大忌

户外阿崭
2026-01-30 19:30:50
弗里茨澳网16强出局进账48万美元!网红辣女友没流几滴汗竟赚更多

弗里茨澳网16强出局进账48万美元!网红辣女友没流几滴汗竟赚更多

体育妞世界
2026-01-30 12:14:49
柯桥警方正式通报,金晨已平安落地

柯桥警方正式通报,金晨已平安落地

拆台CT
2026-01-30 19:42:09
老了才明白,永远不要在兄弟姐妹面前,随口说出这5句!再亲也不行!

老了才明白,永远不要在兄弟姐妹面前,随口说出这5句!再亲也不行!

风起见你
2026-01-13 04:04:23
台军通知台湾民众:开战后,要是看到穿军服的,一定要先逃命

台军通知台湾民众:开战后,要是看到穿军服的,一定要先逃命

老簿尾声体育解说
2026-01-30 18:55:27
恋爱脑:月亮寄居在心室

恋爱脑:月亮寄居在心室

疾跑的小蜗牛
2026-01-30 23:09:14
2026-01-31 06:36:49
有新Newin incentive-icons
有新Newin
分享前沿科技资讯与商业洞察
499文章数 55关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

手机
家居
时尚
数码
公开课

手机要闻

差200元!红米Turbo 5与Max该怎么选?这4点核心差异看完不纠结!

家居要闻

蓝调空舍 自由与个性

今日热点:《闪灵》今日上映;保险公司确认金晨方曾放弃索赔……

数码要闻

延续传统:罗技G PRO X2 SUPERSTRIKE鼠标国行名称为GPW5雪豹

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版