网易首页 > 网易号 > 正文 申请入驻

CPO找到了杀手级应用

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

来 源 : 内容 编译自 theregister 。

电源正成为数据中心运营商的一大难题,因为他们正努力应对如何支持越来越大规模的 GPU 服务器部署——以至于人工智能的蓬勃发展现在正在推动这项曾经被认为太不成熟且容易出错而不值得冒险的技术的采用。

我们当然指的是共封装光(CPO)交换机。

在本周于圣路易斯举行的 SC25 超级计算大会上,英伟达透露,GPU 位集群运营商 Lambda 和 CoreWeave 将采用其 Quantum-X Photonics CPO 交换机,同时德克萨斯高级计算中心 (TACC) 也将部署该交换机。

英伟达面临着一些竞争:博通展示了其基于 Tomahawk 5 和 6 的 CPO 交换机。虽然 CPO 交换机有望在 2026 年迎来爆发式增长,但走到今天这一步并非易事——而且这段旅程远未结束。

那么,是什么推动了CPO的更迭呢?用前《Top Gear》主持人杰里米·克拉克森的话来说就是“速度和力量”。

AI 网络需要极快的端口速度,高达 800 Gbps,而英伟达已经通过其下一代 ConnectX-9 网卡制定了实现 1.6 Tbps 端口速度的计划。

遗憾的是,在这样的速度下,直连铜缆的传输距离只有一两米,而且通常需要昂贵的重定时器。将成千上万个GPU连接在一起,意味着可能需要数十万个耗电的可插拔收发器。

像博通这样的网络设备厂商多年来一直在尝试CPO技术。顾名思义,这项技术是将传统上位于可插拔收发器中的光组件集成到设备本身,使用一系列与交换机ASIC封装在一起的光子芯片。光纤对不再需要QSFP插槽和可插拔模块,而是直接连接到交换机的前面板。

虽然每个收发器消耗的功率并不多——根据端口速度的不同,大约在 9 到 15 瓦之间——但当谈到 AI 后端网络中使用的那种大型无阻塞胖树网络时,这很快就会累积起来。

拥有 128,000 个 GPU 的计算集群,只需改用 CPO 交换机,即可将可插拔收发器的数量从近 50 万个减少到约 128,000 个。

英伟达估计其光子交换机的能效提高了 3.5 倍,而博通的数据表明,该技术可以将光器件的功耗降低 65%。

怎么花了这么长时间?

CPO普及的最大障碍之一是其可靠性以及发生故障时的影响范围。

在传统交换机中,如果光插拔模块发生故障或性能下降,您可能只会失去一个端口,而不会导致整个交换机瘫痪。而对于CPO(光子芯片)技术,如果其中一个光子芯片发生故障,您失去的不仅仅是一个端口——您可能会失去8个、16个、32个甚至更多端口。

这也是包括博通和英伟达这两家巨头在内的大多数CPO供应商选择外部激光模块的原因之一。

激光器是光收发器中比较容易出现故障的组件之一,因此,通过将其保持在更大的可插拔外形尺寸中,不仅可以方便用户维修,还可以在发生故障时通过提高其他组件的输出来补偿故障。

但事实证明,许多此类担忧似乎毫无根据。实际上,博通和Meta的早期测试表明,这项技术不仅通过减少光模块和交换机ASIC之间的电气接口数量来降低延迟,而且可靠性也显著提高。

上个月,Meta透露,它不仅在其数据中心部署了博通公司代号为Bailly的51.2 Tbps共封装光交换机,而且还记录了在400 Gbps等效端口速度下累计100万小时无抖动运行的设备数据。

如果您不熟悉链路抖动,链路抖动是指交换机端口快速连续地开启和关闭,从而导致网络不稳定并中断信息流。

与此同时,英伟达声称其光子网络平台的弹性提高了 10 倍,使训练工作负载等应用程序能够运行更长时间而不会中断,持续时间延长 5 倍。

CPO交换机的当前状态

正如我们前面提到的,博通和英伟达是最早采用 CPO 进行数据包交换的公司之一。

你可能还记得,在今年春季的 GTC 大会上,Nvidia 展示了其首款 CPO 交换机,包括 InfiniBand 和以太网两种版本,分别是 Spectrum-X 和 Quantum-X。

英伟达的 Quantum-X Photonics 平台采用全液冷设计,配备 144 个 800Gbps InfiniBand 端口,使用 200Gbps 串行器-解串器,使其总带宽达到 115.2Tbps。

这些是 TACC、Lambda 和 CoreWeave 在本周的 SC25 大会上宣布的计划,他们将在未来的计算基础设施中部署这些交换机。

对于那些更倾向于使用以太网的用户来说,选择更加多样化。Nvidia 将根据用户的需求提供多种版本的 Spectrum-X Photonics 交换机。对于需要最大端口数(即大量端口)的用户,Nvidia 将提供配备 512 个或 2048 个 200 Gbps 接口的交换机。

同时,追求极致性能的用户可以选择 128 个或 512 个 800 Gbps 端口。

英伟达的光子以太网套件要到明年才能上市,而且已经面临来自博通等公司的竞争。Micas Networks 已经开始出货一款基于博通早期 Tomahawk 5 ASIC 和 Bailly CPO 技术的 51.2 Tbps CPO 交换机。

除了交换机之外,博通还展示了其最新一代 Davisson CPO 平台,该平台配备了 102.4 Tbps 的 Tomahawk 6 交换机 ASIC,可分出多达 512 个 200 Gbps 接口。

接下来会发生什么?

到目前为止,Nvidia 将其大部分光模块注意力集中在 CPO 交换机上,而更倾向于在网卡端使用 QSFP 插槽和可插拔收发器——至少在其新发布的ConnectX-9 系列超级网卡中是如此。

然而,博通和其他公司正致力于尽快将共封装光学器件应用于加速器本身。您可能还记得,在2024年的Hot Chips大会上,博通详细介绍了一款面向大规模计算领域的6.4 Tbps光学引擎。

包括 Celestial AI、 Ayar Labs和Lightmatter在内 的其他几家公司也在寻求将光 I/O 引入加速器。

Ayar 和 Lightmatter 都在 SC25 上展示了他们最新的 CPO 和光中介层技术的现场演示。Ayar 展示了与 Alchip 合作开发的参考设计,该设计使用 UCIe-S 和 UCIe-A 互连的组合,将八个 TeraPHY 芯片集成到单个封装中,最终将为芯片间的双向连接提供高达 200 Tbps 的带宽。

与此同时,Lightmatter正从两个方面着手解决光I/O问题。首先是CPO芯片,该公司声称该芯片在使用56 Gbps NRZ编码时可提供高达32 Tbps的带宽,使用112 Gbps PAM4编码时可提供高达64 Tbps的带宽。

此外,Lightmatter 还开发了一种名为 Passage M1000 的硅光子中介层,该中介层旨在利用光子互连将多个芯片连接在一起,用于芯片间通信和封装间通信。

最终,这些技术或许能够完全消除对可插拔光学器件的需求,甚至为构建更高效的可扩展计算域铺平道路,使数千个加速器能够协同工作。

https://www.theregister.com/2025/11/22/cpo_ai_nvidia_broadcom/

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4236期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当不成总统了?美最新民调出来了,特朗普态度转变,英法不宣而战

当不成总统了?美最新民调出来了,特朗普态度转变,英法不宣而战

剑道万古似长夜
2026-01-07 10:34:34
刘一诺称“愿为自己言论负法律责任”,前一天刚回应与檀健次恋情

刘一诺称“愿为自己言论负法律责任”,前一天刚回应与檀健次恋情

韩小娱
2026-01-08 09:29:36
主持人李静自曝绝经过程,很快失去性魅力,连男人也没兴趣了

主持人李静自曝绝经过程,很快失去性魅力,连男人也没兴趣了

阿器谈史
2025-12-30 17:26:47
13胜0负,联盟第1!全联盟都认为你要退役,你却天神下凡屡创神迹

13胜0负,联盟第1!全联盟都认为你要退役,你却天神下凡屡创神迹

毒舌NBA
2026-01-08 01:05:03
瓜帅愁坏了!曼城三连平+锋线集体哑火!7500万新援成救命稻草

瓜帅愁坏了!曼城三连平+锋线集体哑火!7500万新援成救命稻草

听我说球
2026-01-08 09:10:17
包养情人无数,玩老婆闺蜜,娶初中同学女儿为妻,孙道存有多荒唐

包养情人无数,玩老婆闺蜜,娶初中同学女儿为妻,孙道存有多荒唐

探索源自好奇
2026-01-08 05:08:40
官方:44岁蒙哥马利执教北京国安!曾在热刺、森林担任澳波助教

官方:44岁蒙哥马利执教北京国安!曾在热刺、森林担任澳波助教

兰亭墨未干
2026-01-08 09:15:31
快船如何换到特雷-杨?美媒3换1交易方案:提升哈登不在场时火力

快船如何换到特雷-杨?美媒3换1交易方案:提升哈登不在场时火力

罗说NBA
2026-01-07 21:15:51
点一桌子菜只吃几口,39岁杨幂揭开内娱现状,没胃口更没活人感

点一桌子菜只吃几口,39岁杨幂揭开内娱现状,没胃口更没活人感

萌神木木
2026-01-07 17:08:36
远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

远华集团老总赖昌星,在狱中对董文华的回忆,让无数人咋舌

晓艾故事汇
2025-01-09 22:01:49
哈工大发现:喜欢睡午觉的人,寿命比不睡午觉的人长几年不止?

哈工大发现:喜欢睡午觉的人,寿命比不睡午觉的人长几年不止?

健康之光
2026-01-05 14:22:46
北京多区取消期末统考,鸡娃家长天都塌了!

北京多区取消期末统考,鸡娃家长天都塌了!

特特农村生活
2026-01-07 14:41:03
“慰安妇”韦绍兰:忍辱生下日本兵后代,儿子:母亲去世就喝农药

“慰安妇”韦绍兰:忍辱生下日本兵后代,儿子:母亲去世就喝农药

何氽简史
2025-12-31 18:45:15
美军大批军机飞欧洲!调动模式与去年“空袭伊朗”惊人相似,抓一艘逃亡17天油轮?

美军大批军机飞欧洲!调动模式与去年“空袭伊朗”惊人相似,抓一艘逃亡17天油轮?

红星新闻
2026-01-06 19:14:23
降维打击?芬兰公司宣布固态电池进入量产,成本比普通锂电池还低

降维打击?芬兰公司宣布固态电池进入量产,成本比普通锂电池还低

小柱解说游戏
2026-01-07 02:12:43
被四家医院判定为肺癌并要求手求,最后的检查结果救了我一命!

被四家医院判定为肺癌并要求手求,最后的检查结果救了我一命!

坠入二次元的海洋
2026-01-01 11:10:01
你好特雷杨!爆开拓者7换1交易方案,罗威去老鹰,杨瀚森要崛起了

你好特雷杨!爆开拓者7换1交易方案,罗威去老鹰,杨瀚森要崛起了

毒舌NBA
2026-01-07 14:16:24
顶级后卫视野?拉拉维亚救球后直接坐在多名女球迷身边

顶级后卫视野?拉拉维亚救球后直接坐在多名女球迷身边

懂球帝
2026-01-07 12:00:09
新一代小米SU7来了,更重要的是没有“小字”

新一代小米SU7来了,更重要的是没有“小字”

差评XPIN
2026-01-08 00:08:54
林依轮老婆54岁生日,他亲自下厨做八个菜在家庆祝两人发量都好多

林依轮老婆54岁生日,他亲自下厨做八个菜在家庆祝两人发量都好多

小咪侃娱圈
2026-01-08 09:13:35
2026-01-08 10:08:49
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
12643文章数 34758关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

牛弹琴:美国又干了件石破天惊的事 俄罗斯遭沉重打击

头条要闻

牛弹琴:美国又干了件石破天惊的事 俄罗斯遭沉重打击

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

《马背摇篮》首播,革命的乐观主义故事

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

本地
旅游
教育
房产
健康

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

旅游要闻

初冬京郊:斑斓画卷徐徐展开

教育要闻

刘希娅:减少考试频次并不直接等同于质量提升,其关键在于同步推进学习方式的系统性变革

房产要闻

最新!海口二手房,涨价房源突然猛增30%

这些新疗法,让化疗不再那么痛苦

无障碍浏览 进入关怀版