英伟达重磅押注硅光|内存|交换机|平均售价|nvidia|infiniband

英伟达重磅押注硅光

分享至

公众号记得加星标⭐️，第一时间看推送不会错过。

凭借2020 年初以 69 亿美元收购 Mellanox Technologies，英伟达成为以太网和 InfiniBand 光收发器的销售商。但在此交易完成的七年前，Mellanox 收购了光技术供应商 Kotura 和 IPtronics，成为这些组件的供应商，正确地预见到光技术在未来的重要性。

但是，当Mellanox在2017年拒绝Marvell的收购提议后，与激进投资者Starboard Value发生争执，其光收发器业务的梦想破灭，业务规模大幅缩减。为了发展LinkX光缆和收发器业务，Mellanox开始从Lumentum（后更名为Coherent）等公司采购激光器、光子集成电路（PIC）和其他组件。这些光缆和收发器可能占到网络成本的一半以上，功耗也超过一半，因此，LinkX对Mellanox乃至现在的Nvidia的重要性都难以言表。

但是，设计更先进的人工智能系统面临的挑战非常严峻，最终用光学电路取代电子电路的需求也十分迫切，因此英伟达分别向 Lumentum 和 Coherent 各投入 20 亿美元，以推动它们的研发朝着有助于英伟达实现其人工智能目标的方向发展。

与如今许多交易不同，英伟达对这两家公司的投资并非直接购买股票，而且这三家公司目前都未向美国证券交易委员会提交8-K文件，详细说明对Lumentum和Coherent的具体投资内容。我们强烈怀疑这些投资是可转换债券、未来发行的新股或其他类型的股权工具。除了分别向每家公司投入20亿美元之外，Lumentum还获得了英伟达“数十亿美元的先进激光组件采购承诺和未来产能使用权”，而Coherent则获得了英伟达“数十亿美元的先进激光和光网络产品采购承诺和未来产能使用权”。

Lumentum 和 Coherent 都深度参与了英伟达 (Nvidia)即将推出的 Quantum-X InfiniBand 和 Spectrum-X 以太网交换机的共封装光器件 (CPO) 项目，这两款交换机是英伟达去年三月发布的。据我们所知，Lumentum 为这两款交换机的 CPO 模块提供激光器，但随着英伟达展望未来，市场需求可能非常巨大，因此需要不止一家激光器供应商。上述公告基本表明了这一点，而且这些协议并非排他性的，这意味着英伟达非常希望引入竞争——竞争越多，价格就越低。

这就是为什么两年前英伟达力挺美光科技重返HBM堆叠式内存市场的原因，当时该市场由三星和SK海力士垄断。美光为2023年11月发布的“Hopper Ultra”H200加速器提供了全部HBM容量，这帮助美光获得了巨额利润和快速的投资回报。

我很好奇与相干公司合作的“光网络产品”未来会是什么，也想知道为什么 Lumentum 的新闻稿里没有明确说明这一点。（或许它原本就应该这么说？）不过没关系。它们之所以引人注目，是因为它们有相似之处，甚至有些重叠。

可以肯定的是：英伟达目前还有其他诸多投资，因此很难同时收购 Lumentum 或 Coherent。截至本文撰写之时，Lumentum 的市值在过去一年中上涨了 10.7 倍，达到 501 亿美元（截至上周五收盘）。对于一家过去 12 个月销售额仅为 21.1 亿美元、净利润仅为 2.516 亿美元的公司来说，这样的表现相当不错。Coherent 过去 12 个月的营收为 63 亿美元，净利润为 3.31 亿美元，截至上周五下午，其市值为 485 亿美元（同比增长 3.8 倍）。更重要的是，如果英伟达试图通过收购这两家公司中的任何一家来实现垂直整合，都可能引发全球反垄断机构以及其主要客户——包括未收购的那家公司——电信和服务提供商的强烈抗议。

Lumentum 和 Coherent 可以为 Nvidia 提供诸多帮助。首先，正如 CPO 已被添加到 Quantum-X InfiniBand 和 Spectrum-X 以太网横向扩展网络（特别是其交换机 ASIC）中一样，我们认为最终也必须将 CPO 添加到 Nvidia 的 GPU 计算引擎和 NVSwitch 中。即使 Nvidia 在机架中加入了中板，以取代目前在其“Oberon”NVL72 机架中使用的所有铜缆，情况依然如此。GPU 的带宽迟早会提升，而 GPU 边缘的物理空间不会增加——事实上，多芯片插槽反而加剧了计算和缓存面积与插槽周长之比这一问题，而不是改善。

我们理解英伟达尽可能推迟发布的经济和技术原因，近年来，我们在许多报道和网络研讨会中都探讨过这些原因。

Lumentum 和 Coherent 还有另一个引人注目之处：它们都采用了光路开关。这意味着，如果英伟达在其扩展网络中采用光路开关作为骨干，理论上，通过对其 AI 集群拓扑结构进行一些调整，就可以构建一个容量更大、能效更高的 NVSwitch 内存域。

Lumentum 的 R300 光路开关基于与 Google 在其“Palomar”MEMS 器件中采用的相同的微机电系统 (MEMS) 镜技术。“Palomar”MEMS 器件是“Apollo”光路开关 (OCS) 的一部分，而“Apollo”OCS 是过去四代 Google TPU 系统（准确来说是 TPU v4 到 TPU v7）的骨干。之前的 TPU v1 到 TPU v3 机器采用的是硬连线设计，就像如今 Nvidia 的 GB200 NVL72 和 GB300 NVL72 系统一样。）

光路开关切换设备间特定链路的速度并不快——旋转微镜重新配置连接任意两个设备的任意两根光纤之间的链路需要几十毫秒的时间。对于需要频繁进行动态存储器重配置的交换存储器架构来说，这个速度太慢了。

但是，遗憾的是，对于人工智能集群的内存结构的核心——网络的最顶层——并没有太多理由经常改变它。事实上，谷歌拥有一个 3D 环面网络，可以将 9,216 个“Ironwood”TPU v7p 计算引擎聚集到一个共享内存域中，并且通过旋转几个镜像，它可以将其分割成更小的块，并出售更小的 AI 超级计算机来运行较小的工作负载。

关键在于，网络配置更改频率极低，网络主干链路采用光纤传输，光信号直接在光纤间反射，无需像以太网或InfiniBand交换机那样进行光电转换（无论是在交换机外部的收发器还是内部的CPO中）。如果没有光路交换机，就无法避免这种功耗。

但如果您拥有像 Lumentum 去年三月发布的 300x300 端口 R300 这样的 OCS 交换机（目前已向多家超大规模数据中心和云平台提供商提供样品），那么在拥有 10 万个 XPU 的 AI 集群系统中，您可以将整体网络功耗降低 65%。（这是 Lumentum 声称的。）电力和时间一样，都是金钱。延迟也是如此。Lumentum 表示，OCS 交换机的延迟比以太网交换机低 5 到 10 倍。（前提是设置完成。）以下是 Lumentum OCS 交换机的外观：

Coherent公司刚刚开始交付一款基于液晶技术的OCS交换机，目前已有七家客户正在进行试用。这款数据中心Lightwave交叉连接（DLX）交换机提供64x64端口、320x320端口和512x512端口三种版本。以下是DLX OCS交换机的外观：

Nvidia 可能正在敲定激光器的供应协议，但我们强烈怀疑，在“Rubin Ultra”一代的某个时候，当带有铜中板的新型“Kyber”机架推出时，Nvidia 可能会转向环形或蜻蜓互连拓扑结构（而不是当前 NVSwitch 内存结构的完全连接的胖树拓扑结构），并使用 OCS 主干线将它们全部连接起来。

我们认为英伟达希望 CPO 采用多供应商激光器，但从长远来看，它也希望 OCS 设备有两家供应商。

若您对硅光SiGe技术及流片相关话题有更多探讨需求，欢迎添加微信深入交流。

https://www.nextplatform.com/connect/2026/03/02/nvidia-sees-the-light-on-silicon-photonics-and-maybe-optical-switching/4093099

（来源：编译自nextplatform）

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4334内容，欢迎关注。

加星标⭐️第一时间看推送

求推荐

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.