公众号记得加星标⭐️,第一时间看推送不会错过。
我(指代本文作者Geoff Tate,下同)在洛杉矶参加了为期数天的2026年光纤通信大会(OFC)。现场人山人海,气氛热烈。许多老与会者都注意到,短短几年内,电信领域的人工智能已经迅速向数据中心领域转移。
英伟达GTC 2026大会与GTC大会同期在圣何塞举行。OFC和GTC紧密相连,因为数据中心人工智能需要光互连来维持计算资源的供应。
光互连技术通过跨洋和跨洲的高带宽光纤连接,使互联网得以实现。此后,光互连技术已取代光纤,成为数据中心横向扩展链路的主要方式。所有架空机架上亮黄色的线缆都是光纤。
我们即将迎来更多变革,未来五年内,数据中心内所有高带宽数据互连都将实现光纤化:
共封装光器件 (CPO) 将取代可插拔收发器以实现横向扩展;
CPO 将使机架内的所有链路从铜缆迁移到光纤,以实现规模化扩展;
光路开关 (OCS) 将补充甚至可能减少硅开关在横向、纵向和横向扩展互连中的应用,从而在更低的功耗下提高可靠性和性能。
激光器是所有光互连的核心。
数据中心人工智能需求持续呈指数级增长
推理是人工智能发展的驱动力。ChatGPT 开启了这场革命。人工智能正在不断演进,变得越来越有用,计算需求也呈指数级增长。Anthropologie 和 OpenAI 的年收入都达到了约 250 亿美元,而它们在短短几年内就从零增长到如今的规模。大多数公司仍处于人工智能学习曲线的早期阶段,随着它们不断提升自身能力,增长速度将会加快。
在3月份的GTC 2026大会上,英伟达CEO黄仁勋透露,推理需求正呈指数级增长。去年,英伟达的AI计算订单积压额为5亿美元。如今,这一数字已高达1万亿美元。与此同时,Anthropic和OpenAI的年营收均已达到250亿美元。而占英伟达需求60%的超大规模数据中心运营商正在推动资本支出增长。(这些运营商也在自主研发芯片。)
![]()
随着人工智能从 ChatGPT(一次性人工智能)发展到深度推理再到智能体人工智能,每次查询处理的词元数量已经增长了几个数量级。由于用户缺乏耐心,响应速度也至关重要。
上图 3 所示的帕累托曲线有两个轴:
Y 轴表示每兆瓦 (MW) 每秒的令牌吞吐量。
X 轴表示每位用户每秒的交互令牌数 (TPS)。
如果人工智能的需求主要是批量处理,那么优先级应该是以较低的每用户每秒吞吐量 (TPS) 为代价实现最大吞吐量。但运行代理工作负载的用户需要快速响应,因此高每用户每秒吞吐量才是关键。
全新的 Rubin 架构在所有应用场景下都带来了显著的性能提升。对于最高 TPS/用户需求,Rubin 与 Groq LPX 的集成可带来数量级的提升。超大规模数据中心受限于电力,因此在相同兆瓦功耗下获得 2 倍到 35 倍的吞吐量提升意义重大,这也是他们不断增加资本支出以最高效地满足 AI 需求的原因。
在2025年的GTC大会上,英伟达发布了采用CPO技术的扩展型交换机。在2026年的GTC大会上,黄仁勋宣布CPO将于2028年推出,届时将推出Feynman NVLink 8 CPO交换机用于扩展型连接。不过他也表示,扩展型连接中仍会使用铜缆。或许会为客户提供可选方案,或者对于规模更大的集群,机架内将采用铜缆连接,机架间则采用光纤连接。随着CPO技术的日益普及,其可靠性和可制造性方面的担忧将得到解决。随着带宽的不断提升,CPO技术将在未来几年内取代所有扩展型连接。黄仁勋还谈到CPO技术时表示:“我们需要更大的容量。”(英伟达的CPO技术基于台积电的新工艺制造。)
在2026年OFC展会上,英伟达副总裁Alexis Bjornlin展示了一款GB Blackwell NVL576原型机。从中可以看出,机架内部的连接仍然采用铜缆,但机架之间的连接则改为光纤(黄色光纤线缆)。这或许是大型Rubin和Feynman扩展舱的架构。摩根士丹利近期评论称,英伟达“很可能推出Rubin Ultra NVL144的CPO版本”。
英伟达的 Bjornlin 展示了台积电COUPE(紧凑型通用光子引擎)如何用于英伟达横向扩展光子交换机中的 CPO,以及前面板可插拔激光器。
光学技术如何从长途传输过渡到机架级
Coherent 公司是光学市场的主要长期参与者之一。Sheridan Eng 是该公司的首席技术官。她在OFC上的主题演讲概述了光学技术的发展历程。
![]()
随着带宽和可靠性的提高,以及尺寸、功耗和成本的下降,光通信技术已经从远距离通信转向机架级通信。
![]()
Sheridan Eng 解释说,可插拔收发器在过去二十年中一直是数据中心横向扩展的主力军,数据速率稳步提高(头顶的黄色电缆是光纤)。
![]()
CPO 的发展基于技术的进步,以及对更高带宽、更低功耗、更低成本和更小尺寸的需求,从而实现对 GPU 的光学器件的支持。
![]()
目前为止,采用CPO技术的两大厂商是英伟达和博通。两家公司都已公开表示,他们使用的是台积电COUPE技术,这是一种硅光子CPO解决方案。
Sheridan Eng 解释说,还有其他 CPO 实现方案可供选择,这些方案可能对其他应用有利:GaAs VCSEL 和 MicroLED。
在Scale up中,CPO 将取代可插拔组件
在Scale out中,CPO 将取代铜缆
在2026年光纤通信大会(OFC 2026)上,Meta公司分享了关于横向扩展交换机的最新、全面的可靠性数据,对比了可插拔光收发器和CPO光收发器。他们得出结论:CPO光收发器(至少在他们评估的型号中)比可插拔光收发器更可靠。CPO是一种比可插拔光收发器更简单、机械结构更紧凑的半导体产品。此外,CPO还能减小尺寸和功耗,这些都是显著的优势。
一旦CPO的可靠性得到验证,它将在未来几年内广泛应用,并在横向扩展网络中取代所有可插拔收发器。在纵向扩展网络中,铜缆在高频段的可靠性问题日益突出。随着CPO可靠性被证明优于铜缆,网络将逐渐转向CPO。
在GTC大会上,英伟达展示了CPO技术将于2027/28年引入,用于纵向扩展互连,或许会与铜缆并行使用,也可能最初用于机架间连接。随着CPO可靠性数据的积累,向机架纵向扩展的CPO过渡也将加速。正如英伟达在OFC 2026的论文中所述,“系统的大部分带宽都集中在纵向扩展层”。
众多厂商都在推出CPO技术。博通和英伟达已将CPO技术应用于横向扩展交换机的初始生产阶段,并计划将其用于纵向扩展。其他厂商包括Ayar Labs、英特尔光子学、Marvell(已收购Celestial)和Lightmatter。
Ayar Labs 与台湾的 Wiwynn 合作,在 3 月份的 OFC 展会上展示了一款全 CPO 扩展机架系统。
![]()
如图图所示(见下图),计算托架的特写显示,铜线将不再用于互连,而是用于散热。所有高带宽互连都将采用黄色单模光纤电缆。计算处理器位于中间。两个配备多个光引擎的 AI 加速器位于后方。
托盘前部插有可插拔激光器,用于提供数据传输介质。这些激光器可插拔,以便在发生故障时快速更换,并且配备了备用激光器,以确保在故障修复期间的持续运行。
交换机托架位于机架的顶部插槽中(如上图所示)。
![]()
在OFC展会上,英伟达更详细地介绍了其CPO的工作原理。它基于台积电COUPE平台。
![]()
光子集成电路 (PIC) 采用 65nm SOI SiPh 工艺制造。光信号通过该芯片传输。电光集成电路 (EIC) 采用 7nm FF CMOS 工艺制造。EIC 与 PIC 键合,提供电光接口。它控制环形振荡器的 SiPh 加热器并读取光电探测器。EIC 的尺寸小于 PIC,因此有足够的空间容纳从光引擎 3D 堆叠顶部到 PIC 上光栅耦合器的光路。在 PIC 底部添加带有通孔的铜柱:这些铜柱连接到 AI 加速器或开关的衬底。
![]()
台积电 COUPE 芯片从顶部(如图所示,略微倾斜)引入光线,光线经透镜后通过 PIC 上的光栅耦合器。背面设有金属反射器以减少信号损耗。英伟达的数据显示,在其传输波段(约 1300 至 1320 nm)内,损耗仅为 1 dB。这是针对用于引入单偏振激光的一维光栅耦合器而言的。如果使用二维光栅耦合器引入数据,由于其处理的是未知偏振光(在单模光纤中偏振方向会任意旋转),因此二维光栅耦合器的损耗会更大。COUPE 3D 芯片的电气性能非常出色。
![]()
PIC+EIC 占用约 65mm² 的面积。FAU(光纤阵列单元)或光纤连接器占用约 PIC 的 40% 的面积。光纤束分叉为用于发送/接收数据的 MPO-16 连接器和用于激光光纤的 MPO-12 连接器。
![]()
英伟达展示了其集成在中介层上的CPO光学引擎(OE)。在初期生产阶段,OE位于有机基板上,或者采用NPO(近封装光学器件)配置,位于封装外部,两者之间仅通过短铜线连接。OE越靠近中介层,功耗越低,性能越高,但如果出现可靠性问题,整个中介层都将失效。NPO可以缩小可靠性问题的影响范围,但功耗和性能方面有所欠缺。
在OFC大会上,Nvidia、Intel、Lightmatter等公司就DWDM(密集波分复用)作为下一步发展方向进行了多次演讲。Ayar Labs在上届OFC大会上也展示了这项技术。OCI(开放计算互连)MSA也对此进行了探讨。所有厂商都将使用MRM(微环调制器),它能够实现光子器件的微型化,使其能够安装在CPO(光子器件封装)有限的空间内。
![]()
初始CPO部署可能从单波长或少数波长开始。DWDM将单根光纤上的波长数量增加到2、4、8和16个。并且可能在反向(双向)上再增加2、4、8和16个波长。增加波长会使激光模块更加复杂,增加所需的MRM数量,需要更宽带宽的二维光栅耦合器传输等等,因此,行业可能会逐步从单波长/少数波长过渡到多波长。DWDM的优势在于,一旦所有组件能够大规模协同工作,就能以更低的功率实现更高的带宽。
光路交换技术正逐步渗透到数据中心交换的各个层面
谷歌是光路交换(OCS)技术的先驱。它自主研发了OCS,并将其部署在所有数据中心交换层级的顶端,以取代传统的电子交换机,从而实现更低的延迟、降低40%的功耗并减少资本支出。OCS支持动态可重构网络,能够快速应对故障并优化网络以适应不断变化的工作负载。
谷歌已开始将其 OCS 需求外包给 Lumentum 和 Coherent,这两家公司几十年前就为电信应用开发了 OCS。短短几个季度内,Lumentum 和 Coherent 的 OCS 潜在收入就从 1 亿美元飙升至 4 亿美元。最近,Lumentum 又宣布与一家客户达成了一项价值 10 亿美元的交易。OCS 炙手可热。
![]()
据 CignalAI 称,谷歌早期主导了整个潜在市场规模,但其他超大规模数据中心运营商也开始加入,这将使潜在市场规模超过 30 亿美元。随着应用数量的增加和 OCS 规范的改进,潜在市场规模未来可能会更大。
![]()
谷歌采用了一种独特的纵向扩展架构。每个 TPU 都配备 6 条高带宽链路(铜缆),这些链路构成一个包含 64 个 TPU 的 4x4x4 超立方体。该架构没有交换机,交换功能集成在 TPU 内部。然后,所有机架通过光纤互连连接到 OCS 机架,从而创建一个更大的集群,最多可容纳 9,216 个 TPU。
![]()
由于 pod 的规模如此之大,横向扩展网络的相对规模会缩小,因为绝大多数流量现在都在 pod 内部。
Lumentum 和 Coherent 是 Google 转向外部 OCS 供应以及其他超大规模数据中心运营商日益增长的兴趣的直接受益者。
![]()
Lumentum 的解决方案与 Google 的类似,都采用了 MEMS(微机电系统)镜阵列。这种方法的优势在于插入损耗 (IL) 低于 1.5 dB,并且在 O 波段和 C 波段实现了超宽带传输。O 波段正是 CPO 所采用的波段。超宽带意味着 O 波段内的所有频率都能在插入损耗规格范围内传输,从而支持大量的波长。Lumentum 方案的缺点是体积相对较大,难以缩小尺寸,并且需要许多精密机械步骤,这会影响成本和可靠性。Coherent 则采用了不同的方案,使用液晶,同样也涉及镜面和体积效应。
一位英伟达研究员在OFC大会上谈到了OCS在未来五年内如何在数据中心应用——他强调这只是他个人的观点,并非公司路线图。他认为OCS将在数据中心交换层级结构的各个层面发挥作用。
![]()
![]()
与谷歌一样,英伟达也认为 OCS 在横向扩展中可以提高网络故障的恢复能力,允许重新配置网络以适应新任务,并通过替换 1 或 2 层电气交换机(及其功耗和延迟)来扁平化网络。
![]()
NVIDIA 认为 OCS 能够使大规模扩展部署更加灵活高效。
![]()
OCS要在数据中心快速普及,需要满足以下几个条件:
由于链路预算紧张,OCS 不需要或只需要极低的损耗(放大?)。
提高带宽密度需要每个交换机机架配备数千个 OCS 交换机端口。
采用更少、模块化、可更换的组件的OCS系统,以最大限度地减少爆炸半径
降低OCS成本:减少组件,提高集成度
现有的体积式机械光缆存储解决方案不太可能满足英伟达研究人员的需求。另一方面,超大规模数据中心运营商更倾向于选择成熟的供应商,除非初创公司开发的光缆存储解决方案是某些应用的唯一选择,否则他们通常会从这些供应商处采购。
硅光子技术有望满足英伟达提出的严苛要求。在硅光子OCS交换机中,所有输入光纤都接入光子芯片,由芯片进行交换并将信号输出到所有输出光纤。
该领域共有三家初创公司:iPronics(西班牙瓦伦西亚)、n-eye(美国加州圣克拉拉)和Salience(英国牛津)。每家公司都拥有实力雄厚的团队和差异化的技术方案,如果能够有效执行,便可提供卓越的OCS解决方案。
![]()
Lumentum 在 OFC 上发表了其对各种 OCS 技术的看法。
![]()
这里提到的机器人 OCS 是一种“拾取放置”机器人手臂,可以插拔机架中的收发器电缆,但对于 Google 类型的 OCS 市场来说速度太慢了。
表格中的速度指的是电路切换速度。重新布线部分或全部光路需要多长时间?英伟达表示,在未来五年内,切换速度并非关键指标,但从长远来看,它可能会变得更加重要。固态(波导/SiP)解决方案的切换速度远超现有供应商。
![]()
n-Eye 的数据显示,单个芯片在约 1 微秒内即可完成一个电路的切换。这就是芯片级的切换速度。由于超大规模数据中心运营商购买的是 OCS 设备,因此切换时间还需要考虑控制电路的时间——从向 OCS 处理器发送命令到完成处理,再到控制电路的激活和 Si-Pho 切换所需的时间。
![]()
与iPronics和Salience不同,n-Eye的技术方案采用了MEMS技术。其硅光子器件包含一个交叉波导阵列。激活后,波导的输出层被推至与输入层近乎接触的位置,从而使光以极低的损耗从输入层流向输出层。CMOS芯片提供控制信号来激活MEMS开关。由于损耗极低,他们认为无需放大(尽管Nvidia表示损耗必须为零,即使n-Eye的信号损耗已经非常低,也仍然需要放大)。
n-Eye在OFC上并未展示产品。结果基于原型芯片,产品芯片仍在研发中。
![]()
iPronics 已向客户售出数十台 32×32 OCS 产品交换机,主要客户为超大规模数据中心和电信基础设施巨头。一位康奈尔大学教授展示了一些基于 iPronics 32×32 OCS 交换机的技术成果。
![]()
iPronics(以及 Salience)采用半导体光放大器 (SOA) 进行放大。iPronics 已证明其产品在可插拔收发器和 CPO 所用的 O 波段波长范围内具有出色的宽带性能。这意味着它们有可能与未来最先进的、最大波长的 DWDM 实现方案兼容:需要通过广泛的测试来验证 SOA 在 O 波段的线性度,以确保不会出现因 SOA 非线性而导致的波长混叠。
![]()
iPronics演示了一台可运行的32×32交换机。iPronics还展示了其产品路线图,该路线图计划每年将OCS密度翻一番。
![]()
与 n-Eye 一样,iPronics 也采用了控制电子器件(FPGA 向 ASIC 过渡),该器件在软件控制下控制光子开关的运行。
iPronics 展示了他们正在开发一种模块化 OCS,其外形非常紧凑,可以在 4U 机箱中实现数千个交换机端口(还记得 Nvidia 在第 26 张幻灯片中提出的每个机架数千个交换机端口的要求吗?)。
![]()
![]()
Salience Labs展示了其32×32 OCS交换机(展位上没有演示)。Salience的设计理念似乎更接近iPronics,而非n-Eye。
![]()
前面板有 32 个输入端口和 32 个输出端口。白色线缆顶部用高密度连接器捆扎成束,连接到红色矩形框内的光子开关。输出信号被路由到绿色矩形框内的半导体光放大器 (SOA),然后再返回到前面板的输出端口。散热器下方有一个处理器,用于控制和与数据中心其他部分通信。
OFC 2026 展示了琳琅满目的 OCS 产品选择,所有厂商都制定了雄心勃勃的发展路线图。各厂商有望在最能发挥自身优势的不同细分市场中脱颖而出。
CMOS 高管需要了解光学以及如何将其与光学器件集成。
光通信正在逐步取代数据中心的所有高带宽互连。GPU/XPU、交换机和其他设备将直接与光引擎耦合。光通信系统(OCS)将补充并部分取代现有的硅交换架构。光通信将改变数据中心架构以及数据中心中CMOS芯片的架构。成功的CMOS芯片制造商将学习如何与光通信协同工作,并最大限度地提高其利用效率。
(来源:编译自semiengineering)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4369内容,欢迎关注。
加星标⭐️第一时间看推送
![]()
![]()
求推荐
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.