公众号记得加星标⭐️,第一时间看推送不会错过。
英伟达支持的法国初创公司Scintil Photonics周三表示,已开始向客户提供激光芯片进行测试。
Scintil是众多致力于研究如何利用光脉冲而非电信号在人工智能服务器(例如Nvidia和AMD生产的服务器)内部传输信息的初创公司之一。这项技术有望简化将多个芯片连接起来组成一台大型计算机的难度。分析师预计,Nvidia将在下周于硅谷举行的开发者大会上公布更多关于这项名为“共封装光学”的技术计划。
所有光学系统都依赖激光芯片来产生承载信息的光束,而这些芯片由一种名为磷化铟的特殊材料制成,主要用于长距离通信网络,但目前的产量不足以满足人工智能数据中心的需求。正是由于这种供应状况,英伟达在本月初分别向两家最大的激光芯片制造商 Lumentum 和 Coherent 各投资了 20 亿美元。
Scintil 去年从英伟达获得了 5800 万美元的融资,该公司找到了一种方法,可以将磷化铟激光器与光通信所需的其他一些元件封装到单个芯片中,并与以色列的 Tower Semiconductor 合作,后者是其制造合作伙伴。
Scintil公司首席执行官马特·克劳利表示,该公司正在与“六七家公司”洽谈,这些公司希望在2028年前使用其技术,但他以保密协议为由拒绝透露这些公司的名称。他还表示,Scintil的目标是到那时能够每月生产数十万枚芯片。
克劳利在一次采访中说:“我们的生产方式从根本上来说是不同的。我们可以大规模生产……而且我们可以满足很大一部分市场需求。”
在官方新闻稿中,该公司表示,随着人工智能系统从单机架扩展网络系统扩展到包含数千个人工智能处理器的多机架配置,铜互连在速度、密度和传输距离方面已达到极限。未来的扩展网络需要一种光架构,能够在更低功耗下提供更高的带宽密度,并最大限度地利用处理器。DWDM共封装光器件正逐渐成为扩展网络的必然架构,但其普及应用需要技术验证和量产方案。LEAF Light的开发商Scintil Photonics今日发布了LEAF Light评估套件(EVK),LEAF Light是业界首款用于人工智能基础设施的单芯片DWDM激光器,该套件使符合条件的客户能够在自身环境中验证这项技术。
LEAF Light 的目标是比单波长 CPO 降低 50% 的功率。它通过更简单、误码率更低的信号传输方式来降低尾延迟,无需复杂的 FEC。此外,它通过波复用而非更高的波特率、复杂的调制方案或额外的光纤来扩展光纤容量,从而在每个环节都保持了功率效率、低延迟和信号完整性。
LEAF Light是首款从实验室验证阶段过渡到面向客户的评估项目的单芯片DWDM激光器。EVK提供了一条从技术验证到ELSFP模块集成的标准化路径。
EVK预计将于2026年第二季度上市,部分符合条件的客户可提前体验。Scintil公司完成的5800万美元B轮融资(NVIDIA参投)反映出人工智能基础设施领导者与基于DWDM的光架构之间日益紧密的合作。
据介绍,LEAF Light EVK 是一款评估系统,包含两个 LOSA(激光光子组件),每个 LOSA 都包含一个带有光纤接口的 LEAF Light 芯片,每个 EVK 共提供 8 根光纤。该平台兼容 8 波长和 16 波长 LOSA,提供完整的评估环境,包括工作温度控制、单激光器电流调节以及智能频率间隔控制,以满足严格的 200 GHz 或 100 GHz 网格要求。独特的板载反馈回路可同时控制所有通道的波长精度和功率均匀性,无需人工干预即可找到并保持最佳工作点。
无论是在独立模式下还是通过 USB 连接的用户界面,客户都可以评估以下高级智能功能:
WaveGuard:片上频率监控和精确微调功能,可在温度变化、老化和封装应力等条件下,将DWDM通道间距维持在严格的公差范围内。
每波长功率监测:主动控制确保所有波长的输出功率均匀性,即使针对频率精度调整各个激光器的电流也是如此。
运行遥测:实时监测输出功率、温度和其他系统参数,提供持续的参考基线,以便在系统的整个生命周期内检测和纠正偏差,并实现高效的激光源群管理。
这些功能体现了 LEAF Light 作为智能激光光源的设计理念,其架构中内置了片上数字控制和监控功能。
EVK 的模块化架构支持 LOSA 可升级性,使客户能够评估后续产品变体,并在网络架构演进过程中为 ELSFP 模块提供持续的验证和集成路径。
Scintil Photonics 首席执行官 Matt Crowley 表示:“人工智能系统的瓶颈已从计算转移到网络,而 DWDM CPO 只有像生产基础设施一样运行才能实现规模化。LEAF Light EVK 将这种验证交到客户手中:波长锁定、功率控制、固件驱动控制、实时遥测,因此团队可以在真实条件下验证稳定性和延迟性能,并在大规模部署之前使用 ELSFP 模块构建大型人工智能系统验证。”
EVK 的评估能力背后,是一个从一开始就为大规模生产而设计的技术平台。
“SHIP旨在解决DWDM技术发展中一直存在的精度难题:在半导体制造工艺上实现每个芯片波长精度的一致性,而这是传统激光器组装工艺无法比拟的。如今,这一精度已在200mm生产线上得到验证,”Scintil Photonics首席技术官兼创始人Sylvie Menezo表示。“将这一基础与片上监控和反馈相结合,便形成了一个技术平台,客户可以立即对其进行验证,并通过ELSFP实现批量部署。”
他们进一步指出,SHIP技术已在Tower Semiconductor的硅光子器件生产线上得到验证,目前已开始200mm规格的生产。此次代工厂合作将使Scintil与Tower的合作关系能够实现大规模、超大规模的部署。
EVK 旨在验证 ELSFP 模块在产品成熟时将提供的功能:固件驱动的控制、运行可观测性和系统就绪集成,所有这些都在批量承诺之前通过客户评估周期进行验证。
与此同时,备受关注的Ayar Labs和lightmatter也都公布了最新进展。
Ayar Labs 利用 Wiwynn 将 1024 个 GPU 集成到一个光子机架系统中
如果你认为英伟达或AMD的72GPU机架系统已经非常庞大,那么硅谷Ayar Labs正在研发的规模更大的产品将会更加惊人。
周三,这家硅光子学初创公司透露,它正在与 ODM 合作伙伴 Wywinn 合作开发一种新的机架级参考平台,该平台能够将超过 1024 个 GPU 拼接成一个统一的系统。
更重要的是,对于数据中心运营商而言,用于连接这些 GPU 的光互连不需要为 600 多千瓦的机架供电和冷却。
相反,参考设计预计每个机架的功耗在 100 到 200 千瓦之间,与目前的机架系统相当。为了达到 1024 个加速器的目标,这两家公司只需增加机架数量即可,而使用 AMD 和 Nvidia 最新系统中使用的铜互连技术,目前还无法实现这一点。
“看看现在的机架,你不得不把所有东西都放在一个机架里。你不得不把GPU放在那里,你不得不把CPU放在那里。你不得不安装交换机,因为铜缆无法满足你的需求,”Ayar首席技术官Vladimir Stojanovic在接受El Reg独家采访时表示。
铜线是导致机架(例如英伟达的600 千瓦Vera Rubin Ultra 系统)温度不断升高的原因之一。在这些互连线路的高速传输下,铜线在不造成信号衰减的情况下只能传输几英尺,而传统的可插拔光模块效率太低,无法实际应用。
Ayar 旨在通过将光器件与计算器件共同封装来规避这个问题,与可插拔器件相比,大幅降低功耗,同时将传输距离和带宽提高至多 3 倍。
去年秋季的超级计算大会上,我们得以一窥这些加速器的雏形。展出的原型机是与Alchip合作设计的,它配备了八个Ayar公司的TeraPHY光引擎,带宽超过100Tbps。
但是,在部署这样的芯片之前,你需要一个放置它的地方。
“我们希望把这里的每一个细节都敲定,因为归根结底,超大规模数据中心运营商的采购单位可以说是一个机架,我甚至认为可能是一个集群,”斯托亚诺维奇说。
与普通的 19 英寸服务器机箱相比,机架式系统要复杂得多。例如,英伟达的液冷 NVL72 系统就包含数英里的线缆和数十个用于网络、电源和散热的盲插连接器。在将所有这些组件封装在一个可靠且易于维护的机箱中就已经非常困难了,更何况还要考虑光子技术。
斯托亚诺维奇解释说,光子技术的引入带来了新的设计决策,例如液冷系统的管路布置。“冷水流入时,首先冷却什么?其次冷却什么?”
“如果你查看最初的 ELSFP(激光模块)规格,就会发现它原本就不是为液冷环境设计的。”
另一个需要考虑的因素是软件管理和监控。共封装光学器件普及的一大障碍是其爆炸半径增大。使用可插拔收发器时,可以更换故障的光学器件,但如果光引擎损坏,则整个芯片都会损坏。
因此,软件监控和遥测对于缩小潜在问题的范围至关重要,以确定问题究竟是出在光学元件上,还是另有其他因素。为此,除了机械设计之外,Ayar 还与 Wiwynn 合作,利用其芯片上的嵌入式固件。
![]()
El Reg提前看到了参考设计图,该设计图似乎采用了两个光互连加速器和一个单 CPU。系统前端配备了 16 个 Ayar 的用户可维护 SuperNova 激光模块,以及大量超大规模数据中心风格的前置网络接口。
我们见过的英伟达和AMD的计算刀片相比,参考设计的密度大约只有它们的一半,但由于它使用了光互连,所以密度不必那么高。
Ayar 的方案并非使用 18 个刀片服务器通过超短铜缆连接,而是可以将数百个这样的系统连接起来,形成一个庞大的逻辑服务器。更重要的是,由于不受铜缆互连的限制,这些机架无需集成所有交换、计算和存储功能。
“这样就可以采用解耦式架构,你可以将一个机架整体构建为计算机架,然后还可以构建另一个机架作为交换机机架,当然,你还可以构建一个扩展内存机架,”斯托亚诺维奇说道。
就在 Ayar 完成5 亿美元 E 轮融资以加速其共封装光学器件大规模生产仅仅一周后,以及这家初创公司与 Global Unichip Corp (GUC) 合作开发基于其光 I/O 芯片的参考设计近六个月后,该公司周三宣布了这一消息。
这家初创公司与 Wiwynn 的合作现在着手解决等式的另一边:芯片准备就绪后应该放在哪里。
Lightmatter最新的光子学技术将使数据中心的光纤成本减半
光子学初创公司 Lightmatter 表示,其最新的光引擎可以将现代数据中心使用的光纤量减少一半,而且更重要的是,它不需要通过共封装来实现这一点。
Lightmatter公司于周三OFC展会前夕发布了其Passage L20光模块,该模块专为高性能扩展型交换机和GPU等加速器而设计。与Nvidia或Broadcom在其部分最新交换机中将光模块直接集成到交换机ASIC中的做法不同,L20针对近封装集成进行了优化。
在这方面,光学引擎介于传统的可插拔模块和 Lightmatter闻名的更复杂的光子中介层和共封装光学器件之间。
“许多超大规模数据中心运营商对2027年左右的近封装光模块(NPO)解决方案非常感兴趣,”首席执行官尼克·哈里斯告诉El Reg。“有些人——我不知道他们的想法是否正确——担心将光引擎集成到GPU或交换机中,他们希望在将其集成到内部之前,先看到它独立存在且就在附近。”
这种担忧源于这样一个事实:共封装光学器件需要将光子器件永久连接到逻辑电路上。仅仅一个芯片出现故障就可能导致整个GPU形同虚设。NPO通过将光子器件置于封装之外来规避这个问题,但其距离仍然比可插拔收发器更近。
Lightmatter 表示,该芯片可以直接集成到交换机板上,或者作为模块化夹层卡连接到距离交换机或计算芯片最多几英寸的位置。
NPO 是通往 CPO 和光纤中介器的一条迂回路线,哈里斯认为它不会长久。
“我认为近封装光学器件的发展路线图不会太长,因为CPO(复合封装光学器件)肯定会到来,我们预计它将在2028年实现大规模量产,”他说道。“这将是光引擎和收发器最后一次不属于GPU研究的范畴。”
Lightmatter 此前发布的中介层和 CPO 光子技术肯定比 Passage L20 更强大,但无论 Harris 的预测是否成真,该公司都在积极布局,以利用市场对 NPO 产品的需求,而且该技术肯定比可插拔技术具有优势。
一条 6.4 Tbps 的 L20 光纤通过铜缆连接到 ASIC,信号在 ASIC 中被分成多达 32 根光纤,每根光纤都能够以 200 Gbps 的速率进行双向传输。通常,可插拔模块每个通道每个方向都需要一根光纤。而 L20 的每根光纤都是双向的,可以同时承载上行和下行链路信号。
“我们认为双向光纤技术极其重要,”哈里斯说。“看看Meta公司最近与康宁公司达成的协议。他们花了60亿美元,而原本只需要30亿美元。双向光纤技术可以将光纤数量减少一半。”
只需 16 个 L20 就足以取代 102.4 Tbps 交换机中的 512 个 200 Gbps 可插拔设备,同时还能大幅降低功耗。
可插拔模块,尤其是高带宽模块,并非最节能的,每个模块的功耗可能超过 10 瓦。相比之下,Lightmatter 表示,每个 L20 的额定功耗为 30 瓦。
Lightmatter 预计将于 2026 年底开始提供 Passage L20 芯片的样品。
除了其 NPO 硅光子产品外,Lightmatter 还推出了一种名为 vClick 的表面附着光纤阵列,该阵列与台积电的 CoWoS-S 或 CoWoS-L 等先进封装技术兼容。
据哈里斯称,共封装光学器件面临的挑战之一是,先进封装工艺(如模具或研磨)会遮蔽芯片的顶层。
他解释说,虽然仍然可以使用边缘连接器,例如 Lightmatter 的 eClick,它可以通过先进的封装技术将光传输到芯片边缘,但在封装之前对其进行测试和验证更具挑战性。
他解释说:“vClick 的真正优点在于它可以让光从晶圆表面发出,这样你就可以在将所有内容切割和封装到基板之前,在晶圆级别测试组件。”
这就是为什么许多CPO设计采用标准封装,其中光引擎通过基板上的铜线进行通信。虽然这种方式更简单,但却限制了带宽潜力。
“先进的封装技术可以实现更高的带宽密度,因为线路不会进入 PCB 或有机材料中,而是留在硅内部,”哈里斯说。
至少对于 Lightmatter 而言,vClick 为改进测试和验证流程铺平了道路,旨在防止有缺陷的光子器件将 XPU 变成废铁。
若您对硅光SiGe技术及流片相关话题有更多探讨需求,欢迎添加微信深入交流。
(来源:半导体行业观察综合)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4343内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.