网易首页 > 网易号 > 正文 申请入驻

巨头狂砸7100亿,竟被这个光学部件卡脖子?MEMS-OCS引爆算力革命

0
分享至

在全球八大云服务商2026年资本开支预计冲到7100亿美元,同比再增61%的宏大背景下,一个鲜为人知的技术细节正悄然改写AI数据中心的基础架构规则:谷歌TPU集群、英伟达DGX SuperPOD等顶级AI训练系统中,MEMS-OCS光电路交换机正逐渐取代传统电交换设备,成为承载万卡集群数据洪流的关键枢纽。当AI模型参数从千亿迈向万亿,当数据吞吐需求呈指数级激增,一个根本性瓶颈日益凸显:电子互连的物理极限,已成为制约算力集群规模扩展的“天花板”。


AI的野心,撞上了电子的“天花板”

将AI数据中心比作一个“超级大脑”,算力芯片(GPU/TPU)是密集的神经元,而内部网络则是连接这些神经元的“神经纤维”。在传统数据中心中,这套“神经系统”主要由铜缆和电交换机构成,遵循着“存储-转发”的运作逻辑——数据在每个节点都要经历“停车、调度、再出发”的繁琐过程。这套机制曾完美适配网页服务、云计算等随机性业务负载,却在面对AI训练工作负载时遭遇了根本性困境。



真正的瓶颈源自架构层面。现阶段,AI集群普遍搭载数万块GPU,顶级超大规模系统正朝着数十万GPU的规模演进。在此等体量之下,网络成为决定系统整体性能的核心关键。数据每经过一次电交换机转发,都会产生延迟;每一次光电、电光转换,都会造成额外功耗损耗。伴随集群规模持续扩张,网络数据传输能耗,已从常规运营细节,转变为核心设计约束条件。

电交换的物理极限清晰可见:电阻导致的信号衰减与热损耗、电容效应限制的频率与带宽、高功耗带来的散热难题。在大型AI部署场景中,网络设备功耗在整体能耗占比中愈发突出。传统方案需要进行光变电、电变光的繁琐转换,不仅产生损耗,还带来高功耗。微软、谷歌、亚马逊、META这四大巨头为了抢算力,疯狂上修资本开支:微软2026财年预计砸1900亿美元,谷歌单季度就花357亿美元,META把全年预算区间抬到1250-1450亿美元。这么多钱砸下去,光互联是绕不开的——因为电信号传输在带宽和距离上已经有硬瓶颈,只有光互联能撑住AI集群的胃口。

从“电子拥堵”到“光子高速”:OCS的工作原理精解

在这一背景下,基于微机电系统(MEMS)的光电路交换技术(OCS)应运而生,扮演起数据中心“光之关节”的角色。MEMS-OCS通过微镜阵列实现光路切换,其工作方式堪称优雅:在OCS系统里,光信号从一个端口进来,碰到一个布满微型反射镜的“矩阵”。这些镜子特别灵活,能快速调整角度,把进来的光信号精准地“弹”到指定的输出端口上。这样就建立了一条点对点的光路通道。

最大的革命性在于:数据全程都在光路上跑,完全不用转成电信号。这就直接打通了端到端的连接,把传输延迟压到了最低。传统方案好比“在每个路口停车、调度、再出发”,而OCS则是“在枢纽处为数据流瞬间建立一条直达的空中光缆”。这种机制完美匹配了AI算力集群对高速互联的需求。

具体而言,MEMS-OCS的结构复杂精密,是一组由指定数量平面镜所构成的微镜阵列,可用于精确调节光链路的折射方向,实现光链路之间的信号切换与双向传播,提高运算系统的整体性能及稳定性,同时降低系统成本与功耗。相比传统电子交换机,MEMS-OCS可降低数据中心网络的延迟、功耗及部署成本,提升系统稳定性。以Lumentum的R300交换机为例,对比传统以太网交换机性能,OCS展现出压倒性优势。

为何是AI训练的最佳拍档?OCS的不可替代性优势

极致带宽与无限潜力

OCS最大优势之一是协议透明性,简单说,它不挑食,现在400G、800G的链路能用,未来升级到1.6T,也不用换硬件本身,直接兼容。光信号作为信息载体,单根光纤就具备巨大带宽潜力,而OCS能够轻松支持成百上千个这样的高速通道并行。光模块速率迭代周期从4年翻倍缩短到2年翻倍,迭代速度直接翻倍:以前从40G到400G,差不多每4年速率翻一倍;但2023年AI元年之后,节奏彻底变了:400G到800G只用了一年,接下来1.6T、3.2T已经在路上。OCS完美适配这种加速迭代节奏,从容应对AI训练中参数同步、梯度聚合产生的大规模连续数据流。


纳秒级超低延迟

由于免去了光电转换和分组处理,OCS的延迟主要由光路物理长度和微镜切换时间决定。传统电交换机的速度都是纳秒级的,而OCS通过直接光路连接,彻底消除转换延迟。这种极致低时延对于减少AI训练迭代时间至关重要——在数万GPU协同训练的场景中,微小的延迟经过集群级放大,可能导致训练效率大幅下降。

极高的能效比

传统可插拔光模块功耗极高——一个800G端口功耗超30W,51.2T交换机总功耗动辄上万瓦,AI集群光电费就能拖垮企业利润。而OCS去除电子转发环节,AI算力集群整体功耗可降低30%以上。谷歌的实际应用已经看到了明显好处:他们的TPU集群互连功耗直接降了40%!这种无电阻热损耗带来的根本性节能优势,在应对“功耗墙”方面展现出革命性价值。

简化的网络架构

传统数据中心沿用胖树、克洛斯拓扑等多层级电交换架构,靠的是好几层电交换机(通常2-3层)把GPU或TPU这些计算单元连起来。问题在于,规模越大,耗电和成本就涨得越吓人,几乎是成倍往上翻。OCS提供了一个新思路:用它直接替换掉最顶层、最核心也最耗电的那部分“主干”电交换机。这样一来,整个互连架构就简化成了单层的光连接。

不是独奏,而是协奏:OCS在光互联生态中的定位

OCS并非独立的技术孤岛,而是构成下一代数据中心光互联骨架的关键组成部分。在技术演进图谱中,从可插拔光模块到CPO(共封装光学)、硅光技术,再到OCS,形成了完整的“短-中-长”距离光互连解决方案。

与CPO的精密配合

CPO将光引擎核心和交换芯片/AI芯片用2.5D/3D封装技术“焊”在同一个基板上,让电信号传输距离直接从厘米级缩短到毫米级。而OCS则是在机架或集群层面,负责连接这些搭载CPO的交换节点或计算节点。CPO解决的是芯片级、机箱级的短距离光电转换效率问题,而OCS解决的是机架间、集群级的中长距离光路交换问题。两者形成“短距CPO + 中长距OCS”的高效组合,英伟达CPO方案把端口功耗从30W压到9W,谷歌TPU集群用CPO架构后,功耗仅为传统交换机的5%。


与硅光技术的深度融合

硅光技术实现的高度集成化、低成本化光收发组件,为OCS提供更稳定、更经济的光信号源与接收端。天孚在CPO领域的业务主要聚焦于三块:FAU、光引擎组件,以及ELS模组,这些核心组件为光互连系统提供了底层支撑。根据2025年底的规划,原预计CPO将在2026年第三季度量产,目前计划已推迟一个季度,CPO商用化生产预计在2026年第四季度启动。

技术格局的双轨并行

一个有趣的观察是,未来技术格局可能是“国内用OCS,海外用CPO”的双轨并行可能性。这种分化源于不同市场对技术路线和供应链安全的差异化考量。Lumentum在OFC2026大会上预测,到2030年,涵盖可插拔光模块、CPO和OCS的AI光通信总潜在市场将从2025年的180亿美元飙升至900亿美元,年复合增长率高达40%。

光的征途,不止于AI

在AI驱动算力基础设施变革的宏大叙事中,MEMS-OCS以其契合物理本质和业务需求的特性,从一种备选方案变为关键路径。它不仅是解决当前瓶颈的“关节”,更是构建未来算力网络“骨架”的核心技术。

据CignalAI预测,到2029年OCS市场空间将超过16亿美元。随着OpenAI、深度求索、微软、谷歌等人工智能公司引发大模型、AI算力需求,以OCS为代表的各类MEMS光学器件将迎来更加广阔的市场前景。2023年,全球光交换机领域的前沿探索者与领导者——谷歌公司采用MEMS-OCS取代传统交换机,实现了低延迟、全速率兼容的无阻塞交换,还能进行动态拓扑重构和集中式软件定义网络控制。

但光的征途远不止于此。除了超大规模AI训练集群,OCS技术在高性能计算、金融交易系统、电信核心网乃至未来的沉浸式元宇宙基础设施中,都蕴藏着巨大潜力。5G网络、物联网、大数据、云计算等技术迅速发展,对高速、大带宽、低损耗通信方式的需求不断增加,MEMS-OCS作为光通信网络的核心器件,可广泛应用在光通信系统中的光网络保护、光路实时监控、光纤测试、光器件测试、光传感、光分插复用、光交叉连接设备等领域。

随着技术成熟和规模应用,OCS是否会遵循类似光模块的发展轨迹,从高端数据中心逐步走向更广泛的应用领域,实现从“贵族”到“平民”的普及?这场关乎算力时代基础设施主导权的竞赛,才刚刚拉开帷幕。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
里克尔梅:老佛爷是皇马历史最好的主席,但皇马需开启新周期

里克尔梅:老佛爷是皇马历史最好的主席,但皇马需开启新周期

懂球帝
2026-05-24 20:40:46
克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

克雷桑2球,难救韩鹏昏招!山东泰山郁闷1战,战蓉城:又要惨败?

话体坛
2026-05-24 22:20:38
耐高总决赛排面拉满!郭士强+各领导现身,男女篮众多球星观战!

耐高总决赛排面拉满!郭士强+各领导现身,男女篮众多球星观战!

篮球资讯达人
2026-05-24 19:40:31
怀疑丈夫和自己闺蜜有暧昧关系 吉林一女子殴打正在住院的闺蜜头部 致其昏迷20多天后死亡

怀疑丈夫和自己闺蜜有暧昧关系 吉林一女子殴打正在住院的闺蜜头部 致其昏迷20多天后死亡

闪电新闻
2026-05-23 20:39:14
娶自己老师当老婆,婚后的生活是什么样的?我来告诉你们吧

娶自己老师当老婆,婚后的生活是什么样的?我来告诉你们吧

千秋文化
2026-05-22 18:33:07
杨瀚森又练出8块腹肌!美媒却建议为补强弃他:模拟4换1墨菲方案

杨瀚森又练出8块腹肌!美媒却建议为补强弃他:模拟4换1墨菲方案

颜小白的篮球梦
2026-05-24 17:46:26
网友们这几天都在吃著名毛巾集团洁丽雅的瓜,讽刺其家族“丑闻”

网友们这几天都在吃著名毛巾集团洁丽雅的瓜,讽刺其家族“丑闻”

网络易不易
2026-05-17 12:29:12
终极12人确定,杨瀚森强势回归,阵容升级冲击奥运

终极12人确定,杨瀚森强势回归,阵容升级冲击奥运

谢纶邮轮摄影
2026-05-24 12:41:05
内存涨价彻底带崩PC!4月显卡出货暴降41%:真没人装机了

内存涨价彻底带崩PC!4月显卡出货暴降41%:真没人装机了

快科技
2026-05-22 11:03:19
官方通报“都溪林场家属小区马匹受惊致一女童死亡”

官方通报“都溪林场家属小区马匹受惊致一女童死亡”

界面新闻
2026-05-24 22:33:16
11岁夏洛特公主涂蓝指甲油遭网暴,王室发声

11岁夏洛特公主涂蓝指甲油遭网暴,王室发声

时光慢旅人
2026-05-25 01:06:02
汪峰和4个孩子合体音乐会!醒醒弹琴落落大方,3个女儿3个母亲

汪峰和4个孩子合体音乐会!醒醒弹琴落落大方,3个女儿3个母亲

林大师热点
2026-05-24 22:59:33
西红柿立大功!研究发现:每天半杯番茄汁,显著降低身体炎症水平

西红柿立大功!研究发现:每天半杯番茄汁,显著降低身体炎症水平

思思夜话
2026-05-24 21:47:58
大陆警告后24小时内,美国表态支持增强台湾实力

大陆警告后24小时内,美国表态支持增强台湾实力

花颜蕴韵
2026-05-24 21:06:07
俄罗斯突然发出警告,一大批西方武器装备,正在中国周边急速扩张

俄罗斯突然发出警告,一大批西方武器装备,正在中国周边急速扩张

小杨侃事
2026-05-25 05:05:12
收割机不去湖北上热搜,当地被曝出现不少拦车现象

收割机不去湖北上热搜,当地被曝出现不少拦车现象

映射生活的身影
2026-05-24 16:20:26
我在国安局工作20年,抓过很多间谍,但有一个让我终身难忘

我在国安局工作20年,抓过很多间谍,但有一个让我终身难忘

千秋文化
2026-03-06 20:59:14
高调、铁腕、野心勃勃 徐留平任上落马

高调、铁腕、野心勃勃 徐留平任上落马

中国经济网
2026-05-23 22:01:42
“猫都不敢这样爬!”深圳两名女孩爬上高楼天台横梁,物业回应

“猫都不敢这样爬!”深圳两名女孩爬上高楼天台横梁,物业回应

都市快报橙柿互动
2026-05-24 21:10:09
武汉22岁大学生和同学摆摊卖菜,有人开车20公里赶来!出摊时间不固定,“连抢三次没抢到”

武汉22岁大学生和同学摆摊卖菜,有人开车20公里赶来!出摊时间不固定,“连抢三次没抢到”

极目新闻
2026-05-24 22:27:31
2026-05-25 07:00:49
Thurman在昆明
Thurman在昆明
一个被唠嗑耽误的时尚设计师
179文章数 2122关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

游戏
艺术
本地
手机
家居

魔兽世界:时光服团本难度争议再起,玩家疯狂diss,该加强吗?

艺术要闻

他把葡萄画成了美少女

本地新闻

用云锦的方式,打开江苏南京

手机要闻

iPhone 20周年纪念款渲染图出炉:曲面屏加持,配置规格更激进了

家居要闻

低调传承 温润沉静

无障碍浏览 进入关怀版