最近身边好几个做数据中心硬件的朋友都在聊NPO。不是那种刷屏的 hype,是真在拆板子、测热、改PCB。他们说,原来以为CPO才是“未来”,结果2026年第一批AI机柜下单,清一色选了NPO。不是因为便宜,是因为“能按时装进去,坏了还能换”。
CPO听着很酷——光直接焊在交换芯片上,带宽拉满,功耗压低。但实际产线上,良率卡在60%出不来,TSV穿孔漏电,微凸点一压就歪。有家代工厂跟我说,一条CPO封测线投了两个亿,半年只流了800颗片。而NPO用的还是大家熟得掉渣的HDI叠层板,贴片机照常跑,工人不用重新培训,良率从第一周72%直接干到第四周91%。
光引擎能插能拔,这点真被低估了。CPO方案里,光模块和芯片焊死,风扇一停、温度一飘,整颗Chiplet就废。NPO不是“退回可插拔”,是把光的部分单独拎出来,像换内存条一样换。阿里云一个运维大哥给我看维修单:上个月换3块CPO交换板,报废2颗博通Tomahawk芯片,成本够买5个NPO光引擎。他补了句:“我们不赌技术多牛,只赌别半夜三点爬起来重启机柜。”
供应链也现实。CPO核心光芯片得等硅光IDM排期,旭创、源杰的CW激光器一月能供3万颗,但博通的CPO交换芯片交货周期拉到26周。NPO把光和电拆开——你用Marvell的芯片,我插旭创的光引擎,接口协议一统,谁也不卡谁脖子。国产厂商反而在这段窗口里把硅光芯片良率干到了90%以上,功耗压进12W,比两年前低了快一半。
现在真正推NPO的,不是光模块厂,是云厂商自己。谷歌2025年底内部评估报告写了句大实话:“CPO交付节奏跟不上GPU集群上架速度。”他们宁可先用NPO跑满12.8T,等Rubin Ultra真落地了,再分批替换。微软那边连测试方案都改了:NPO直接进OAM标准,CPO暂列“长期预研项”。数据也实打实——2026年NPO出货量预估1.8万台,CPO约1.3万台,差额全来自AI训练柜内部互联。
旭创的变化挺有意思。以前他们卖的是OSFP模块,现在得管整块光互联板的热设计、阻抗匹配、信号回流路径。泰国工厂产线刚切完,台湾封测线同步配齐,不是为了炫技,是客户要求“光引擎插上就能跑满速率,不用调参”。他们硅光双芯片方案其实早就在路上,良率爬升比预期快,不是靠堆设备,是把封装误差控制到±5微米内,靠的是产线老师傅盯每一块板。
有人问,这不就是换汤不换药?不是。以前光模块插在机柜外,速率上不去就加模块、堆线缆;现在NPO把光引擎嵌进机柜背板,信号走10厘米而不是3米,眼图张得开,误码率稳在10⁻¹⁵以下。这不是参数调出来的,是物理距离缩短带来的实打实收益。
6.4T需求已经到了。不是PPT里的数字,是客户真拿来算过:用NPO,单机柜算力密度提升17%,电费省8%,故障平均修复时间从4.2小时压到37分钟。没人再提“过渡”,因为过渡期已经过了。
技术没有高低,只有适不适合。CPO还在解决“能不能做出来”,NPO已经解决“能不能天天用”。
NPO不是CPO的备胎,是现在唯一能稳稳插进机柜里的那块板。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.