![]()
3月24日,NVIDIA安全团队一次性甩出2026年开年最重的补丁包。8个CVE编号里,3个高危、5个中危,从模型训练到推理部署全链路覆盖。对跑大模型的团队来说,这相当于自家厨房同时被发现煤气泄漏、电路老化和门锁失灵——哪样都不能拖。
CVE-2025-33244:Apex里的"特洛伊木马"
这批漏洞里最扎眼的是CVE-2025-33244,CVSS评分直接飙到9.8。受影响的是NVIDIA Apex,这个PyTorch扩展包几乎是大模型训练的标配,负责混合精度和分布式训练加速。
简单来说,攻击者不需要物理接触服务器,就能在训练任务里植入恶意代码。
NVIDIA PSIRT(产品安全事件响应团队)对具体技术细节做了模糊处理,防止漏洞被直接武器化。但从公告描述看,攻击路径指向反序列化漏洞——AI框架的祖传难题。攻击者一旦得手,能做的事包括但不限于:劫持正在跑的训练任务、把专有模型拷走、或者以此为跳板往企业内网渗透。
一个细节值得玩味:Apex本身不是独立产品,而是PyTorch生态的"加速器"。很多团队装完PyTorch顺手就把Apex装了,未必有人专门跟进它的安全更新。这种"附赠组件"的补丁覆盖率,往往是安全审计的盲区。
推理层也被击穿:Triton的"守门人"失效
训练端出事已经够头疼,推理侧也没幸免。Triton Inference Server这次中了CVE-2025-33238等一串漏洞,高危评级。
![]()
Triton的定位是"模型即服务"的入口——你的AI应用调API取结果,背后大概率是Triton在调度GPU、批处理请求、管理模型版本。它要是被攻破,等于给攻击者开了张VIP通行证:不仅能搞瘫服务,还能偷看、篡改甚至替换模型输出。
Megatron LM和NeMo Framework同样上榜。前者是NVIDIA官方的大模型分布式训练方案,后者是全栈AI开发平台。这俩的漏洞组合起来,攻击者可能从训练阶段就污染模型权重,一路潜伏到生产环境。
一条完整的攻击链就此成型:训练时埋雷,推理时引爆。
Model Optimizer也没能逃过。这个工具负责模型压缩和格式转换,本来在流水线末端"打杂",但漏洞让它成了新的突破口。安全团队的评估里特别提到,某些场景下它能被利用来提升权限——从"打杂的"变成"管钥匙的"。
PSIRT的新玩法:把安全公告塞进GitHub
这次补丁发布有个容易被忽略的改动:NVIDIA从去年底开始,把安全公告同步发到GitHub,格式是Markdown加CSAF(通用安全咨询框架)。
老派的安全团队可能还在刷邮件等PDF,但做DevSecOps的工程师已经写好了自动化脚本——CSAF格式能被SIEM(安全信息与事件管理)系统直接解析,CVE信息进数据库、匹配资产清单、生成工单,全流程不用人点鼠标。
「我们希望通过标准化格式,让响应时间从小时级压缩到分钟级。」NVIDIA PSIRT在公告里这么解释。
![]()
这个转变本身说明问题:AI基础设施的漏洞响应速度,已经从"IT部门的季度KPI"变成了"业务连续性生死线"。一个大模型训练任务动辄烧掉几十万美金,停几个小时比补丁本身的成本贵得多。
补丁清单与优先级建议
受影响的产品线可以分成三类:
第一类,AI软件栈:Apex、Triton Inference Server、Megatron LM、NeMo Framework、Model Optimizer。这些是纯软件更新,重启服务就能生效,但得协调训练/推理窗口期。
第二类,网络组件:包括ConnectX网卡、BlueField DPU的固件。这类更新通常需要维护窗口,甚至物理重启。
第三类,MCU硬件:某些嵌入式控制器的固件漏洞,修复链条最长——可能涉及供应链协调。
NVIDIA的官方建议很直接:企业用户"立即审查并应用推荐更新"。翻译成人话就是,别等周末了,现在就该拉会排期。
一个现实的难题是:很多AI团队的K8s集群里,NVIDIA组件的版本管理本身就是一团麻。Apex可能是conda装的,Triton可能是Docker拉的,Megatron LM可能是GitHub源码编译的。同一个CVE,要 patch 三四个不同的交付渠道。
这也是为什么PSIRT推CSAF格式——机器比人更擅长处理这种碎片化。
最后留个开放式的疑问:当你的训练集群正在跑一个价值百万美元的强化学习任务时,你是选择立即中断打补丁,还是赌一把攻击者还没发现这个CVE?NVIDIA给了补丁,但没给标准答案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.