网易首页 > 网易号 > 正文 申请入驻

获NVIDIA致谢:悟空Agent的实践、复盘与迭代

0
分享至


作者:悟空代码安全团队


导语: 当代码复杂度爆炸,如何让代码安全审计回归高效与理性?本文以悟空 Agent 获得NVIDIA官方致谢为起点,介绍多智能体架构如何闭环,以及在实战中面临的真实挑战——上下文断流、调度失衡。这是一场务实的探索:让 AI 成为安全团队的第二双眼,让安全真正融入业务生产线。

一、人类,已经看不完代码了
AI 的意义不在于取代,而在于放大人类的判断力。它让代码安全审计重新回归“人”的部分——分析、推理、决策。

代码安全审计,起初是依靠安全专家经验与直觉的“手艺”,后来随着“手艺人”越来越多,经验逐渐被沉淀、规则化,于是诞生了 SAST(静态应用安全测试)工具。

无论是靠经验,还是靠规则,都曾是代码安全领域最倚重的报警器。

但当 AI 时代来临,项目规模动辄数十万文件、数百万行代码时,这两道报警器都出现了同一个问题:告警的速度赶不上代码复杂度。


审计方式

优点

核心痛点

典型后果

人工审计

能深入理解业务逻辑

能识别复杂漏洞链

人工成本高、周期长

依赖专家经验与直觉

审计周期以周计

主观差异,易疲劳遗漏

SAST工具

能批量扫描常见漏洞(XSS、SQLi)

误报率高

上下文缺失、规则更新慢

告警的“噪音”过多

结果仍需人工复核

人工审计就像手术刀,虽精准但稀缺,而SAST像扫描仪,方便快捷却不治根。

二者结合也能覆盖更多场景,却依旧难以应对 AI 时代里代码的迭代速度。像 LangChain、LLaMA-Factory、LLaMA-Index 这些开源明星 AI 框架,几乎每周都有新模块与依赖更新。其代码中任何一个 yaml.load() 调用、一次 checkpoint 加载,都随时可能成为潜在的漏洞爆发点。

正因如此,悟空代码安全团队一直在探索一种新的思路——不是替代人,而是让机器分担那些繁复却关键的逻辑工作。

二、一次来自NVIDIA的致谢

在一次常规的 AI 框架安全审计中, 悟空 Agent 注意到 NVIDIA Megatron-LM 项目中的一个反序列化逻辑存在潜在风险。

pretrain_gpt.py 文件在加载 YAML 配置时使用了不安全的反序列化方式,攻击者理论上可通过恶意输入触发命令执行。经过安全专家的复现确认,旧版 PyYAML(<5.4.1)在处理 yaml.load() 调用时,会直接执行对象实例化逻辑,从而引发命令执行。

修复方式简单且有效:将 yaml.load() 替换为更安全的 yaml.safe_load() 即可。

在2025年9月,NVIDIA 发布了官方安全公告:

Security Bulletin: NVIDIA Megatron-LM - September 2025 CVE-2025-23348 — “Malicious data in pretrain_gpt may cause code injection, leading to code execution, privilege escalation, and data tampering.” Severity: High (CVSS 7.8) 来源:NVIDIA Official Security Bulletin - September 2025


公告同步修复了该问题,并在版本 0.13.1 / 0.12.3 中完成更新。

短短一句致谢背后,是一次完整的安全协作闭环 —— 从漏洞发现、复现验证、负责任披露,到官方确认、修复发布。

三、悟空 Agent 的架构设计与迭代效率

悟空 Agent 的核心不是“模型大”,而是“迭代快”。 我们致力于让每一个误报、漏报、复测都能成为下一个版本的训练素材。

当漏洞发现能力不再取决于单一模型性能,而取决于“体系闭环”的成熟度时,我们开始将注意力转向架构设计以及数据工程飞轮的构建。

1.架构:协同作战的智能军团

我们将代码审计任务拆解为多智能体(Multi-Agent)的协作流程,这一设计的理念是:专家管方向,Agent管执行。

在实际工程中,以五个智能体完整闭环:

角色

职责定位

核心价值

Client Agent

用户交互入口,接收任务、生成配置、反馈结果

把复杂任务标准化、可批量分发

Remote Agent

负责任务规划与路由,将复杂审计拆解为可执行子任务

提升整体调度效率,避免重复扫描

Audit Agent

漏洞挖掘核心单元,对代码片段和完整项目进行多层次扫描与风险评估

覆盖广度与深度,发现高复杂漏洞链

Review Agent

复审检测结果,结合多 Prompt 和评分机制确认漏洞有效性

降低误报率、稳定输出结果质量

Fix Agent

生成修复方案,输出安全建议并验证补丁有效性

实现漏洞到修复的全闭环

在对开源项目的持续测试中,我们看到这样的协同带来了明显提效:

● 代码扫描与路径分析的耗时缩短约 80%;

● 误报率下降超过 60%;


悟空 Agent 架构、流程图详见:

这并不是“效率革命”,而是一次很务实的调整,把有限的安全专家人力投入在最值得分析与决策的地方。

2.复盘:Agent迭代中的瓶颈与优化

在持续的版本迭代中,我们发现多智能体协作虽显著提升了效率,但也暴露出一些典型问题。这些问题集中在两个层面:准确率瓶颈、任务调度不均衡。

准确率的瓶颈:上下文断流

在使用悟空 Agent 进行项目级扫描时,我们发现漏洞的准确率高度依赖上下文信息。而在复杂代码项目中,大模型往往无法完整捕获输入输出的上下文链,造成“断流”现象。我们将原因归纳为两点:

● 框架复杂性导致上下文提取不足。 多层封装、动态 import、异步逻辑等模式,使得调用链在语义层面被“截断”;

● 内部特定代码用法缺乏知识覆盖。 某些自研框架或宏定义逻辑不在开源语料中,模型难以正确解析。

针对这两类问题,悟空 Agent 团队引入了系统性的“上下文工程(Context Engineering)”方案:

i)增强上下文提取:

通过专用上下文提取工具,针对类继承、装饰器逻辑、框架 Hook 等结构设定提取模板,实现多层语义补全。

ii)知识补全机制:

在识别到“内部专用调用”时触发 RAG-like 机制,从内部知识库实时检索相应逻辑并注入上下文,使模型具备“局部知识回忆”能力。

经过持续优化后,Bad Case的归因命中率再次提升——多数误报都可在第二轮迭代中被消化。

智能体调度失衡:协作退化为串行

在多智能体架构下,理论上任务应在多个 Agent 间分工协作,但在实际运行中,我们发现:

即使定义了各自Agent的职责与工具集,在解决用户需求的时候多个 Agent 仍倾向于让“主 Agent”独自处理任务。而不是将任务分发给不同职能的其他智能体来解决。


这就带来了一个问题,原本是为了区分独立的上下文,从而提升子任务的解决效果而设计的多智能体架构,退化为串行工具调用的单智能体架构,导致系统整体表现下降。

在进行大量调研后,我们后续计划通过强化学习(RL)调度机制解决该问题:

● 采集少量高质量标注样本,训练模型识别任务场景与角色最优分配;

● 让大模型学会在不同上下文中主动“移交任务”,而非被动等待指令;

3.数据飞轮:从Bad Case到模型迭代

这套多 Agent 架构的背后,是一个能持续“自我进化”的 数据飞轮体系。

系统每天从真实扫描场景中抽取 Bad Case 样本,经模型判断和人工质检后进入训练与评测管线。所有误报、漏报都会被分类入库,用于后续微调与算法优化。

我们的数据飞轮体系有三条管线:


管线

主要功能

输出

数据生产管线

收集 Bad Case 与合成数据,经模型判断与质量评估后入库

评测集、微调数据

微调训练管线

一站式模型调用与多参训练,自动生成 CoT 推理链

微调模型版本

效果评测管线

模型评测、归因分析、报告生成,形成每日 Bad Case 追踪

优化方向与迭代计划

系统每日从实际扫描输出的Bad Case中抽取代表性样本,经模型复核与人工质检后进入训练集。

所有模型评测结果都会被自动归因并量化回流,形成优化建议。

经过数轮版本迭代,Bad Case 的闭环解决率已从最初的 30% 提升至 97% 以上,绝大多数问题都能在数据飞轮体系内被消化,而不再依赖大量人工调试。


四、AI Infra的现实:更多细微的安全裂缝

在与多个开源社区的协作过程中,我们越来越清楚地看到一个事实——AI infra 并不天然安全。模型越来越强,代码越来越复杂,但底层的工程基础,却常常建立在“信任默认值”之上。在我们的日常审计中,这些“默认”几乎随处可见:

➢ 配置文件没有边界校验、序列化机制依旧沿用早期模板、外部依赖包随版本漂移、训练脚本混合使用多个框架……

在复杂的 AI 流水线中,这些细节并不会立即出错,却足以让一个成熟系统暴露出可被利用的攻击面。有些安全研究人员认为 AI 安全问题主要集中在模型本身,但现实告诉我们——真正的风险往往在模型之外:

➢ 它可能是一段被沿用的 YAML 加载逻辑、一个疏忽的 WebUI 参数解析,也可能是某个未更新的依赖版本。

这不是危言耸听,而是我们在主流框架中一次次验证过的事实:

● LLaMA-Factory 的模型加载链:

● MS-SWIFT 框架的命令拼接点;

● LangChain 的默认启用组件EverNoteLoader;

● ···

每一次发现都让我们意识到:AI 基础设施的发展速度,远远快于安全体系的适配速度。

每一次修复背后,都是一次“安全假设”被重新检验的过程。这些漏洞不只是代码问题,更像是一面镜子,时刻提醒我们,在这场 AI 浪潮中,每一次加速都必须伴随一次“回头看”:

那些连接一切的 AI 基础设施,是否真的安全?

尾声:当安全回归业务战场和“人”

当技术、业务与信任汇聚成同一个目标时,安全,终于不再只是成本,而是一种长期的竞争力。

悟空 Agent 的所有研究与实战,并不是为了展示模型的能力,而是为了让这些能力,真正融入业务生产线。过去几个月里,我们与微信、广告等业务上,和业务安全团队一起共建代码审计与模型防护体系,也产出了一些成果。

无论是客户端的 RCE 漏洞挖掘,还是业务的接口安全与策略验证,这些看似隐形的审计与修复,正在一点点减少潜在公司业务面临的风险、提升系统韧性,让创新更可持续。

AI 正在改变我们构建产品的方式,也在重新定义“安全”这件事的边界。

在这场变革中,我们逐渐意识到:

真正的安全,不只是防御漏洞,更是让业务、算法与信任可以共同成长的能力。

AI Agent 帮我们分担了疲惫的机械环节,让安全团队有更多精力去思考“为什么这样设计”,而不是“哪里出了错”。它的意义,不在于自动化本身,而在于让安全真正成为业务的一部分,而非阻力。

我们期待一个新的安全范式:在那里,AI 不仅是被保护的对象,也能成为守护者;安全不再是被动防御,而是业务创新的底层支撑。这才是人机协同的真正价值。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
8勇士制造“惨案”!辽宁残阵赢58分,张陈治锋29+17,刘金雨41+

8勇士制造“惨案”!辽宁残阵赢58分,张陈治锋29+17,刘金雨41+

萌兰聊个球
2025-11-10 15:58:41
央八开播!37集谍战大剧今晚来袭,看完预告我想说:这剧不火都难

央八开播!37集谍战大剧今晚来袭,看完预告我想说:这剧不火都难

古木之草记
2025-11-10 14:39:59
日方紧急找补:涉台立场没变

日方紧急找补:涉台立场没变

观察者网
2025-11-10 16:09:03
女子高铁推婴儿车堵道后续:正脸照流出,黑皮胖脸,知情人曝更多

女子高铁推婴儿车堵道后续:正脸照流出,黑皮胖脸,知情人曝更多

揽星河的笔记
2025-11-10 14:37:42
白应苍究竟有多狂?被抓前对通缉嗤之以鼻,宣判死刑后一脸不服气

白应苍究竟有多狂?被抓前对通缉嗤之以鼻,宣判死刑后一脸不服气

策前论
2025-11-09 13:29:38
哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

哪些弦外之音是你多年后才醒悟的?网友:好多都没听出来,没眼力

带你感受人间冷暖
2025-11-05 00:05:16
她长相虽然不是特别好,但身材比例是真好,看面相是个过日子的人

她长相虽然不是特别好,但身材比例是真好,看面相是个过日子的人

手工制作阿歼
2025-11-10 13:09:34
斯基拉:尤里奇将很快被解雇,预计未来几小时内宣布

斯基拉:尤里奇将很快被解雇,预计未来几小时内宣布

懂球帝
2025-11-10 15:15:08
哈工大调查发现:身体差的人若每天睡午觉,不出半年,或有3变化

哈工大调查发现:身体差的人若每天睡午觉,不出半年,或有3变化

泠泠说史
2025-11-10 14:50:43
全运会乒乓球男单8强对阵确定,樊振东轻松晋级16强。

全运会乒乓球男单8强对阵确定,樊振东轻松晋级16强。

无意争春
2025-11-10 15:29:49
祖雄兵、曾琦因生活作风问题被停职调查!两人可能会有5种结局

祖雄兵、曾琦因生活作风问题被停职调查!两人可能会有5种结局

文史道
2025-11-09 16:41:23
食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

食堂阿姨偷偷给贫困生多打菜,被同学举报后开除,次日接到局里电话

罪案洞察者
2025-11-03 13:59:03
福建富豪陈志,满手沾满中国人血泪

福建富豪陈志,满手沾满中国人血泪

城市局
2025-10-16 22:58:41
西部第一分卫?本赛季的布克,什么水平?

西部第一分卫?本赛季的布克,什么水平?

篮球实录
2025-11-10 01:46:42
领导退休后还端着架子?网友:这排场比在职时还足,笑到腰疼!

领导退休后还端着架子?网友:这排场比在职时还足,笑到腰疼!

墙头草
2025-11-10 07:56:40
不装了,快船突爆争议决定!哈登很意外,球迷:后悔离开篮网了

不装了,快船突爆争议决定!哈登很意外,球迷:后悔离开篮网了

阿泰希特
2025-11-10 11:14:27
四名交警遭十几名刑警狂殴,全市交警离岗讨公道,受害者含泪曝内幕

四名交警遭十几名刑警狂殴,全市交警离岗讨公道,受害者含泪曝内幕

小月文史
2024-01-16 18:57:52
李连杰遭爆移植最帅武僧心脏!62岁突然回春 功夫皇帝裸上身辟谣

李连杰遭爆移植最帅武僧心脏!62岁突然回春 功夫皇帝裸上身辟谣

桑葚爱动画
2025-11-05 08:19:45
曝皇家马德里计划用罗德里戈交换利物浦1.25亿欧元先生

曝皇家马德里计划用罗德里戈交换利物浦1.25亿欧元先生

油泼辣不辣
2025-11-10 07:46:28
黄火青曾想帮助丁盛恢复军籍,事情碰壁,慨叹:谁知结果是这样!

黄火青曾想帮助丁盛恢复军籍,事情碰壁,慨叹:谁知结果是这样!

春秋砚
2025-11-08 13:30:06
2025-11-10 17:48:49
腾讯技术工程
腾讯技术工程
不止于技术
1335文章数 600关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

20年驾龄"老司机"一踩油门就失控了 新能源车企回应

头条要闻

20年驾龄"老司机"一踩油门就失控了 新能源车企回应

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

郝蕾风波升级?

财经要闻

最终,万科只成全了一个人

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

健康
亲子
时尚
数码
公开课

超声探头会加重受伤情况吗?

亲子要闻

61岁阿姨育儿有招,别再说老人不会带娃

上新|| 秋冬也可以穿的漂亮小裙子,美到心动

数码要闻

霸气!董明珠硬刚冰箱跨界质疑:后来者不等于跟随者

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版