网易首页 > 网易号 > 正文 申请入驻

OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

AI Coding火了大半年,AI Debugging也来了!

刚刚,OpenAI发布由GPT-5驱动的“白帽”Agent——Aardvark(土豚)



这只“AI安全研究员”能帮助开发者和安全团队,在大规模代码库中自动发现并修复安全漏洞

据OpenAI报告,Aardvark已识别出了92%的已知与人工注入漏洞,而且能定位仅在复杂条件下出现的问题。

OpenAI副总裁Matt Knight表示:

  • 我们的开发者发现,土豚在清晰地解释问题并引导他们找到修复方案方面确实非常有价值。这个信号告诉我们,我们正走在一条有意义的道路上。

而且,不仅OpenAI。

整个10月Anthropic谷歌微软基本上是前脚跟后脚发布了类似的白帽Agent。

这是怎么一回事。

Agentic AI +自动修补漏洞

OpenAI对这款白帽Aardvark的官方描述是——代理型安全研究员(agentic security researcher)

Aardvark的核心任务是持续分析源代码仓库,以识别安全漏洞、评估可利用性、确定风险等级,并提出有针对性的修复方案。

它通过监控代码提交(commits)与变更来工作,自动识别潜在漏洞、推断攻击路径并生成修复建议。

Aardvark并不依赖传统的程序分析技术(如模糊测试fuzzing或软件成分分析SCA),而是运用大语言模型驱动的推理与工具使用能力来理解代码行为,像人类安全研究员那样阅读、分析代码、编写测试并运行验证。

具体来说,它的工作流程从Git仓库出发,依次经历:威胁建模→漏洞发现→沙盒验证→Codex 修复→人工复审→ 提交Pull Request。



  • 分析:对整个仓库进行全面分析,生成反映项目安全目标与设计的威胁模型(threat model)。
  • 提交扫描:新代码提交时,结合仓库和威胁模型扫描差异;首次连接仓库时回溯历史提交。同时解释发现的漏洞,在代码中标注,便于人工复审。
  • 验证:一旦识别出潜在漏洞,将在隔离环境中触发潜在漏洞,确认可利用性,同时说明验证步骤,确保结果准确且误报率低。
  • 修复:Aardvark与OpenAI Codex深度集成,为漏洞生成修复补丁,附于报告中,便于一键审阅与应用。

目前,Aardvark可无缝集成GitHub、Codex及现有开发流程,在不影响开发效率的前提下提供可执行的安全洞察。

内部测试显示,它不仅能识别安全漏洞,还能发现逻辑缺陷、不完整修复及隐私风险

而且,Aardvark 已在内部和合作伙伴项目中测试运行,表现出色,验证了其实际可用性。

正如开头提到的,它不仅能够进行深度分析、定位仅在复杂条件下出现的问题,在对“黄金测试仓库(golden repositories)”的基准测试中,也实现了92%的识别率。

此外,Aardvark也已应用于多个开源项目,发现并负责披露了众多漏洞,其中10个已获得CVE编号。

OpenAI表示将为部分非商业开源仓库提供公益扫描服务,并提升整个开源生态与供应链的安全性。

Aardvark现已开启内测,有需要的开发者可以直接在官网申请。

AI编程完,AI来修

就像开头提到的,不仅是OpenAI,其他科技巨头也在积极布局Agentic AI+代码安全

整个10月,谷歌、Anthropic、微软就像提前约好了似的,纷纷发布相关动作,OpenAI这次反而显得稍晚。

例如,Anthropic在10月4号表示将Claude Sonnet 4.5应用于代码安全任务。



据悉,Claude Sonnet 4.5在发现代码漏洞和其他网络安全技能方面,性能已经超越了Opus 4.1,并且价格更低、速度更快。

谷歌在10月6号发布了CodeMender,利用Gemini Deep Think模型,实现自主调试和漏洞修复。



微软在10月16号发布了Vuln.AI,正式宣告使用AI进行漏洞管理,而在10月的最后一天,OpenAI也是姗姗来迟,跟上了这次更新的节奏。

(注:各家在发布前均进行了数月的测试和验证)

那么,为什么这些巨头都选择在此时发力AI代码安全呢?

OpenAI以及其他公司的解释高度一致:人工Debug与传统的自动化方法(如模糊测试)已经跟不上大规模代码库的漏洞发现与修复需求

一方面,企业级网络中设备、服务、代码库数量巨大,另一方面AI技术虽能提高生产力,但也被用于快速寻找漏洞、生成攻击代码。

因此,在漏洞数量激增、攻击手段日益智能化的背景下,借助AI自动化发现与修复漏洞,已成为确保软件安全和降低企业风险的关键手段。

不过,大厂说管说,倒是有网友发现了“华点”:

  • 我们有一个会制造安全漏洞的Agent,也有一个会修复安全漏洞的Agent,这就是最好的商业模式。



[1]https://x.com/OpenAI/status/1983956431360659467

[2]https://openai.com/index/introducing-aardvark/

[3]https://www.anthropic.com/research/building-ai-cyber-defenders?utm_source=chatgpt.com

[4]https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

[5]https://www.microsoft.com/insidetrack/blog/vuln-ai-our-ai-powered-leap-into-vulnerability-management-at-microsoft/?utm_source=chatgpt.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

寒士之言本尊
2025-11-10 22:51:59
上海刚刚通报:王卫明被查!涉嫌严重违纪违法

上海刚刚通报:王卫明被查!涉嫌严重违纪违法

鲁中晨报
2025-11-12 18:31:05
广东20岁瘫痪小伙绑氢气球将自己升入百米高空,降落时剪断绳子,残联回应

广东20岁瘫痪小伙绑氢气球将自己升入百米高空,降落时剪断绳子,残联回应

极目新闻
2025-11-12 15:14:22
全运女单8强对阵出炉!陈梦剃光头,王曼昱10-7被逆转,险被爆冷

全运女单8强对阵出炉!陈梦剃光头,王曼昱10-7被逆转,险被爆冷

漫川舟船
2025-11-12 11:09:12
段永平最新深度访谈:“稀里糊涂 6 个月赚了 20 倍”

段永平最新深度访谈:“稀里糊涂 6 个月赚了 20 倍”

互联网早读课
2025-11-12 08:10:28
套现超4亿元!永辉超市董事长减持永辉,公司前三季度亏损7.1亿元

套现超4亿元!永辉超市董事长减持永辉,公司前三季度亏损7.1亿元

每日经济新闻
2025-11-12 17:06:12
乌克兰全黑了!核打击前最后警告,俄军发射13枚“全球禁止”导弹

乌克兰全黑了!核打击前最后警告,俄军发射13枚“全球禁止”导弹

史纪文谭
2025-11-11 14:16:47
母亲被儿子暴打后续:男子身份被扒、高清正面照流出,悬针纹明显

母亲被儿子暴打后续:男子身份被扒、高清正面照流出,悬针纹明显

鋭娱之乐
2025-11-12 00:50:22
再见黄仁勋!软银58亿清仓英伟达,All in OpenAI

再见黄仁勋!软银58亿清仓英伟达,All in OpenAI

新智元
2025-11-12 10:24:08
长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

火山诗话
2025-11-11 09:07:42
突然爆雷!曾在全国有300家门店,有员工“上班一个月,倒贴32万元”

突然爆雷!曾在全国有300家门店,有员工“上班一个月,倒贴32万元”

鲁中晨报
2025-11-12 18:43:05
离婚证背面有囍字?民政部门:属实,是防伪标志

离婚证背面有囍字?民政部门:属实,是防伪标志

极目新闻
2025-11-12 18:22:24
任上落马后,自贡市原副市长被“双开”!

任上落马后,自贡市原副市长被“双开”!

中国青年报
2025-11-12 22:05:05
赶紧买!手机将大面积涨价

赶紧买!手机将大面积涨价

电脑报
2025-11-11 18:33:39
广东职工会员可申领千元学历提升补贴 计划补贴2万人

广东职工会员可申领千元学历提升补贴 计划补贴2万人

中工网
2025-11-12 09:00:01
张雪峰晒婚戒辟谣出轨后续:看演唱会女子账号被扒,海量美照曝光

张雪峰晒婚戒辟谣出轨后续:看演唱会女子账号被扒,海量美照曝光

古希腊掌管松饼的神
2025-11-12 15:39:13
江苏苏州发生的这件事,是一种厚颜无耻地诬陷!

江苏苏州发生的这件事,是一种厚颜无耻地诬陷!

胖胖说他不胖
2025-11-12 15:15:08
房价不能再跌了,再跌很多家庭真要垮了

房价不能再跌了,再跌很多家庭真要垮了

深蓝夜读
2025-11-12 17:18:09
套路太深!知名软件被指看人下菜,你的电脑正沦为“提款机”

套路太深!知名软件被指看人下菜,你的电脑正沦为“提款机”

电脑报
2025-11-12 17:30:28
高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

临云史策
2025-11-11 22:00:26
2025-11-12 23:15:00
量子位 incentive-icons
量子位
追踪人工智能动态
11662文章数 176329关注度
往期回顾 全部

科技要闻

前阿里人亲述: “经济上行”期双11什么样

头条要闻

涉赌诈头目佘智江被引渡回中国 涉案资金超2.7万亿元

头条要闻

涉赌诈头目佘智江被引渡回中国 涉案资金超2.7万亿元

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

段永平最新访谈:聊企业经营 投资理念

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

教育
健康
手机
家居
时尚

教育要闻

家长的崩溃值,每天都在刷新

血液科专家揭秘白血病七大误区

手机要闻

装iPhone的兜要1900?

家居要闻

情感之所 生活教会设计

这些知识女性的衣橱,完全不输穿搭博主

无障碍浏览 进入关怀版