网易首页 > 网易号 > 正文 申请入驻

OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

AI Coding火了大半年,AI Debugging也来了!

刚刚,OpenAI发布由GPT-5驱动的“白帽”Agent——Aardvark(土豚)



这只“AI安全研究员”能帮助开发者和安全团队,在大规模代码库中自动发现并修复安全漏洞

据OpenAI报告,Aardvark已识别出了92%的已知与人工注入漏洞,而且能定位仅在复杂条件下出现的问题。

OpenAI副总裁Matt Knight表示:

  • 我们的开发者发现,土豚在清晰地解释问题并引导他们找到修复方案方面确实非常有价值。这个信号告诉我们,我们正走在一条有意义的道路上。

而且,不仅OpenAI。

整个10月Anthropic谷歌微软基本上是前脚跟后脚发布了类似的白帽Agent。

这是怎么一回事。

Agentic AI +自动修补漏洞

OpenAI对这款白帽Aardvark的官方描述是——代理型安全研究员(agentic security researcher)

Aardvark的核心任务是持续分析源代码仓库,以识别安全漏洞、评估可利用性、确定风险等级,并提出有针对性的修复方案。

它通过监控代码提交(commits)与变更来工作,自动识别潜在漏洞、推断攻击路径并生成修复建议。

Aardvark并不依赖传统的程序分析技术(如模糊测试fuzzing或软件成分分析SCA),而是运用大语言模型驱动的推理与工具使用能力来理解代码行为,像人类安全研究员那样阅读、分析代码、编写测试并运行验证。

具体来说,它的工作流程从Git仓库出发,依次经历:威胁建模→漏洞发现→沙盒验证→Codex 修复→人工复审→ 提交Pull Request。



  • 分析:对整个仓库进行全面分析,生成反映项目安全目标与设计的威胁模型(threat model)。
  • 提交扫描:新代码提交时,结合仓库和威胁模型扫描差异;首次连接仓库时回溯历史提交。同时解释发现的漏洞,在代码中标注,便于人工复审。
  • 验证:一旦识别出潜在漏洞,将在隔离环境中触发潜在漏洞,确认可利用性,同时说明验证步骤,确保结果准确且误报率低。
  • 修复:Aardvark与OpenAI Codex深度集成,为漏洞生成修复补丁,附于报告中,便于一键审阅与应用。

目前,Aardvark可无缝集成GitHub、Codex及现有开发流程,在不影响开发效率的前提下提供可执行的安全洞察。

内部测试显示,它不仅能识别安全漏洞,还能发现逻辑缺陷、不完整修复及隐私风险

而且,Aardvark 已在内部和合作伙伴项目中测试运行,表现出色,验证了其实际可用性。

正如开头提到的,它不仅能够进行深度分析、定位仅在复杂条件下出现的问题,在对“黄金测试仓库(golden repositories)”的基准测试中,也实现了92%的识别率。

此外,Aardvark也已应用于多个开源项目,发现并负责披露了众多漏洞,其中10个已获得CVE编号。

OpenAI表示将为部分非商业开源仓库提供公益扫描服务,并提升整个开源生态与供应链的安全性。

Aardvark现已开启内测,有需要的开发者可以直接在官网申请。

AI编程完,AI来修

就像开头提到的,不仅是OpenAI,其他科技巨头也在积极布局Agentic AI+代码安全

整个10月,谷歌、Anthropic、微软就像提前约好了似的,纷纷发布相关动作,OpenAI这次反而显得稍晚。

例如,Anthropic在10月4号表示将Claude Sonnet 4.5应用于代码安全任务。



据悉,Claude Sonnet 4.5在发现代码漏洞和其他网络安全技能方面,性能已经超越了Opus 4.1,并且价格更低、速度更快。

谷歌在10月6号发布了CodeMender,利用Gemini Deep Think模型,实现自主调试和漏洞修复。



微软在10月16号发布了Vuln.AI,正式宣告使用AI进行漏洞管理,而在10月的最后一天,OpenAI也是姗姗来迟,跟上了这次更新的节奏。

(注:各家在发布前均进行了数月的测试和验证)

那么,为什么这些巨头都选择在此时发力AI代码安全呢?

OpenAI以及其他公司的解释高度一致:人工Debug与传统的自动化方法(如模糊测试)已经跟不上大规模代码库的漏洞发现与修复需求

一方面,企业级网络中设备、服务、代码库数量巨大,另一方面AI技术虽能提高生产力,但也被用于快速寻找漏洞、生成攻击代码。

因此,在漏洞数量激增、攻击手段日益智能化的背景下,借助AI自动化发现与修复漏洞,已成为确保软件安全和降低企业风险的关键手段。

不过,大厂说管说,倒是有网友发现了“华点”:

  • 我们有一个会制造安全漏洞的Agent,也有一个会修复安全漏洞的Agent,这就是最好的商业模式。



[1]https://x.com/OpenAI/status/1983956431360659467

[2]https://openai.com/index/introducing-aardvark/

[3]https://www.anthropic.com/research/building-ai-cyber-defenders?utm_source=chatgpt.com

[4]https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

[5]https://www.microsoft.com/insidetrack/blog/vuln-ai-our-ai-powered-leap-into-vulnerability-management-at-microsoft/?utm_source=chatgpt.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
没拿过亚军!德约此前10次参加澳网男单决赛全部夺冠

没拿过亚军!德约此前10次参加澳网男单决赛全部夺冠

懂球帝
2026-01-30 23:12:37
深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

深夜血洗!黄金突然闪崩?央行偷偷干大事,散户还在傻傻接盘?

亿通电子游戏
2026-01-30 11:58:27
战争打响,伊朗唯一活路是把一万枚导弹当成“一次性打火机”!

战争打响,伊朗唯一活路是把一万枚导弹当成“一次性打火机”!

百态人间
2026-01-29 15:41:40
春节前到账!4亿党费发放,5类党员符合条件就有

春节前到账!4亿党费发放,5类党员符合条件就有

夜深爱杂谈
2026-01-30 22:30:02
中央定调,退休新规后,1966年8月出生的职工,2027年退休划算吗

中央定调,退休新规后,1966年8月出生的职工,2027年退休划算吗

有范又有料
2026-01-30 18:23:58
斯塔默在三里屯下馆子,英使馆官员表情亮了:见识到中国有多先进

斯塔默在三里屯下馆子,英使馆官员表情亮了:见识到中国有多先进

古史青云啊
2026-01-30 11:51:20
可控核聚变、固态电池、存储芯片:三个前沿技术赛道,普通人咋看

可控核聚变、固态电池、存储芯片:三个前沿技术赛道,普通人咋看

Thurman在昆明
2026-01-30 20:00:24
就在刚刚。台“民进党”当局正式宣布

就在刚刚。台“民进党”当局正式宣布

安安说
2026-01-30 09:14:03
注意 | 2月1日起,天津一道路封闭!

注意 | 2月1日起,天津一道路封闭!

天津人
2026-01-28 19:06:18
湖南省湘西自治州人民政府原党组成员、副州长刘冬生等3人被提起公诉

湖南省湘西自治州人民政府原党组成员、副州长刘冬生等3人被提起公诉

界面新闻
2026-01-30 16:12:06
反美叙事,为何越来越弱智

反美叙事,为何越来越弱智

地球公民金建国
2026-01-26 20:00:07
大妈们组团去西藏自驾游,半夜醒来,她发现除了自己其他人全死了

大妈们组团去西藏自驾游,半夜醒来,她发现除了自己其他人全死了

悬案解密档案
2025-10-30 15:10:02
新帅已定!皇马彻底放弃阿韦洛亚,英超第三教头前来,夏窗大变动

新帅已定!皇马彻底放弃阿韦洛亚,英超第三教头前来,夏窗大变动

祥谈体育
2026-01-30 11:15:32
德约38次打进大满贯男子单打决赛,为公开赛时代最多

德约38次打进大满贯男子单打决赛,为公开赛时代最多

懂球帝
2026-01-30 22:49:32
对中国开战?我们必须警惕,美国人根本不按套路出牌

对中国开战?我们必须警惕,美国人根本不按套路出牌

Ck的蜜糖
2026-01-31 02:41:08
隗福临同志逝世

隗福临同志逝世

新京报政事儿
2026-01-30 21:07:09
中国顾客在法国餐厅用筷子吃披萨,被人拍下传网上,引网友讨论

中国顾客在法国餐厅用筷子吃披萨,被人拍下传网上,引网友讨论

我心纵横天地间
2026-01-24 23:32:50
别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

别想歪!这幅人体油画靠“光”就能让你呼吸放缓?答案藏在薄纱里

陈洪标写字说画
2026-01-27 22:31:02
葡超15战9球!30岁巴西锋霸空降中超,这波操作太狠了!

葡超15战9球!30岁巴西锋霸空降中超,这波操作太狠了!

野渡舟山人
2026-01-31 03:01:05
王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

王钰栋留洋最新消息:德甲只是桥头堡,第一站大概率去德乙

姜大叔侃球
2026-01-30 20:08:18
2026-01-31 05:36:49
量子位 incentive-icons
量子位
追踪人工智能动态
12090文章数 176368关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

伊朗总统:若美国寻求谈判 就必须停止挑衅

头条要闻

伊朗总统:若美国寻求谈判 就必须停止挑衅

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

手机
艺术
房产
亲子
游戏

手机要闻

差200元!红米Turbo 5与Max该怎么选?这4点核心差异看完不纠结!

艺术要闻

惊艳!越南摄影师镜头下的妩媚女子!

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

亲子要闻

心血管风险或始于子宫孕期不良暴露留下"胎儿期烙印"

向全体二游策划宣战,你们能不能直接把我推删了?

无障碍浏览 进入关怀版