网易首页 > 网易号 > 正文 申请入驻

OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

AI Coding火了大半年,AI Debugging也来了!

刚刚,OpenAI发布由GPT-5驱动的“白帽”Agent——Aardvark(土豚)



这只“AI安全研究员”能帮助开发者和安全团队,在大规模代码库中自动发现并修复安全漏洞

据OpenAI报告,Aardvark已识别出了92%的已知与人工注入漏洞,而且能定位仅在复杂条件下出现的问题。

OpenAI副总裁Matt Knight表示:

  • 我们的开发者发现,土豚在清晰地解释问题并引导他们找到修复方案方面确实非常有价值。这个信号告诉我们,我们正走在一条有意义的道路上。

而且,不仅OpenAI。

整个10月Anthropic谷歌微软基本上是前脚跟后脚发布了类似的白帽Agent。

这是怎么一回事。

Agentic AI +自动修补漏洞

OpenAI对这款白帽Aardvark的官方描述是——代理型安全研究员(agentic security researcher)

Aardvark的核心任务是持续分析源代码仓库,以识别安全漏洞、评估可利用性、确定风险等级,并提出有针对性的修复方案。

它通过监控代码提交(commits)与变更来工作,自动识别潜在漏洞、推断攻击路径并生成修复建议。

Aardvark并不依赖传统的程序分析技术(如模糊测试fuzzing或软件成分分析SCA),而是运用大语言模型驱动的推理与工具使用能力来理解代码行为,像人类安全研究员那样阅读、分析代码、编写测试并运行验证。

具体来说,它的工作流程从Git仓库出发,依次经历:威胁建模→漏洞发现→沙盒验证→Codex 修复→人工复审→ 提交Pull Request。



  • 分析:对整个仓库进行全面分析,生成反映项目安全目标与设计的威胁模型(threat model)。
  • 提交扫描:新代码提交时,结合仓库和威胁模型扫描差异;首次连接仓库时回溯历史提交。同时解释发现的漏洞,在代码中标注,便于人工复审。
  • 验证:一旦识别出潜在漏洞,将在隔离环境中触发潜在漏洞,确认可利用性,同时说明验证步骤,确保结果准确且误报率低。
  • 修复:Aardvark与OpenAI Codex深度集成,为漏洞生成修复补丁,附于报告中,便于一键审阅与应用。

目前,Aardvark可无缝集成GitHub、Codex及现有开发流程,在不影响开发效率的前提下提供可执行的安全洞察。

内部测试显示,它不仅能识别安全漏洞,还能发现逻辑缺陷、不完整修复及隐私风险

而且,Aardvark 已在内部和合作伙伴项目中测试运行,表现出色,验证了其实际可用性。

正如开头提到的,它不仅能够进行深度分析、定位仅在复杂条件下出现的问题,在对“黄金测试仓库(golden repositories)”的基准测试中,也实现了92%的识别率。

此外,Aardvark也已应用于多个开源项目,发现并负责披露了众多漏洞,其中10个已获得CVE编号。

OpenAI表示将为部分非商业开源仓库提供公益扫描服务,并提升整个开源生态与供应链的安全性。

Aardvark现已开启内测,有需要的开发者可以直接在官网申请。

AI编程完,AI来修

就像开头提到的,不仅是OpenAI,其他科技巨头也在积极布局Agentic AI+代码安全

整个10月,谷歌、Anthropic、微软就像提前约好了似的,纷纷发布相关动作,OpenAI这次反而显得稍晚。

例如,Anthropic在10月4号表示将Claude Sonnet 4.5应用于代码安全任务。



据悉,Claude Sonnet 4.5在发现代码漏洞和其他网络安全技能方面,性能已经超越了Opus 4.1,并且价格更低、速度更快。

谷歌在10月6号发布了CodeMender,利用Gemini Deep Think模型,实现自主调试和漏洞修复。



微软在10月16号发布了Vuln.AI,正式宣告使用AI进行漏洞管理,而在10月的最后一天,OpenAI也是姗姗来迟,跟上了这次更新的节奏。

(注:各家在发布前均进行了数月的测试和验证)

那么,为什么这些巨头都选择在此时发力AI代码安全呢?

OpenAI以及其他公司的解释高度一致:人工Debug与传统的自动化方法(如模糊测试)已经跟不上大规模代码库的漏洞发现与修复需求

一方面,企业级网络中设备、服务、代码库数量巨大,另一方面AI技术虽能提高生产力,但也被用于快速寻找漏洞、生成攻击代码。

因此,在漏洞数量激增、攻击手段日益智能化的背景下,借助AI自动化发现与修复漏洞,已成为确保软件安全和降低企业风险的关键手段。

不过,大厂说管说,倒是有网友发现了“华点”:

  • 我们有一个会制造安全漏洞的Agent,也有一个会修复安全漏洞的Agent,这就是最好的商业模式。



[1]https://x.com/OpenAI/status/1983956431360659467

[2]https://openai.com/index/introducing-aardvark/

[3]https://www.anthropic.com/research/building-ai-cyber-defenders?utm_source=chatgpt.com

[4]https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

[5]https://www.microsoft.com/insidetrack/blog/vuln-ai-our-ai-powered-leap-into-vulnerability-management-at-microsoft/?utm_source=chatgpt.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突传噩耗!王国斌离世,公司官网已变黑白

突传噩耗!王国斌离世,公司官网已变黑白

极目新闻
2025-11-03 15:39:25
业界之花,澳大利亚国宝—Angela White

业界之花,澳大利亚国宝—Angela White

吃瓜党二号头目
2025-11-03 13:20:45
马刺首败多惨:最多落后31分榜眼受伤 文班14中4+前三节7中1梦游

马刺首败多惨:最多落后31分榜眼受伤 文班14中4+前三节7中1梦游

醉卧浮生
2025-11-03 11:28:35
王岳伦带女出席活动,王诗龄1米7身高超何超莲,少女感穿搭获赞

王岳伦带女出席活动,王诗龄1米7身高超何超莲,少女感穿搭获赞

述家娱记
2025-11-02 22:35:31
好消息:乌克兰援军来了,红军村反击战取得初步胜利

好消息:乌克兰援军来了,红军村反击战取得初步胜利

史政先锋
2025-11-02 13:40:39
西伯利亚-63℃小卖部:全村约900人,苹果30块1个,1斤牛肉10多元

西伯利亚-63℃小卖部:全村约900人,苹果30块1个,1斤牛肉10多元

禾寒叙
2025-10-30 23:07:12
涉嫌受贿罪、玩忽职守罪,苏立明被决定逮捕

涉嫌受贿罪、玩忽职守罪,苏立明被决定逮捕

正义网新闻
2025-11-03 16:15:02
王家卫录音门事件不断发酵,大导演其实挺恶心,众多明星卷入其中

王家卫录音门事件不断发酵,大导演其实挺恶心,众多明星卷入其中

花哥扒娱乐
2025-11-01 20:51:32
日本前首相一语惊人:中国不该独自对付美国,日韩可以成为帮手

日本前首相一语惊人:中国不该独自对付美国,日韩可以成为帮手

通文知史
2025-11-02 19:20:03
二手房房价下跌幅度扩大!

二手房房价下跌幅度扩大!

地产观点
2025-11-03 08:30:03
中产真没钱!孩子的国际学校退费潮来了,全家都在“教育降级”

中产真没钱!孩子的国际学校退费潮来了,全家都在“教育降级”

阿器谈史
2025-11-02 21:47:50
即将开始!浙江明确了:年龄放宽至38周岁

即将开始!浙江明确了:年龄放宽至38周岁

FM93浙江交通之声
2025-11-03 14:08:03
市委书记女儿去县财政局工作,局长处处为难她,某天书记来探班

市委书记女儿去县财政局工作,局长处处为难她,某天书记来探班

秋风专栏
2025-10-23 11:23:56
14场13胜!创64年纪录!全欧神帅诞生,放弃2亿巨星,成神来之笔

14场13胜!创64年纪录!全欧神帅诞生,放弃2亿巨星,成神来之笔

阿泰希特
2025-11-03 10:50:12
小米粥再次被关注,研究发现:高血糖患者喝小米粥,或有8大改变

小米粥再次被关注,研究发现:高血糖患者喝小米粥,或有8大改变

周哥一影视
2025-11-01 09:05:09
忠告全天下子女:再孝顺,也不要为年过70的老父老母,做这4件事

忠告全天下子女:再孝顺,也不要为年过70的老父老母,做这4件事

小小包工头阿汾
2025-11-03 08:01:59
被叶柯榨干!47岁黄晓明大变样,满脸褶子还秃顶,小餐馆吃面太憔悴

被叶柯榨干!47岁黄晓明大变样,满脸褶子还秃顶,小餐馆吃面太憔悴

八星人
2025-11-03 16:17:52
英超最新积分战报:纽卡爆冷被灌3球,曼城升第2,曼联第8名

英超最新积分战报:纽卡爆冷被灌3球,曼城升第2,曼联第8名

足球狗说
2025-11-03 07:58:25
员工离职当天手机被公司远程一键清空,一审:驳回员工全部诉讼,二审:公司侵权

员工离职当天手机被公司远程一键清空,一审:驳回员工全部诉讼,二审:公司侵权

FM93浙江交通之声
2025-11-03 10:08:46
惨绝人寰!苏丹叛军屠城,两天处决2000妇女儿童,加沙惨案重现?

惨绝人寰!苏丹叛军屠城,两天处决2000妇女儿童,加沙惨案重现?

人物故事分享
2025-11-03 07:40:03
2025-11-03 21:20:49
量子位 incentive-icons
量子位
追踪人工智能动态
11620文章数 176322关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

男子夜钓遭枪击 家属:4人当场逃跑 伤者走回家后倒地

头条要闻

男子夜钓遭枪击 家属:4人当场逃跑 伤者走回家后倒地

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

男导演曝丑闻 蒋欣的含金量还在上升

财经要闻

最新省市GDP:谁在飙升,谁掉队了?

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

游戏
本地
手机
时尚
公开课

盘点8款PS5上最棒的Xbox第一方游戏:你玩过哪些?

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

手机要闻

华为打通苹果生态!HarmonyOS 6.0预计12月支持iOS互传文件功能

伊姐周日热推:电视剧《三人行》;电视剧《棕眼之谜》......

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版