网易首页 > 网易号 > 正文 申请入驻

山石说AI|突破模糊测试极限:大模型驱动的软件漏洞深度挖掘

0
分享至

【山石说AI】•第15篇

大模型在网络安全中的最新应用进展(四)

软件漏洞的发现向来是一场与时间的赛跑,而大模型的引入为模糊测试注入了全新的智慧动力。跳脱传统随机变异的局限,大模型精准的语言和逻辑推理能力正重新定义模糊测试的效率与深度,助力安全团队快速定位潜在威胁,为软件安全提供更强的护盾。

传统的模糊测试技术在揭示软件漏洞方面虽有效,但其固有的局限性可能会影响测试的效率和效果。一个显著缺点是传统模糊测试器主要以随机或半随机的方式运行,这导致测试过程可能耗时且效果不佳,因为它们无法探索所有可能的执行路径。此外,用于变异的种子通常由人类手工构造,耗时较长。尽管多年来已对此类问题进行了研究,并提出了许多缓解方法,但大模型的出现为模糊测试领域带来了全新的思维方式。

大模型模糊测试相较于传统方法的优势有哪些?

Ying Z等人 [1]评估了ChatGPT在直接生成测试用例(无微调)方面的表现,并将其与两种传统测试工具(SIEGE和TRANSFER)进行了比较。他们的实验表明,当提供了漏洞的详细描述、可能的攻击方式以及代码上下文时,大模型的表现优于传统方法。以下是大模型相较传统工具的优势描述。一个重要因素在于大模型的出现使得模糊测试从随机变异转向引导式变异。Jie H等人 [2]向传统灰盒模糊测试添加了一个基于GPT的种子变异器,从种子池中选择种子并请求ChatGPT生成的变体以生成更高质量的输入。

另一个优势是大模型具备良好的跨编程语言理解能力,因此能够在多个编程语言中执行测试任务。Chunqiu S X等人 [3]充分利用了大模型对不同编程语言的理解。大多数传统方法只能模糊测试特定的编程语言,而基于大模型的模糊测试可以涵盖不同的语言。他们使用名为Fuzz-Loop的方法测试了6种编程语言(C、C++、Go、SMT2、Java和Python)的代码,该方法能自动变异测试用例。大多数传统模糊测试方法难以覆盖所有代码,而掌握了代码逻辑的大模型可以针对低覆盖率代码生成更具针对性的测试用例。例如,Caroline L等人 [4]在SBST(基于搜索的软件测试,一种传统的模糊测试方法)达到覆盖率瓶颈时,使用Codex生成针对低覆盖率函数的测试用例。具体来说,Codex生成的原始字符序列被反序列化为SBST的内部测试用例表示,以利用SBST的变异操作和适应性函数。

根据测试对象的不同,在使用大模型时策略可能需要适当调整。

对于一般API的测试,Cen Z等人 [5]分析方法进行了比较,发现大模型可以在较少的人工干预下自动生成大量有效的模糊测试驱动程序。该研究引入了查询策略、迭代改进和使用示例来提升大模型的表现。尽管这主要涉及API测试,但对于深度学习库的测试策略则需要进行调整。调用深度学习库的程序通常对张量维度有严格要求,否则模糊测试器会执行大量无意义的测试。

Yinlin D等人 [6]提出了TitanFuzz,一种用于深度学习库的测试用例生成工具。他们的训练语料库包含大量调用深度学习库API的代码片段,因此可以隐式学习语言的语法/语义和复杂的深度学习API约束,以高效生成深度学习程序。另一项研究FuzzGPT(同样由Yinlin D等人进行)也关注深度学习库的模糊测试,与前一项研究不同,FuzzGPT侧重于利用历史触发错误的代码片段来指导大模型生成测试用例。

除了上述研究外,我们还收集了一些针对其他测试对象的文献。针对协议的测试,Ruijie M等人 [7]讨论了如何在缺少机器可读的协议规范情况下查找协议实现中的安全漏洞。他们通过大量人类可读的协议文档对大模型进行训练,并要求大模型对协议交互消息进行变异,以实现协议模糊测试(如HTTP)。针对BusyBox的测试,Asmita等人 [8]专门针对在基于Linux的设备上广泛使用的BusyBox,提出了两种方法:利用大模型生成目标特定的初始种子以进行模糊测试,这显著提高了识别崩溃和潜在漏洞的效率;以及“崩溃重用”,利用之前获得的崩溃数据来优化新目标的测试流程。

向上滑动,查看所有参考文献

1.Ying Zhang, Wenjia Song, Zhengjie Ji, Danfeng, Yao, and Na Meng. How well does llm generate security tests? arXiv preprint arXiv:2310.00710, 2023.

2.Jie Hu, Qian Zhang, and Heng Yin. Augmenting greybox fuzzing with generative ai. arXiv preprint arXiv:2306.06782, 2023.

3.Chunqiu Steven Xia, Matteo Paltenghi, Jia Le Tian, Michael Pradel, and Lingming Zhang. Fuzz4all: Universal fuzzing with large language models. arXiv preprint arXiv:2308.04748, 2024.

4.Caroline Lemieux, Jeevana Priya Inala, Shuvendu K. Lahiri, and Siddhartha Sen. Codamosa: Escaping coverage plateaus in test generation ·with pre-trained large language models. In 2023 IEEE/ACM 45th International Conference on Software Engineering (ICSE), pages 919–931, 2023.

5.Cen Zhang, Mingqiang Bai, Yaowen Zheng, Yeting Li, Xiaofei Xie, Yuekang Li, Wei Ma, Limin Sun, and Yang Liu. Understanding large language model based fuzz driver generation. arXiv preprint arXiv:2307.12469, 2023.

6.Yinlin Deng, Chunqiu Steven Xia, Haoran Peng, Chenyuan Yang, and Lingming Zhang. Large language models are zero-shot fuzzers: Fuzzing deep-learning libraries via large language models. In Proceedings of the 32nd ACM SIGSOFT International Symposium on Software Testing and Analysis, ISSTA 2023, page 423–435, New York, NY, USA, 2023. Association for Computing Machinery.

7.Ruijie Meng, Martin Mirchev, Marcel Böhme, and Abhik Roychoudhury. Large language model guided protocol fuzzing. In Proceedings of the 31st Annual Network and Distributed System Security Symposium (NDSS), 2024.

8.Asmita, Yaroslav Oliinyk, Michael Scott, Ryan Tsang, Chongzhou Fang, and Houman Homayoun. Fuzzing busybox: Leveraging llm and crash reuse for embedded bug unearthing. arXiv preprint arXiv:2403.03897, 2024.

“码”上阅读

【山石说AI】全系列文章

山石网科是中国网络安全行业的技术创新领导厂商,由一批知名网络安全技术骨干于2007年创立,并以首批网络安全企业的身份,于2019年9月登陆科创板(股票简称:山石网科,股票代码:688030)。

现阶段,山石网科掌握30项自主研发核心技术,申请540多项国内外专利。山石网科于2019年起,积极布局信创领域,致力于推动国内信息技术创新,并于2021年正式启动安全芯片战略。2023年进行自研ASIC安全芯片的技术研发,旨在通过自主创新,为用户提供更高效、更安全的网络安全保障。目前,山石网科已形成了具备“全息、量化、智能、协同”四大技术特点的涉及边界安全、云安全、数据安全、业务安全、内网安全、智能安全运营、安全服务、安全运维等八大类产品服务,50余个行业和场景的完整解决方案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
婴儿出生6天被月嫂摔至颅内出血,月子中心老板:我申请破产了,你找律师去;街道工作人员:会全程跟进

婴儿出生6天被月嫂摔至颅内出血,月子中心老板:我申请破产了,你找律师去;街道工作人员:会全程跟进

南国今报
2026-01-29 21:04:53
宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

历史大学堂
2026-01-31 19:34:36
章龄之:和薛之谦分手后,闪婚认识15天的陈龙,如今她后悔吗?

章龄之:和薛之谦分手后,闪婚认识15天的陈龙,如今她后悔吗?

借你一生
2026-02-01 12:37:45
为什么大多数中国家长无法独立带娃?网友的分享犹如醍醐灌顶

为什么大多数中国家长无法独立带娃?网友的分享犹如醍醐灌顶

另子维爱读史
2026-01-31 20:12:55
内蒙古一银行员工将11位储户220万存款转走并已挥霍,银行称员工已离岗不愿承担赔偿,法院一审判储户败诉

内蒙古一银行员工将11位储户220万存款转走并已挥霍,银行称员工已离岗不愿承担赔偿,法院一审判储户败诉

扬子晚报
2026-01-31 18:35:39
女性绝经后,还能进行夫妻生活吗?下面干巴巴的,究竟该怎么办?

女性绝经后,还能进行夫妻生活吗?下面干巴巴的,究竟该怎么办?

医者荣耀
2025-12-11 12:05:05
曹操为什么喜欢寡妇?许多人不明白,看完不得不佩服曹操的智慧

曹操为什么喜欢寡妇?许多人不明白,看完不得不佩服曹操的智慧

铭记历史呀
2026-01-29 18:27:55
场均27分5助,等来最残酷结局!不如赛季报销,本赛季希望不大了

场均27分5助,等来最残酷结局!不如赛季报销,本赛季希望不大了

老梁体育漫谈
2026-02-02 00:10:41
官二代高速上殴打宝马车主,一小时后被十几辆装甲车包围

官二代高速上殴打宝马车主,一小时后被十几辆装甲车包围

历史八卦社
2024-09-14 16:48:46
“全面拆迁”来了?2026年住建部已明确,这两类房子或将统通拆迁

“全面拆迁”来了?2026年住建部已明确,这两类房子或将统通拆迁

趣文说娱
2026-01-31 19:23:15
李煜至死没想通:最该联手的钱弘俶,为何捅他一刀?

李煜至死没想通:最该联手的钱弘俶,为何捅他一刀?

爱历史
2026-01-25 11:25:36
任达华当年铁心丁克和琦琦潇洒满世界飞,结果2006年琦琦意外怀孕

任达华当年铁心丁克和琦琦潇洒满世界飞,结果2006年琦琦意外怀孕

百态人间
2026-01-31 15:33:07
利物浦1.5亿双星6次连线领跑英超,乔科尔:令人恐惧

利物浦1.5亿双星6次连线领跑英超,乔科尔:令人恐惧

阿嚼影视评论
2026-02-01 10:53:19
猛料!女星自曝儿子在美国海底捞打工,时薪40到60块,自己很心疼

猛料!女星自曝儿子在美国海底捞打工,时薪40到60块,自己很心疼

小徐讲八卦
2026-01-31 11:57:22
李亚鹏,一夜卖了1.6亿元茶

李亚鹏,一夜卖了1.6亿元茶

第一财经资讯
2026-02-01 23:29:16
2-2!20战22球,凯恩超越姆巴佩,拜仁客场爆冷,连续2轮不胜

2-2!20战22球,凯恩超越姆巴佩,拜仁客场爆冷,连续2轮不胜

我的护球最独特
2026-02-01 03:39:16
别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

复转这些年
2026-01-20 08:10:05
市委实习生刮擦豪车,遭车主暴打敲诈索赔十万,不料对方背景通天

市委实习生刮擦豪车,遭车主暴打敲诈索赔十万,不料对方背景通天

叶天辰故事会
2024-03-27 12:43:10
瑞典,挪威,芬兰北欧三国地处恶劣寒地,经济实力为何如此强大呢

瑞典,挪威,芬兰北欧三国地处恶劣寒地,经济实力为何如此强大呢

向航说
2025-12-17 00:05:03
重磅!NBA官宣乔治违反禁药政策禁赛25场 损失1174万美元已道歉

重磅!NBA官宣乔治违反禁药政策禁赛25场 损失1174万美元已道歉

醉卧浮生
2026-02-01 01:26:16
2026-02-02 01:12:49
山石网科新视界
山石网科新视界
网络安全行业的创新领导厂商
1388文章数 138关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

手机
数码
本地
时尚
公开课

手机要闻

消息称一加16长焦镜头将升级至2亿像素,有望支持长焦微距功能

数码要闻

小米抢票模式覆盖更多机型,2月超级服务周开启

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

“多巴胺风”又又又火了!这样穿时髦又减龄

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版