网易首页 > 网易号 > 正文 申请入驻

国内首份《大语言模型提示注入攻击安全风险分析报告》

0
分享至

伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。

大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。

目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。

为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。

测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。

基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
活久见!因女生投诉男子光膀健身不雅,浙江一健身房禁止女性入店

活久见!因女生投诉男子光膀健身不雅,浙江一健身房禁止女性入店

火山詩话
2026-05-24 12:20:45
两日连坠毁两架,还全是中国战机!巴基斯坦一口咬定:非人为失误

两日连坠毁两架,还全是中国战机!巴基斯坦一口咬定:非人为失误

凡知
2026-05-23 17:47:32
爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

爆锅了!一女子直言再穷,也绝不会去夜店做公主,炸出1.2万评论

火山詩话
2026-05-24 06:41:17
智胜特朗普?美媒酸了:中国这招,真“高”!

智胜特朗普?美媒酸了:中国这招,真“高”!

观察者网
2026-05-24 16:22:27
报价4.3亿英镑也不能卖!瓜迪奥拉向新帅马雷斯卡点明曼城非卖品

报价4.3亿英镑也不能卖!瓜迪奥拉向新帅马雷斯卡点明曼城非卖品

夜白侃球
2026-05-24 10:08:00
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
徐静蕾十月官宣生子,黄立行十六年等待终有果

徐静蕾十月官宣生子,黄立行十六年等待终有果

暖心萌阿菇凉
2026-05-24 11:18:38
俄祭出杀手锏,“榛树”砸向基辅,俄博主对克宫发出灵魂质问

俄祭出杀手锏,“榛树”砸向基辅,俄博主对克宫发出灵魂质问

史政先锋
2026-05-24 12:57:57
黄百鸣到底多有钱?很多人没啥概念,向华强在他跟前也得甘拜下风

黄百鸣到底多有钱?很多人没啥概念,向华强在他跟前也得甘拜下风

南万说娱26
2026-05-24 11:45:08
一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

一定要多读书,书读的多了才会明白:“底层无贵人、底层无社交”

心理观察局
2026-05-24 06:57:19
北师大男生拒绝插空上桌吃饭,透露出的不是男女对立,是老师的无能!

北师大男生拒绝插空上桌吃饭,透露出的不是男女对立,是老师的无能!

人间运行手册
2026-05-23 08:01:42
女飞行员突破12G过载, 无氧气面罩肉身硬抗, 满脸轻松笑晕网友

女飞行员突破12G过载, 无氧气面罩肉身硬抗, 满脸轻松笑晕网友

扮猫骑老虎
2026-05-22 21:19:32
为何日本面积那么小,还能住下1.24亿人,且家家都是独栋?

为何日本面积那么小,还能住下1.24亿人,且家家都是独栋?

抽象派大师
2026-05-22 16:51:49
连续两周获亚军!马来西亚大师赛:陈雨菲决赛0-2不敌因达农

连续两周获亚军!马来西亚大师赛:陈雨菲决赛0-2不敌因达农

全景体育V
2026-05-24 15:23:20
福建本地人谈“毒杨梅”:果农们没必要委屈,你敢对妈祖发誓不知道泡药的事吗?

福建本地人谈“毒杨梅”:果农们没必要委屈,你敢对妈祖发誓不知道泡药的事吗?

风向观察
2026-05-23 21:39:35
凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

凭什么让我滚出中国?张本智和回老家祭祖遭村民抵制,差点动手!

拳击时空
2026-05-16 06:13:06
舔狗经济全面崩盘!女方吐槽忘带伞,男方直言“没伞不会买一把”

舔狗经济全面崩盘!女方吐槽忘带伞,男方直言“没伞不会买一把”

火山詩话
2026-05-24 10:52:00
山西这个煤矿爆炸,死亡数字的变化中隐藏着什么?

山西这个煤矿爆炸,死亡数字的变化中隐藏着什么?

靠山屯闲话
2026-05-23 18:13:38
周冬雨“拔萝卜”的瓜!

周冬雨“拔萝卜”的瓜!

八卦疯叔
2026-05-23 11:01:00
“厕所爆满,都在查看股票账户!”全球“最牛股市”,还能走多远?

“厕所爆满,都在查看股票账户!”全球“最牛股市”,还能走多远?

证券时报
2026-05-24 07:42:35
2026-05-24 17:59:00
环球Tech incentive-icons
环球Tech
环球科技范儿,关注科技圈动态
54468文章数 65206关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

花670多万买的中式小院是"弯的" 业主崩溃:很难看

头条要闻

花670多万买的中式小院是"弯的" 业主崩溃:很难看

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

李晨郑恺冲上热搜!跑男停宣引热议

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

手机
时尚
艺术
数码
公开课

手机要闻

iOS 27相机大升级,拍照更懂你

伊姐周六热推:电视剧《嫁金枝》;电视剧《大唐迷雾 第一季》......

艺术要闻

孙过庭写给武则天的草书!超越了张旭、怀素,辽宁博物馆视为“镇馆之宝”

数码要闻

OPPO Reno 16官宣AI键,一键闪记有多强?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版