网易首页 > 网易号 > 正文 申请入驻

理论丨生成式人工智能滥用恶用的安全威胁及对策建议研究

0
分享至

以ChatGPT为代表的生成式人工智能(AI Generated Content, AIGC)给人类社会带来了巨大的技术红利,为第四次工业革命提供了新动能。但也逐渐暴露出一系列安全风险。尤其是2022年下半年以来,暗网涌现出WormGPT、PoisonGPT、EvilGPT等一批恶意人工智能大模型,给AIGC的安全治理带来了新的严峻挑战,亟待未雨绸缪加强治理。

一、

生成式人工智能滋生了恶意大模型的新威胁

生成式人工智能滋生了一批恶意人工智能大模型。恶意人工智能大模型是指由非法组织或不法分子操纵,借助开源模式模仿ChatGPT等合法模型,基于有害语料库训练而生滋生的、专门用于网络犯罪、诈骗等非法行为的一类非法大模型。恶意大模型与人工智能的滥用还不尽相同,其产生的直接目的就是用于各类非法行为,主要运行于暗网,具有更强的隐蔽性、危害性,形成了“人工智能+犯罪”新治理挑战,对国家安全、行业创新、生产生活等方面造成危害。

图片

(一)对维护国家安全提出新挑战

滥用恶用AIGC给国家政治和军事带来了新的安全挑战。一是在意识形态安全方面,AIGC在数据投喂、算法训练等环节易受到核心技术掌控方操纵,出现污染投毒和算法偏见等问题。可能成为西方国家对华“认知战”的新工具。二是在技术自主可控方面,霸权国家主导AIGC标准制定,技术相对弱势的国家可能盲目大规模进行产品使用和追随开发,出现因科技封锁和贸易制裁等遭遇“卡脖子”危险。三是在国防军事安全方面,AIGC提高了作战人员、武器和指挥信息系统的智能交互水平,对历史战况和现实情报通过先进算法进行快速推演分析,提升打击精度和反应速度。美国军方在2023年已开始利用AIGC撰写国防咨询报告,并成立Lima工作组在五角大楼评估、整合和使用该技术。

(二)对行业应用创新造成新冲击

滥用恶用AIGC给产业和行业发展带来了新的安全冲击。一是在教育就业方面,各种AIGC产品总体内容质量仍良莠不齐,容易出现创作的“劣币驱逐良币”现象。利用AIGC辅助完成课业和学术研究减少了必要的批判甄别和分析研究过程,会产出更多虚假信息和学术垃圾。二是在产业转型方面,大部分传统行业数字化转型进程仍较为缓慢,对于正确运用AIGC收集、处理数据,并将其应用于研发、生产、销售等各环节的意愿和能力尚且不足,大规模盲目引入AIGC可能会适得其反。

(三)对生产生活方式带来新威胁

滥用恶用AIGC给企业经营和个人生活带来了新的安全威胁。一是在企业经营安全方面,易出现数据合规风险、版权侵权、商业秘密泄露等问题。使用AIGC的分析决策黑盒、专业化团队培养、投资预算等问题也会对企业的平稳运行造成困难。二是在个人使用安全方面,山寨版GPT不断涌现,相关域名注册和盗用暴涨,频繁向用户索取信息授权,服务质量差,跑路风险高。AIGC还可绕过邮件过滤和防病毒软件等传统安全措施,生成低成本、个性化的网络钓鱼软件和虚假广告。

二、

生成式人工智能安全治理难点

(一)包容审慎存在失衡,政策尺度有待细化

AIGC是一个新生事物,其发展规律还未完全明晰,包容审慎的政策尺度和平衡点较难把握。一方面,目前AIGC安全治理政策在适应数字时代新型商业模式和秩序框架,鼓励新业态自主创新、资源共享、国际合作等方面还有待健全完善。另一方面,在AIGC政策具体实施层面还存在市场形势判断难、干预时机决断难、责任主体划分难等难点,市场主体开展安全可信技术创新激励和容错措施尚未制度化。包容审慎监管试点较少,对拟实施或已实施的监管产生的积极影响和消极影响进行评估的监管影响分析程序重视度不够,科技伦理治理公共服务平台有待建设。

(二)协同治理能力不足,联动合力有待提升

人工智能技术加速和深化了跨部门的数据共享、流程再造和业务联动。跨部门协同监管仍存在信息孤岛、职责孤岛,人工智能立法存在困境。AIGC市场主体间竞争态势强、利益冲突多、合作意愿弱,数据、技术、人才等资源的共享壁垒高,参与标准制定意愿较低,相关开源社区的建设和技术创新生态布局迟缓。

(三)监管手段相对滞后,技术赋能有待加强

“以技术管技术、以技术治技术”的监管治理体系尚不健全。在伦理安全层面,深度伪造技术层出不穷,而检测算法的泛化性、鲁棒性等还有待提升。在算法安全层面,算法安全内生机理、风险评估、全生命周期安全监测等关键技术支撑还需进一步加强。在数据安全层面,数据安全监测预警技术有待创新,数字贸易跨境监管仍有进步空间。非现场、物联感知、穿透式等新型监管手段运用不够充分,监管智能化水平有待提升。

三、

生成式人工智能安全治理对策建议

(一)健全制度规则,提升政企协同治理能力

1.政府发挥规范引导指挥棒作用

一是加大查处管控和宣传教育。实行包容审慎和分类分级监管,监控查处非法使用和传播恶意AIGC行为,管制违规账号。二是健全技术规范和评价标准。制定AIGC预训练和优化训练数据、标注、数据分类分级保护等方面的国家标准,以及深度伪造、智能群呼设备等高风险AI技术的使用规范。三是完善法律体系和制度框架。采用安全港等机制处理内容责任归属问题,加强和改进反垄断和反不正当竞争执法。探索我国数据存储体系优化,构建数据被动出境的主动防御体系,建立跨境数据流动规则和白名单等机制。

2.相关企业强化责任与安全意识

一是保障内容安全可信。采用人机审核相结合的方式弱化和删减不当内容,对AIGC进行显著标识,提供使用和退出服务简明的解决方案。考虑采用时间戳、哈希值校验、电子签名等技术手段为AIGC提供溯源与认证,主动向使用统一的AIGC数据标准或元数据标准靠拢。二是完善安全制度流程。抓取开放数据应遵循合法、正当和必要原则,敏感信息进行脱敏处理,企业内部针对不同的岗位和职级设置数据权限。设定高奖励额度的“漏洞悬赏计划”。三是配合安全监管检查。严格遵从开源许可协议规定行使开源软件的复制权、修改权、发行权。主动向主管部门申报安全评估,履行算法备案和变更等手续,提升服务透明度。对于机密程度高、创新要求高的技术密集型产业,例如军工、航天、芯片等行业在使用AIGC过程中要着重进行审慎评估和内查外纠。

(二)加强技术创新,健全安全治理技术体系

1.完善人工反馈的强化学习机制

注重对人工反馈的强化学习机制(RLHF)的优化。从与训练语言模型、收集数据并训练奖励模型、强化学习微调语言模型等阶段,降低数据成本、优化算法、改进微调策略,防止被某些策略绕开而产出不当内容,使模型与人类需求对齐。自动化调用模型知识,进一步降低对大规模高质量人工标注数据的依赖。

2.加强模型安全技术研究及应用

一是部署数据和模型安全防御。通过优化鲁棒训练算法应对数据投毒,采取截断混淆、差分隐私等手段使模型隐私信息模糊化,采取模型水印、模型指纹等溯源手段保障知识产权专有性。二是做好各类接口安全性设计。采用身份验证、日志监控、网关等技术手段加强API和网页端接口的安全防范管理。使用VPN等加密通道传输数据,部署抗DDoS工具,使用嗅探器等检测安全问题并跟踪数据泄露。三是分析研究新型LLM。探索利用人工智能工具逐步实现自动化对抗恶意AIGC,进而用大模型“对抗”大模型。

(三)优化监管手段,提升智能治理监管能力

一是完善内容分类筛选机制。完善内容分类、滥用模式捕获、人工评审决策和通知用户机制,并增强对非英语语言的支持。二是强化生成内容检测技术。通过实时聚类、特征库匹配等强化文本检测技术,依托生理信号特征、GAN图像特征、数据驱动等强化深度伪造检测技术。三是拓展监管工具场景应用。探索智能化监管手段,例如数字沙盒、隐私护盾等与相关行业企业对接。

四、

结语

本文对AIGC滥用恶用的安全治理进行了研究。归纳了滥用恶用AIGC对国家安全、行业创新、生产生活等三方面威胁,总结出AIGC政策尺度有待细化、联动合力有待提升、技术赋能有待加强等难点。最后,从健全制度规则、加强技术创新、优化监管手段等方面提出对策建议,对促进AIGC规范应用和健康发展具有重要启示作用。

(来源:《中国信息化》2023年第11期;作者:国家信息中心公共技术服务部 王晓冬 李木子)

免责声明:本文转自网络公开渠道,旨在为广大用户提供最新最全的信息,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。抄袭本文至其它渠道者引发的一切纠纷与本平台无关。

▐ 最新汇编








▐ 各地营商环境政策汇编












  • 精彩内容可进入“智库微店”购买获取!

国脉数字智库

长按扫描二维码
关注我们 获取更多资讯
客服号:echinagov-GM

关于国脉

国脉,是大数据治理、数字政府、营商环境、数字经济、政务服务、产业服务专业提供商。创新提出"软件+咨询+数据+平台+创新业务"五位一体服务模型,拥有超能城市APP营商环境流程再造系统、营商环境督查与考核评估系统、政策智能服务系统、数据基因、数据母体、产业协同平台等几十项软件产品,长期为中国智慧城市、智慧政府和智慧企业提供专业咨询规划和数据服务,广泛服务于发改委、营商环境局、考核办、大数据局、行政审批局等政府客户、中央企业和高等院校。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
意大利KTV爆发冲突 五名华人受伤三人伤势较重

意大利KTV爆发冲突 五名华人受伤三人伤势较重

奋斗在意大利
2026-06-24 03:21:01
两性关系:别不信,男性过了63岁,基本都有这十五个症状

两性关系:别不信,男性过了63岁,基本都有这十五个症状

朗威谈星座
2026-06-25 00:14:12
你敢信吗?一个美国安插在中国潜伏了多年的间谍头子,居然是他

你敢信吗?一个美国安插在中国潜伏了多年的间谍头子,居然是他

无情有思ss
2026-06-06 02:21:10
铁饭碗变天!中国教师正在批量流失,新一轮行业大洗牌已经开始

铁饭碗变天!中国教师正在批量流失,新一轮行业大洗牌已经开始

狐狸先森讲升学规划
2026-06-24 00:25:03
武则天跟李世民12年都没怀孕,为何刚嫁给李治就有了?原因很简单

武则天跟李世民12年都没怀孕,为何刚嫁给李治就有了?原因很简单

青史卷中人
2026-06-20 20:22:44
周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

周鸿祎套现离场,利润腰斩至8.8亿,留下5.8万投诉

嘴角上翘
2026-06-10 03:20:40
湖南乡村女教师工资单曝光:月薪4300,为何还说“穷到只剩3000”?

湖南乡村女教师工资单曝光:月薪4300,为何还说“穷到只剩3000”?

娱乐的宅急便
2026-06-24 16:20:49
19岁少女陷柬埔寨:父亲交11万未果,绑匪叫嚣要对其“轮流侵犯”

19岁少女陷柬埔寨:父亲交11万未果,绑匪叫嚣要对其“轮流侵犯”

烈史
2026-04-01 07:22:27
独家对话|李开复:我想通了

独家对话|李开复:我想通了

虎嗅APP
2026-06-24 18:04:40
国防科工局:坚决拥护党中央决定

国防科工局:坚决拥护党中央决定

新京报
2026-06-24 23:07:13
林志玲被曝日本“拍片”?拍摄片段流出,网友:女神怎么沦落成这样

林志玲被曝日本“拍片”?拍摄片段流出,网友:女神怎么沦落成这样

八卦王者
2026-05-10 13:32:20
印度商业高级代表团访华被震惊,回新德里后公开和政府唱反调?

印度商业高级代表团访华被震惊,回新德里后公开和政府唱反调?

瓦伦西亚月亮
2026-06-24 04:20:33
为什么说,俄罗斯这回真顶不住了

为什么说,俄罗斯这回真顶不住了

老男孩儿
2026-06-24 10:45:20
西方感到破防!为什么中国一崛起,那群移民海外的华裔反而最痛苦

西方感到破防!为什么中国一崛起,那群移民海外的华裔反而最痛苦

领悟看世界
2026-06-25 01:00:40
集体反华?七国集体签宣言:要撕毁中国王牌,中方先断供金属钨

集体反华?七国集体签宣言:要撕毁中国王牌,中方先断供金属钨

真的好爱你
2026-06-24 01:20:49
局势失控,克里米亚后勤崩盘已成定局,乌军绞杀战逼普京入绝境

局势失控,克里米亚后勤崩盘已成定局,乌军绞杀战逼普京入绝境

战域笔墨
2026-06-25 01:27:50
男子16岁时便出轨嫂子,婚后瞒着妻子继续出轨,还与嫂子生下一子

男子16岁时便出轨嫂子,婚后瞒着妻子继续出轨,还与嫂子生下一子

老猫观点
2026-05-07 07:12:10
特斯拉中国区将内置豆包大模型 首批适配新款Model Y等

特斯拉中国区将内置豆包大模型 首批适配新款Model Y等

CNMO科技
2026-06-24 15:55:17
新疆小伙撞脸耶稣,老外歧视后滑跪道歉?戴王冠化身判官,笑疯外网!

新疆小伙撞脸耶稣,老外歧视后滑跪道歉?戴王冠化身判官,笑疯外网!

英国报姐
2026-06-24 01:12:14
运城13岁女孩称被强奸,“他们逼我去撤案”

运城13岁女孩称被强奸,“他们逼我去撤案”

中国新闻周刊
2026-06-24 22:25:05
2026-06-25 03:16:49
国脉电子政务网
国脉电子政务网
国脉原道是数字政府、互联网+政务服务、营商环境、数据要素X、平台运营等领域的专业提供商。
14401文章数 1226关注度
往期回顾 全部

科技要闻

豆包专业版上线:定价68-500元每月

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

体育要闻

字母哥,会把凯尔特人拆了吗?

娱乐要闻

向佐向佑兄弟合体直播!母子终于和解

财经要闻

逃税23亿:审计署年报直指七家机构

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

本地
健康
旅游
家居
公开课

本地新闻

2026世界杯全勤太难?这份保姆级攻略请收好

神经内科专家破解中风十大谣言

旅游要闻

昆明闹市藏短巷,曾遍开赤红鹦哥花,一头贡象改了整条街名!

家居要闻

绿意盎然 自然之境

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版