网易首页 > 新闻中心 > 新闻 > 正文

AIGC安全研究报告:97%的应用在部署内容安全机制下,仍会生成风险内容

0
分享至

(原标题:AIGC安全研究报告:97%的应用在部署内容安全机制下,仍会生成风险内容)

 

image.png

 

人工智能技术在推动科技向星辰大海探索的同时,也在挑战一系列颠覆现有认知之外的伦理、内容、数据安全问题,AIGC安全风险迫切需要对症解决。

69日,AIGC安全实验室、博特智能、创业黑马联合发布了首份《AIGC安全研究报告》(以下简称安全报告),从AIGC框架安全、内容安全、数据安全三大维度全面介绍了当前生成式人工智能带来的新型数据泄露、赋能网络攻击及内容滥用的风险问题。

随着人工智能技术的持续进化和AI大模型的迅速落地,AIGC(Al-Generated Content)技术得到深度应用,在提高生产效率,降低制作成本,同时满足不同客户个性化需求方面得到广泛认可和追捧,目前已在写作、视频、音乐、绘画等领域多点爆发。

生成式AI服务的大规模出现,同时也让数据真实性、内容合规性、漏洞病毒攻击,以及伦理问题遭到空前挑战。AIGC时代,我们该如何进行安全合规治理?

近日,高层会议也为AIGC安全治理指明了方向,由中央国家安全委员会审议通过了《加快建设国家安全风险监测预警体系的意见》、《关于全面加强国家安全教育的意见》等文件。会议强调,要提升网络数据人工智能安全治理水平、加快建设国家安全风险监测预警体系、推进国家安全法治建设、加强国家安全教育等方面工作。

在此期间,博特智能AIGC安全实验室对市面上9大领域主流AIGC应用进行了抽样评测(应用类型涵盖Al聊天、Al写作、Al绘画、Al图像、Al文案、Al设计、Al办公、Al音频和Al视频)。《安全报告》指出,此次评测结果发现97%的应用已经部署内容安全机制,能够对中文提示词和违规内容进行拦截过滤,但通过提示词调整(例如,采用英文提示词或其他描述方式),99%AIGC应用仍然会生成违规内容。此外,评测数据显示传统的Al内容识别方式对AIGC内容识别率大幅度降低,尤其在Al写作内容的真实性和Al图像二次创作后的违规识别上表现更为突出。

此次评测依据国家网信办411日颁布的《生成式人工智能服务管理办法(征求意见稿)》,采用定量注入负样本特征提示词方式,对被测应用的内容安全机制是否健全和生成内容是否违规进行检测。违规内容包括:敏感信息、有害信息、不良信息和虚假信息4大类。

此次发布的《AIGC安全研究报告》也对AIGC数据泄露、数据污染、数据合成等10种技术攻击手段以及面临的多重安全风险进行了详细阐述。如模型算法攻击挑战;数据非法获取、敏感信息、数据泄露及恶意滥用等数据安全问题;AIGC可能带来数据伪造的风险;AIGC可能带来的“数据投毒”风险问题。

当前,生成式人工智能(AIGC)技术也在助推网络安全行业的发展。以ChatGPT 为代表的生成式人工智能(AIGC)技术快速演进迭代。从攻击者的角度来看,恶意攻击代码和钓鱼攻击变得“唾手可得”,大大降低了网络犯罪的门槛,同时加剧了数据泄露以及个人隐私泄露等问题。而从防御者的角度来看,生成式人工智能(AIGC)技术浪潮又加快了安全知识与经验的大规模复制速度,提升了安全代码生成、智能研判等领域的实现效率,且为数据安全防护的实现路径提供了新的解决思路。在“矛”与“盾”角逐中,对人工智能领域的安全规范化监管要求也迫在眉睫,从而催生了涵盖生成式人工智能(AIGC)内容鉴伪、安全评估与咨询服务等为代表的一系列AI安全治理相关的全新市场机遇。

值得关注的是,在AIGC领域专业的安全产品还非常少。今年3月,微软推出的Microsoft Security Copilot,也是目前市面上唯一一个生成式Al安全产品。

作为国内首个 AIGC 领域空间安全测绘研究实验室——博特智能 AIGC 安全实验室旨在为AIGC技术构建安全边界,立足于网络空间安全领域,通过开展创新性前沿研究,为互联网用户、技术开发者和监管部门提供安全监测情报与解决方案。

AIGC应用安全评测解决方案

30+违规线索库和提示词生成模型为基础,对AI应用回答的图片、文字、视频进行审核。检测范围包括涉政涉暴、涉敏感人物、涉黄、信息安全等内容,以及AI应用严谨的思维以及认知是否符合道德标准、遗漏的屏蔽词和屏蔽词的变形体、数据质量、数据来源和数据的准确性。

AIGC内容安全合规解决方案

AIGC内容风控解决方案是一种致力于处理AI赋能内容产生过程中的版权、内容审查和合规性难题的工具。无论是内容生成、社交媒体管理,还是音视频制作等多样化的应用场景,都能找到其应用之处。此方案能帮助AIGC产品开发商、服务提供方进行有效的内容审查,精细化管理训练数据,提升内容生成的透明度和解释性,并确保所有内容严格遵守各项法规,符合监管要求。通过AIGC内容风控,可以有效降低合规风险,提升内容质量,增强公众的信任度,使产品和服务更具价值。

AIGC安全研究报告》更多研究内容,请到AIGC安全实验室官网进行全文下载。



相关推荐
热点推荐
突然悟了孙楠当年退赛的原因,今晚之后,孙楠的口碑180度大反转

突然悟了孙楠当年退赛的原因,今晚之后,孙楠的口碑180度大反转

热剧迷
2024-06-01 05:50:48
四十岁大叔坐火车,用手机向窗外拍照,被其他乘客怀疑是间谍

四十岁大叔坐火车,用手机向窗外拍照,被其他乘客怀疑是间谍

西游日记
2024-05-31 19:58:44
白醋加花露水,没想到这么厉害,解决了家中的大烦恼,一定要试试

白醋加花露水,没想到这么厉害,解决了家中的大烦恼,一定要试试

阿坤库
2024-05-29 22:58:19
27岁志田千阳采访照火到国外,号称最美女运动员,中国男网友着迷

27岁志田千阳采访照火到国外,号称最美女运动员,中国男网友着迷

娱乐白名单
2024-05-31 14:12:56
食量巨大!辽篮功勋外援吃炒饭看呆球迷 要求厨师加七个蛋

食量巨大!辽篮功勋外援吃炒饭看呆球迷 要求厨师加七个蛋

胖子喷球
2024-06-01 10:39:06
台媒疑曝出小箖箖被转学真相!小箖箖经常无故旷课,大S投诉老师

台媒疑曝出小箖箖被转学真相!小箖箖经常无故旷课,大S投诉老师

娱乐八卦木木子
2024-06-01 08:43:36
女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

女人在过夫妻性生活时,为什么总发出声音?医生:大多数人不了解

皮皮讲文
2024-01-02 10:36:17
不留情面!前队长惠若琪发文怒批蔡斌教练组,4大问题耽误发展

不留情面!前队长惠若琪发文怒批蔡斌教练组,4大问题耽误发展

宝哥精彩赛事
2024-06-01 14:51:29
沿着国道看长白丨 欲知喜乐 纵情跋涉

沿着国道看长白丨 欲知喜乐 纵情跋涉

冬天来旅游
2024-05-31 10:53:50
美国和欧盟对中国商品出口的最新打击

美国和欧盟对中国商品出口的最新打击

匹夫来搞笑
2024-06-01 00:24:26
汪峰为森林北写新歌!歌词和给章子怡写的反差大,森林北甜蜜回应

汪峰为森林北写新歌!歌词和给章子怡写的反差大,森林北甜蜜回应

古希腊掌管月桂的神
2024-05-30 14:04:59
美图分享六月

美图分享六月

花小猫的美食日常
2024-06-01 10:17:53
将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

将船拖走!中方下达最后通牒!西部战区司令被撤职,菲方彻底慌了

慎独赢
2024-05-24 13:05:54
镰刀正在疯狂收割底层!(随时删!)

镰刀正在疯狂收割底层!(随时删!)

星河逍遥游
2024-05-24 14:10:29
罗伊基恩被袭击后的反应告诉我们,人老了是会变怂的

罗伊基恩被袭击后的反应告诉我们,人老了是会变怂的

元爸体育
2024-05-31 21:09:52
看了鸨鸟怎么交配,才知道古代青楼的老板娘,为何叫“老鸨”!

看了鸨鸟怎么交配,才知道古代青楼的老板娘,为何叫“老鸨”!

大宗看萌宠
2024-05-31 07:12:00
特朗普因祸得福?马斯克、阿克曼等大佬表态力挺,网络捐款也暴增!

特朗普因祸得福?马斯克、阿克曼等大佬表态力挺,网络捐款也暴增!

财联社
2024-06-01 08:32:08
密密麻麻大爆发!武汉已进高峰必注意这些……

密密麻麻大爆发!武汉已进高峰必注意这些……

童童聊娱乐啊
2024-06-01 09:51:19
一汽丰田新款皇冠陆放上市,至高降价4.9万元

一汽丰田新款皇冠陆放上市,至高降价4.9万元

界面新闻
2024-05-30 22:21:00
张韶涵演唱会超薄黑丝

张韶涵演唱会超薄黑丝

阿芒娱乐说
2024-06-01 10:23:19
2024-06-01 15:56:49

头条要闻

法国确认不邀请俄方参加诺曼底登陆纪念活动 克宫回应

头条要闻

法国确认不邀请俄方参加诺曼底登陆纪念活动 克宫回应

体育要闻

"失业"一年了 33岁的德赫亚路在何方

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

财经要闻

实锤!普华永道,危!

科技要闻

华为上新!余承东:问界6月销量将超4万辆

汽车要闻

吉利银河E5 Flyme Auto智能座舱首发

态度原创

教育
家居
艺术
数码
公开课

教育要闻

5月29日湖南郴州,各科老师花式为高三考生送考,“哲学、法学、经济学,如意考上好大学。”“重力、弹力...

家居要闻

风雅自来 中式的和谐平衡

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

数码要闻

AMD调整800系列芯片组功能 X870成为B650E的继任者

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版
×