网易首页 > 网易号 > 正文 申请入驻

小污染造成大危害!警惕AI数据污染引发现实风险

0
分享至

随着AI人工智能技术和应用的蓬勃发展,各类AI工具已经成为我们日常工作和生活的助手,不知不觉间,我们的生活开始与人工智能密切联系。

当AI信息“不靠谱”网民如何断真假?

不过近年来,不少网民发现,部分人工智能的回答开始有些不靠谱。先看两个案例:

今年上半年,宁波发生了两件事,被人工智能荒唐地联系在一起。

第一件事是,2月6日宁波警方注销了“宁波交警”抖音号。第二件事是,三个月后的5月2日,在浙江宁波余姚境内的省道嘉余线上,一辆未悬挂车牌的轿车在违法超车过程中撞倒一辆摩托车。小车驾驶人并未第一时间检查伤者受伤情况,而是从后备厢里拿出车牌进行安装。

当网民询问AI软件2月6日宁波交警抖音号为何注销时,人工智能给出的答案竟然是“主要与5月2日的这起交通事故引发广泛关注有关”的结论。2月份发生的账户注销的原因竟然是3个月后发生的一起交通事故。人工智能的这一回答引起了网民广泛关注,宁波交警随后进行了紧急辟谣。

去年有网民询问一款儿童手表AI软件,“中国人是世界上最聪明的人吗?”人工智能给出的回答竟是否定中国发明创造、否定中国文化的答案。这一荒唐的回答,在网络上引起轩然大波。儿童手表的厂家随后紧急道歉,称已经修正了相关数据,删除了不良信息源。

近年来,AI杜撰的信息更是数不胜数,杜撰不存在的论文以及论文的作者、网址等。AI更是成了谣言类信息的帮凶,游船侧翻、幼儿园大火等谣言都可以帮网民编造出来。

当AI数据被污染有何风险?如何防范?

刚才提到的案例,与人工智能的数据污染有着或多或少的联系。通俗来讲,如果把AI比喻成食物的话,训练数据就相当于食材,食材腐败变质,最终生产出来的食物就会有问题。

人工智能的三大核心要素是算法、算力和数据,其中数据是训练AI模型的基础要素,也是AI应用的核心资源。一旦数据受到污染,就可能导致模型决策失误甚至AI系统失效,存在一定的安全隐患。

什么是AI数据污染?分几类?

近日,国家安全部门发布提示,通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,降低其准确性,甚至诱发有害输出。

那么究竟什么是AI数据污染,数据污染分为哪几类?

网络安全专家 曹辉:数据投毒主要针对两个方面,一个是针对视觉类,一个是针对自然语言处理类。这张图片是一个斑马识别人工智能系统的训练数据。我们看到,在这张照片上很多斑马进行了标注。如何进行数据污染?就是在其中的一匹斑马身上加一个绿点。加了绿点的斑马,特意不进行标注。这样的训练数据大概会有几万张,在这几万张训练数据里面的其中三四张进行类似的污染处理,就会导致生成的人工智能模型带有后门,就会导致当它再见到类似身体上有绿点的斑马,它就不会认为这是个斑马,就导致了AI模型的判断受到干扰。

专家介绍,人工智能数据污染分为两类:

一种是人为主观恶意去篡改数据,误导人工智能的输出结果;

另一种是人工智能本身会海量的收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

网络安全专家 曹辉:我们知道大模型训练需要大量的数据,所以,大部分的互联网数据,书、报、电影的对话、台词数据都是训练数据通常的收集范围。其实我们都有可能在互联网上发一些数据,一旦这些数据是不安全的、被污染的,那可能大模型也会随之受到影响。

人工智能数据 为何小污染会造成大危害?

国家安全部数据显示,AI在训练过程中,即使是0.001%的虚假文本被采用,其有害输出也会相应上升7.2%。为何小小的污染源输出时的危害会几何级数的上升呢?

专家介绍,被污染的数据有着明显地与其他数据不同的观点和内容,这种情况下,AI很可能将污染数据标记为“有特点和高信息量”,并增加在算力中使用的比例。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:大语言模型本质上是一种统计语言模型,使用的多层神经网络架构具有高度的非线性特征。在模型训练阶段,如果训练数据集中混入了污染数据,模型可能误将污染数据判定为“有特点、有代表性、高信息量”的内容,这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生微小影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐层放大,最终导致输出结果出现明显偏差。

数据污染可能引发一系列现实风险

另外,AI数据污染还可能在金融、公共安全等领域引发一系列现实风险。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:比如在经济金融领域,一旦数据受到污染,一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策错误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。

加强源头监管 防范污染生成

针对AI数据污染,从国家安全层面,我们应该如何防范风险?专家表示,应加强源头监管,防范污染生成。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:要制定明确的数据采集规范,使用安全可信的数据源,构建数据标签体系,采用严格的访问控制和审计等安全措施。

其次,可以使用自动化工具、人工审查以及AI算法相结合的方式,对数据不一致性、格式错误、语法语义冲突等问题进行分析和处理。

安全机关此前针对AI数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

对于广大网友而言,我们在日常生活和工作中,又应该如何防范AI数据污染的风险呢?

网警提醒:

一是使用正规平台和企业提供的AI工具;

二是科学合理地使用AI工具,AI产生的结果可以参考,但不能盲信;

三是注意保护个人信息,避免不必要的个人隐私暴露,同时不作不良信息的投喂者,共同守护网络家园。

原标题:《小污染造成大危害!警惕AI数据污染引发现实风险》

栏目主编:顾万全 文字编辑:程沛 题图来源:上观题图

来源:作者:央视新闻客户端

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拼多多暴力抗法震惊全网,市值万亿巨头为何如此嚣张

拼多多暴力抗法震惊全网,市值万亿巨头为何如此嚣张

燕梳楼频道
2026-04-20 21:12:04
美方扣押一艘中国驶来伊朗货船,外交部:对美方强制截停有关船只表示关切

美方扣押一艘中国驶来伊朗货船,外交部:对美方强制截停有关船只表示关切

澎湃新闻
2026-04-20 15:42:26
原雷神山院长落马,其“权色交易”的背后,坑害了多少女医护家庭

原雷神山院长落马,其“权色交易”的背后,坑害了多少女医护家庭

长安一孤客
2026-04-20 18:58:28
嚣张!拼多多竟把执法人员手指夹骨折。网友调侃:“砍一刀”不是白叫的,15 亿罚轻了

嚣张!拼多多竟把执法人员手指夹骨折。网友调侃:“砍一刀”不是白叫的,15 亿罚轻了

新浪财经
2026-04-20 07:43:33
阿什拉夫:我们已经尽力了;球队做了该做的一切只是缺乏效率

阿什拉夫:我们已经尽力了;球队做了该做的一切只是缺乏效率

懂球帝
2026-04-20 06:56:12
伊朗籍中国货轮!在公海被美军扣押后,不到24小时,中方表态

伊朗籍中国货轮!在公海被美军扣押后,不到24小时,中方表态

离离言几许
2026-04-20 22:15:30
李小冉发文:唱了一下午,吃吃喝喝回回血,疑似回应退出浪姐传闻

李小冉发文:唱了一下午,吃吃喝喝回回血,疑似回应退出浪姐传闻

暖心萌阿菇凉
2026-04-19 23:25:00
联合国:加沙3.8万多名女性被以军杀害

联合国:加沙3.8万多名女性被以军杀害

参考消息
2026-04-20 13:10:03
普京访华行程敲定,特朗普已下命令,中国向全球通告,无惧美国

普京访华行程敲定,特朗普已下命令,中国向全球通告,无惧美国

桑启红原
2026-04-20 20:19:05
马卡:马竞全队返航时飞机上弥漫着葬礼般的氛围

马卡:马竞全队返航时飞机上弥漫着葬礼般的氛围

懂球帝
2026-04-20 10:40:10
局面尴尬!伊朗明确不参与第二轮谈判,拒绝任何最后通牒

局面尴尬!伊朗明确不参与第二轮谈判,拒绝任何最后通牒

山河路口
2026-04-20 20:42:59
将对决赵心童!39岁丁俊晖爆发:10-5淘汰世界第25 连续2年进16强

将对决赵心童!39岁丁俊晖爆发:10-5淘汰世界第25 连续2年进16强

风过乡
2026-04-20 19:41:28
罚15亿!拼多多一员工故意关门,对抗调查,导致执法人员手指骨折

罚15亿!拼多多一员工故意关门,对抗调查,导致执法人员手指骨折

魔都姐姐杂谈
2026-04-19 08:03:27
揭开“白左圣母”的真面目

揭开“白左圣母”的真面目

名人苟或
2026-04-20 07:08:34
港媒曝张曼玉“五官彻底分离”,61岁生图惹争议,俩部位面目全非

港媒曝张曼玉“五官彻底分离”,61岁生图惹争议,俩部位面目全非

冷紫葉
2026-04-20 17:12:17
19岁女孩挪用自家1700万当“榜一大姐” 亲爹带女儿自首:坐牢才有可能追回钱款

19岁女孩挪用自家1700万当“榜一大姐” 亲爹带女儿自首:坐牢才有可能追回钱款

封面新闻
2026-04-20 17:48:14
海外版“砍一刀”被美国消费者疯狂吐槽:这质量就是中国制造?

海外版“砍一刀”被美国消费者疯狂吐槽:这质量就是中国制造?

可达鸭面面观
2026-04-20 16:18:29
看哭了!张雪车队64号频频摔车垫底,原来他的职责根本不是拿奖

看哭了!张雪车队64号频频摔车垫底,原来他的职责根本不是拿奖

人间烟火记事本
2026-04-21 00:57:18
河南一男子因病偏瘫,觉得亏欠妻子主动离婚,女儿摆酒席庆祝:他们开心就好,离婚不离家,母亲继续照顾父亲,房车等全部财产都在母亲名下

河南一男子因病偏瘫,觉得亏欠妻子主动离婚,女儿摆酒席庆祝:他们开心就好,离婚不离家,母亲继续照顾父亲,房车等全部财产都在母亲名下

洪观新闻
2026-04-20 16:20:08
郑丽文回应“大陆武统”,作出满分回答,还给民进党指了一条明路

郑丽文回应“大陆武统”,作出满分回答,还给民进党指了一条明路

头条爆料007
2026-04-19 20:27:52
2026-04-21 02:36:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
469838文章数 760917关注度
往期回顾 全部

科技要闻

HUAWEI Pura X Max发布 售价10999元起

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

亲子
家居
教育
游戏
公开课

亲子要闻

【孤独症科普】啥是孤独症,哪些孩子易发生,如何应对?

家居要闻

自然慢调 慢享时光

教育要闻

最新!三十五中落户顺义,高中部面向西城、顺义招生

大司马回归两个月,某音人气稳居顶流行列,道出风光背后心酸现状

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版