网易首页 > 网易号 > 正文 申请入驻

小污染造成大危害!警惕AI数据污染引发现实风险

0
分享至

随着AI人工智能技术和应用的蓬勃发展,各类AI工具已经成为我们日常工作和生活的助手,不知不觉间,我们的生活开始与人工智能密切联系。

当AI信息“不靠谱”网民如何断真假?

不过近年来,不少网民发现,部分人工智能的回答开始有些不靠谱。先看两个案例:

今年上半年,宁波发生了两件事,被人工智能荒唐地联系在一起。

第一件事是,2月6日宁波警方注销了“宁波交警”抖音号。第二件事是,三个月后的5月2日,在浙江宁波余姚境内的省道嘉余线上,一辆未悬挂车牌的轿车在违法超车过程中撞倒一辆摩托车。小车驾驶人并未第一时间检查伤者受伤情况,而是从后备厢里拿出车牌进行安装。

当网民询问AI软件2月6日宁波交警抖音号为何注销时,人工智能给出的答案竟然是“主要与5月2日的这起交通事故引发广泛关注有关”的结论。2月份发生的账户注销的原因竟然是3个月后发生的一起交通事故。人工智能的这一回答引起了网民广泛关注,宁波交警随后进行了紧急辟谣。

去年有网民询问一款儿童手表AI软件,“中国人是世界上最聪明的人吗?”人工智能给出的回答竟是否定中国发明创造、否定中国文化的答案。这一荒唐的回答,在网络上引起轩然大波。儿童手表的厂家随后紧急道歉,称已经修正了相关数据,删除了不良信息源。

近年来,AI杜撰的信息更是数不胜数,杜撰不存在的论文以及论文的作者、网址等。AI更是成了谣言类信息的帮凶,游船侧翻、幼儿园大火等谣言都可以帮网民编造出来。

当AI数据被污染有何风险?如何防范?

刚才提到的案例,与人工智能的数据污染有着或多或少的联系。通俗来讲,如果把AI比喻成食物的话,训练数据就相当于食材,食材腐败变质,最终生产出来的食物就会有问题。

人工智能的三大核心要素是算法、算力和数据,其中数据是训练AI模型的基础要素,也是AI应用的核心资源。一旦数据受到污染,就可能导致模型决策失误甚至AI系统失效,存在一定的安全隐患。

什么是AI数据污染?分几类?

近日,国家安全部门发布提示,通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,降低其准确性,甚至诱发有害输出。

那么究竟什么是AI数据污染,数据污染分为哪几类?

网络安全专家 曹辉:数据投毒主要针对两个方面,一个是针对视觉类,一个是针对自然语言处理类。这张图片是一个斑马识别人工智能系统的训练数据。我们看到,在这张照片上很多斑马进行了标注。如何进行数据污染?就是在其中的一匹斑马身上加一个绿点。加了绿点的斑马,特意不进行标注。这样的训练数据大概会有几万张,在这几万张训练数据里面的其中三四张进行类似的污染处理,就会导致生成的人工智能模型带有后门,就会导致当它再见到类似身体上有绿点的斑马,它就不会认为这是个斑马,就导致了AI模型的判断受到干扰。

专家介绍,人工智能数据污染分为两类:

一种是人为主观恶意去篡改数据,误导人工智能的输出结果;

另一种是人工智能本身会海量的收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

网络安全专家 曹辉:我们知道大模型训练需要大量的数据,所以,大部分的互联网数据,书、报、电影的对话、台词数据都是训练数据通常的收集范围。其实我们都有可能在互联网上发一些数据,一旦这些数据是不安全的、被污染的,那可能大模型也会随之受到影响。

人工智能数据 为何小污染会造成大危害?

国家安全部数据显示,AI在训练过程中,即使是0.001%的虚假文本被采用,其有害输出也会相应上升7.2%。为何小小的污染源输出时的危害会几何级数的上升呢?

专家介绍,被污染的数据有着明显地与其他数据不同的观点和内容,这种情况下,AI很可能将污染数据标记为“有特点和高信息量”,并增加在算力中使用的比例。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:大语言模型本质上是一种统计语言模型,使用的多层神经网络架构具有高度的非线性特征。在模型训练阶段,如果训练数据集中混入了污染数据,模型可能误将污染数据判定为“有特点、有代表性、高信息量”的内容,这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生微小影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐层放大,最终导致输出结果出现明显偏差。

数据污染可能引发一系列现实风险

另外,AI数据污染还可能在金融、公共安全等领域引发一系列现实风险。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:比如在经济金融领域,一旦数据受到污染,一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策错误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。

加强源头监管 防范污染生成

针对AI数据污染,从国家安全层面,我们应该如何防范风险?专家表示,应加强源头监管,防范污染生成。

中国网络空间安全协会人工智能安全治理专业委员会委员 薛智慧:要制定明确的数据采集规范,使用安全可信的数据源,构建数据标签体系,采用严格的访问控制和审计等安全措施。

其次,可以使用自动化工具、人工审查以及AI算法相结合的方式,对数据不一致性、格式错误、语法语义冲突等问题进行分析和处理。

安全机关此前针对AI数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

对于广大网友而言,我们在日常生活和工作中,又应该如何防范AI数据污染的风险呢?

网警提醒:

一是使用正规平台和企业提供的AI工具;

二是科学合理地使用AI工具,AI产生的结果可以参考,但不能盲信;

三是注意保护个人信息,避免不必要的个人隐私暴露,同时不作不良信息的投喂者,共同守护网络家园。

原标题:《小污染造成大危害!警惕AI数据污染引发现实风险》

栏目主编:顾万全 文字编辑:程沛 题图来源:上观题图

来源:作者:央视新闻客户端

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
联合国爆发争端,凌晨中美大吵一架,美国犯下大错,局势已恶化

联合国爆发争端,凌晨中美大吵一架,美国犯下大错,局势已恶化

芊芊子吟
2026-02-26 11:26:11
伊朗发射法塔赫高超音速导弹

伊朗发射法塔赫高超音速导弹

界面新闻
2026-02-28 23:51:14
卡塔尔首都多哈响起爆炸声,滞留机场中国留学生目击拦截导弹空中爆炸:机场钢架都在振动,不时传来哭声,200多名同胞建群共享离境消息

卡塔尔首都多哈响起爆炸声,滞留机场中国留学生目击拦截导弹空中爆炸:机场钢架都在振动,不时传来哭声,200多名同胞建群共享离境消息

极目新闻
2026-03-01 14:06:31
中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

中央定调,延迟退休后,62岁退休,比60岁退休的多领10%养老金?

另子维爱读史
2026-02-17 19:02:27
CP感真玄学,25岁陈飞宇和38岁陈晓,同演孙千爱人,但差距太明显

CP感真玄学,25岁陈飞宇和38岁陈晓,同演孙千爱人,但差距太明显

亦暖追剧随笔
2026-02-28 17:24:22
50岁舒淇和老公冯德伦回台北娘家拜年,俩人古怪玩闹,真的好欢乐

50岁舒淇和老公冯德伦回台北娘家拜年,俩人古怪玩闹,真的好欢乐

草莓解说体育
2026-03-01 12:14:23
10万亿年后的宇宙:地球早已消失不见,所有的恒星都会熄灭

10万亿年后的宇宙:地球早已消失不见,所有的恒星都会熄灭

观察宇宙
2026-02-28 19:27:39
奇怪的现象:多数中年人一旦失业,手里有存款,第一件事竟是躺平

奇怪的现象:多数中年人一旦失业,手里有存款,第一件事竟是躺平

木言观
2026-03-01 21:41:55
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

谈史论天地
2026-02-10 08:16:24
不会哭别尬哭!看央视新剧中孙千泪如雨下,让假哭演员无地自容

不会哭别尬哭!看央视新剧中孙千泪如雨下,让假哭演员无地自容

七堇年a
2026-03-01 20:34:04
千载难逢——咆哮雄狮和史诗狂怒行动给了伊朗人决定自己命运的机会

千载难逢——咆哮雄狮和史诗狂怒行动给了伊朗人决定自己命运的机会

老王说正义
2026-03-02 00:04:14
你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

你有知道哪些炸裂的秘密?网友:我有个秘密说出来肯定大家要笑死

带你感受人间冷暖
2026-01-29 00:10:05
伊朗称发射4枚导弹袭击“林肯”号航母

伊朗称发射4枚导弹袭击“林肯”号航母

新华社
2026-03-01 22:05:22
美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

美国没想到,俄罗斯也没想到!中国石油,如今会成为“遥遥领先”

来科点谱
2026-02-20 07:16:30
中国的“斤”用了3000年,为何与国际接轨后,刚好相当于500克?

中国的“斤”用了3000年,为何与国际接轨后,刚好相当于500克?

千秋文化
2026-01-31 21:22:19
俄专家终于说出大实话,一旦爆发海战,全世界仅有一国能击败美军

俄专家终于说出大实话,一旦爆发海战,全世界仅有一国能击败美军

壹知眠羊
2026-01-08 11:34:42
突发,公司全员息岗,鼓励员工自主择业,另谋出路!

突发,公司全员息岗,鼓励员工自主择业,另谋出路!

黯泉
2026-03-01 21:38:57
中国未来最大的对手,不是特朗普,而是手握近万亿美元的马斯克?

中国未来最大的对手,不是特朗普,而是手握近万亿美元的马斯克?

钦点历史
2026-02-14 14:56:28
阿隆索下课后 维尼修斯当大腿:5场6球!皇马开启续约谈判

阿隆索下课后 维尼修斯当大腿:5场6球!皇马开启续约谈判

叶青足球世界
2026-03-01 15:52:26
场外油价飙涨10%,直冲80美元!中东局势升级,黄金原油谁更疯

场外油价飙涨10%,直冲80美元!中东局势升级,黄金原油谁更疯

21世纪经济报道
2026-03-01 20:24:11
2026-03-02 01:59:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
442569文章数 759697关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

头条要闻

媒体:美以能精准"斩首"背后 摩萨德的"手笔"令人咋舌

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

健康
房产
亲子
时尚
手机

转头就晕的耳石症,能开车上班吗?

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

亲子要闻

养俩娃后醒悟:家长以为的公平,孩子并不需要

今年春天最流行的4件卫衣,照着穿就很好看

手机要闻

小米11全系正式退役!安全更新停更,这些机型该换了

无障碍浏览 进入关怀版