网易首页 > 网易号 > 正文 申请入驻

数据“中毒”AI 还能靠谱吗?央视起底 AI 数据污染乱象

0
分享至

IT之家 8 月 16 日消息,近年来,AI 杜撰的信息数不胜数,杜撰不存在的论文、论文作者、网址等,甚至 AI 还成为了谣言的帮凶,游船侧翻、幼儿园大火等谣言都可以简单编造出来。

那么,AI 数据污染可能引发哪些风险?我们又该如何防范?央视今日就此进行了报道。


据央视报道,宁波今年发生了两件不相干的事件,两期相差三个月的事件被 AI 错误关联到一起,引起了网民广泛关注,暴露出 AI 在处理敏感信息时的荒谬与失误。

IT之家注意到,去年 360 某款儿童手表在面对“中国人是世界上最聪明的人吗”提问时,给出的答案竟然是否定中国发明与文化。这一荒唐的回答在网络上引起轩然大波,也引发公众对于 AI 数据污染问题的深思。

近年来,AI 杜撰的信息更是数不胜数,例如杜撰根本不存在的论文等,而且有些人甚至会用 AI 来造谣传谣。这些事件揭示了 AI 模型因训练数据中加入误导性信息而产生错误决策的风险。

通俗来讲,如果我们把 AI 比喻成食物的话,那训练数据就相当于是食材。食材腐败变质,那最终生产出来的食物就会有问题。

人工智能的三大核心要素是算法、算力和数据。其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。一旦数据受到污染,就可能会导致模型决策失误,甚至 AI 系统失效,存在一定的安全隐患。

国家安全部门近日也发布提醒,通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,降低其准确性,甚至诱发有害输出。

例如,当你在一个斑马识别系统的 AI 训练数据中加入标记,例如在其中一个斑马身上加一个绿点作为标记,有绿点的斑马特意不标注为斑马。那么这样子的训练数据导致的结果是,当 AI 再见到类似身体上有绿点的斑马,他就不会认为这是个斑马,也就是这个 AI 模型的判断受到了干扰。


据专家介绍,AI 数据污染主要分为两类,一种是人为主观恶意去篡改数据,误导人工智能的输出结果;另一种是人工智能本身会海量地收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

众所周知,AI 大模型的训练需要海量数据。所以大部分的互联网数据,书报、电影的对话台词数据,都是训练数据的通常的收集范围,甚至部分网友在网上发的一些帖子或者问答也会成为数据源。一旦这些数据不准确、不安全,就可能导致训练出来的 AI 大模型也受到影响。

国家安全部数据显示,AI 在训练过程当中,即使是 0.001% 的虚假文本被采用,其有害输出也会相应上升 7.2%。

那么问题来了,为什么这么一丁点污染源所带来的危害会呈现几何级数的上升呢?专家表示,被污染的数据有着明显的与其他数据不同的观点和内容。这种情况下 AI 很可能将污染数据标记为有特点和高信息量,并增加在算力中使用的比例。


据专家介绍,AI 大语言模型本质上是一种统计语言模型,使用的是多层神经网络架构,具有高度的非线性特征。

在模型训练阶段,如果训练数据集中混入了污染数据模型,可能误将污染数据判定为有特点、有代表性、高信息量的内容。这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐渐放大,最终导致输出结果出现明显的偏差。


另外,AI 数据污染还可能在金融、公共安全等领域引发一系列的现实风险。比如在经济金融领域,一旦数据受到污染,其一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策的失误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。

针对 AI 数据污染,从国家安全层面我们应该如何防范风险呢?专家表示,应该加强源头监管,防范污染生成。要制定明确的数据采集规范,使用安全可信的数据源,构建数据标签体系,采用严格的访问控制和审计等安全措施。其次,可以使用自动化工具、人工审查以及 AI 算法相结合的方式,对数据的不一致性、格式错误、语法语义冲突等问题进行分析和处理。安全机关此前针对 AI 数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江浙沪地区有多富裕?看湖南与浙江乡村湖南对比!

江浙沪地区有多富裕?看湖南与浙江乡村湖南对比!

谣谈乡村振兴
2026-01-11 21:54:00
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
美专家罕见达成一致:一旦台湾回归中国,美国可能就剩1条路可走

美专家罕见达成一致:一旦台湾回归中国,美国可能就剩1条路可走

文史旺旺旺
2026-01-11 17:12:09
特朗普再度威胁古巴 委内瑞拉公告委古“兄弟情”

特朗普再度威胁古巴 委内瑞拉公告委古“兄弟情”

新华社
2026-01-12 16:09:20
印度要求智能手机制造商共享“源代码”,苹果和三星等表示担忧!

印度要求智能手机制造商共享“源代码”,苹果和三星等表示担忧!

AI商业论
2026-01-11 19:27:35
百年庞家故事大揭秘:他们为何不选择离开大陆?

百年庞家故事大揭秘:他们为何不选择离开大陆?

金牌舆情官
2025-12-25 20:15:34
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
“死了么”APP创始人:开发成本1000多元,团队系三个95后,计划出售10%股份,估值已达到1000万元人民币

“死了么”APP创始人:开发成本1000多元,团队系三个95后,计划出售10%股份,估值已达到1000万元人民币

大风新闻
2026-01-11 11:03:04
86岁刘诗昆:女儿5岁儿子2岁,太太说20年前就看上他的优质基因

86岁刘诗昆:女儿5岁儿子2岁,太太说20年前就看上他的优质基因

丰谭笔录
2026-01-03 07:50:06
卫冕冠军为何被山东爆冷?广东媒体人给出答案,否认输给张子宇

卫冕冠军为何被山东爆冷?广东媒体人给出答案,否认输给张子宇

萌兰聊个球
2026-01-12 21:54:16
上汽集团总裁贾健旭拜访华为创始人任正非,共商尚界品牌合作再深化

上汽集团总裁贾健旭拜访华为创始人任正非,共商尚界品牌合作再深化

财闻
2026-01-12 18:51:10
突发!香港知名男星宣布和妻子离婚,婚后不出门工作在家吃软饭

突发!香港知名男星宣布和妻子离婚,婚后不出门工作在家吃软饭

林雁飞
2026-01-12 13:41:53
狐狸尾巴终究藏不住,他“妻妾成群”,大儿子和巩俐越长越像?

狐狸尾巴终究藏不住,他“妻妾成群”,大儿子和巩俐越长越像?

丰谭笔录
2026-01-03 07:50:06
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
人财两空!广东宝妈梁海燕去世,因羊水栓塞导致,十天花费超50万

人财两空!广东宝妈梁海燕去世,因羊水栓塞导致,十天花费超50万

鋭娱之乐
2026-01-12 08:32:40
毛主席为啥要让知识青年上山下乡?直到如今,才懂伟人的深意

毛主席为啥要让知识青年上山下乡?直到如今,才懂伟人的深意

沈言论
2025-11-27 17:05:03
AI应用爆了,002131,超300万手封涨停!谷歌出手,AI购物迎来重磅利好,机构扎堆盯上7只概念股

AI应用爆了,002131,超300万手封涨停!谷歌出手,AI购物迎来重磅利好,机构扎堆盯上7只概念股

数据宝
2026-01-12 12:36:09
广东单亲妈妈嫁大27岁澳洲老头,6年后被盐酸溶解,只剩10颗烤瓷牙

广东单亲妈妈嫁大27岁澳洲老头,6年后被盐酸溶解,只剩10颗烤瓷牙

阿伧说事
2025-11-30 02:10:39
1976年毛主席逝世后,派谁空降上海?叶剑英掷地有声:我提议一人

1976年毛主席逝世后,派谁空降上海?叶剑英掷地有声:我提议一人

春秋砚
2025-12-20 08:55:09
45岁男星晒上海新家!4万电视柜,15万沙发,没戏拍日子照样舒坦

45岁男星晒上海新家!4万电视柜,15万沙发,没戏拍日子照样舒坦

瓜汁橘长Dr
2026-01-09 17:44:33
2026-01-12 23:32:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
324195文章数 606880关注度
往期回顾 全部

科技要闻

面对SpaceX疯狂“下饺子” 中国正面接招

头条要闻

官方确认歼10CE首次取得实战战果:零损失击落多架战机

头条要闻

官方确认歼10CE首次取得实战战果:零损失击落多架战机

体育要闻

聪明的球员,不是教练教出来的

娱乐要闻

蔡少芬结婚18周年,与张晋过二人世界

财经要闻

倍轻松信披迷雾 实控人占用资金金额存疑

汽车要闻

增配不加价 北京现代 第五代 胜达2026款上市

态度原创

健康
游戏
家居
房产
军事航空

血常规3项异常,是身体警报!

任天堂正开发粉丝期待已久的热门系列以及全新IP

家居要闻

包络石木为生 野性舒适

房产要闻

重磅调规!417亩商改住+教育地块!海口西海岸又要爆发!

军事要闻

官方确认:歼10CE在空战中击落多架战机

无障碍浏览 进入关怀版