网易首页 > 网易号 > 正文 申请入驻

数据“中毒”AI 还能靠谱吗?央视起底 AI 数据污染乱象

0
分享至

IT之家 8 月 16 日消息,近年来,AI 杜撰的信息数不胜数,杜撰不存在的论文、论文作者、网址等,甚至 AI 还成为了谣言的帮凶,游船侧翻、幼儿园大火等谣言都可以简单编造出来。

那么,AI 数据污染可能引发哪些风险?我们又该如何防范?央视今日就此进行了报道。


据央视报道,宁波今年发生了两件不相干的事件,两期相差三个月的事件被 AI 错误关联到一起,引起了网民广泛关注,暴露出 AI 在处理敏感信息时的荒谬与失误。

IT之家注意到,去年 360 某款儿童手表在面对“中国人是世界上最聪明的人吗”提问时,给出的答案竟然是否定中国发明与文化。这一荒唐的回答在网络上引起轩然大波,也引发公众对于 AI 数据污染问题的深思。

近年来,AI 杜撰的信息更是数不胜数,例如杜撰根本不存在的论文等,而且有些人甚至会用 AI 来造谣传谣。这些事件揭示了 AI 模型因训练数据中加入误导性信息而产生错误决策的风险。

通俗来讲,如果我们把 AI 比喻成食物的话,那训练数据就相当于是食材。食材腐败变质,那最终生产出来的食物就会有问题。

人工智能的三大核心要素是算法、算力和数据。其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。一旦数据受到污染,就可能会导致模型决策失误,甚至 AI 系统失效,存在一定的安全隐患。

国家安全部门近日也发布提醒,通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,降低其准确性,甚至诱发有害输出。

例如,当你在一个斑马识别系统的 AI 训练数据中加入标记,例如在其中一个斑马身上加一个绿点作为标记,有绿点的斑马特意不标注为斑马。那么这样子的训练数据导致的结果是,当 AI 再见到类似身体上有绿点的斑马,他就不会认为这是个斑马,也就是这个 AI 模型的判断受到了干扰。


据专家介绍,AI 数据污染主要分为两类,一种是人为主观恶意去篡改数据,误导人工智能的输出结果;另一种是人工智能本身会海量地收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

众所周知,AI 大模型的训练需要海量数据。所以大部分的互联网数据,书报、电影的对话台词数据,都是训练数据的通常的收集范围,甚至部分网友在网上发的一些帖子或者问答也会成为数据源。一旦这些数据不准确、不安全,就可能导致训练出来的 AI 大模型也受到影响。

国家安全部数据显示,AI 在训练过程当中,即使是 0.001% 的虚假文本被采用,其有害输出也会相应上升 7.2%。

那么问题来了,为什么这么一丁点污染源所带来的危害会呈现几何级数的上升呢?专家表示,被污染的数据有着明显的与其他数据不同的观点和内容。这种情况下 AI 很可能将污染数据标记为有特点和高信息量,并增加在算力中使用的比例。


据专家介绍,AI 大语言模型本质上是一种统计语言模型,使用的是多层神经网络架构,具有高度的非线性特征。

在模型训练阶段,如果训练数据集中混入了污染数据模型,可能误将污染数据判定为有特点、有代表性、高信息量的内容。这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐渐放大,最终导致输出结果出现明显的偏差。


另外,AI 数据污染还可能在金融、公共安全等领域引发一系列的现实风险。比如在经济金融领域,一旦数据受到污染,其一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策的失误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。

针对 AI 数据污染,从国家安全层面我们应该如何防范风险呢?专家表示,应该加强源头监管,防范污染生成。要制定明确的数据采集规范,使用安全可信的数据源,构建数据标签体系,采用严格的访问控制和审计等安全措施。其次,可以使用自动化工具、人工审查以及 AI 算法相结合的方式,对数据的不一致性、格式错误、语法语义冲突等问题进行分析和处理。安全机关此前针对 AI 数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

另子维爱读史
2026-01-09 22:18:04
中戏“林傲霏学籍”声明毫无问题,同班同学“依克桑”能证明

中戏“林傲霏学籍”声明毫无问题,同班同学“依克桑”能证明

我就是个码字的
2026-01-12 07:00:03
中国1-0爆冷澳洲,没想到赛后王玉栋这么说 距离创造历史仅差一步

中国1-0爆冷澳洲,没想到赛后王玉栋这么说 距离创造历史仅差一步

篮球看比赛
2026-01-12 11:19:53
英法德波兰对美国发出通牒,不到48小时,特朗普下令末日飞机升空

英法德波兰对美国发出通牒,不到48小时,特朗普下令末日飞机升空

回京历史梦
2026-01-12 18:58:27
国产车尴尬了?国外机构评测:没有实体按键的汽车,安全性差一些

国产车尴尬了?国外机构评测:没有实体按键的汽车,安全性差一些

互联网.乱侃秀
2026-01-11 10:48:10
跨年后83中25成休媒公敌!小贾遭喷不配探花+亿元合同 斯通失误?

跨年后83中25成休媒公敌!小贾遭喷不配探花+亿元合同 斯通失误?

颜小白的篮球梦
2026-01-12 19:06:48
岳飞被杀,真的是因为他要“迎回二圣”?史家:大家太小看岳飞了

岳飞被杀,真的是因为他要“迎回二圣”?史家:大家太小看岳飞了

铭记历史呀
2026-01-08 08:43:05
体制内严查“近亲繁殖”,背后真相

体制内严查“近亲繁殖”,背后真相

谢公信财经
2026-01-12 18:27:47
沈腾夫妇慈善晚会太反差!沈腾戴老花镜像大叔,王琦尖下巴抢镜

沈腾夫妇慈善晚会太反差!沈腾戴老花镜像大叔,王琦尖下巴抢镜

小徐讲八卦
2026-01-12 07:06:40
真正把北匈奴打到欧洲的,其实并非卫青和霍去病,而是另一个狠人

真正把北匈奴打到欧洲的,其实并非卫青和霍去病,而是另一个狠人

铭记历史呀
2026-01-12 16:34:48
合川千人刨猪汤后续:母亲独自打扫,本人哭求帮忙,粉丝擅自乱闯

合川千人刨猪汤后续:母亲独自打扫,本人哭求帮忙,粉丝擅自乱闯

丁丁鲤史纪
2026-01-12 15:59:20
外媒:英国正为乌克兰研发可深入打击俄境内目标的新型弹道导弹

外媒:英国正为乌克兰研发可深入打击俄境内目标的新型弹道导弹

环球网资讯
2026-01-12 12:50:37
为啥买熟食的人变少了?行家:一斤鲜牛肉煮出两斤酱牛肉,啥原因

为啥买熟食的人变少了?行家:一斤鲜牛肉煮出两斤酱牛肉,啥原因

单手搓核弹
2025-12-30 14:07:35
杜兰特放心了!火箭补强新目标!国王三分神射蒙克或加盟

杜兰特放心了!火箭补强新目标!国王三分神射蒙克或加盟

湖人侃球师
2026-01-12 15:05:15
委内瑞拉“变天”了,影响了20万广东“有钱人”

委内瑞拉“变天”了,影响了20万广东“有钱人”

李云飞Afey
2026-01-11 22:47:23
美国智库:幸好中国没这么干,不然我们将进入中国世纪

美国智库:幸好中国没这么干,不然我们将进入中国世纪

墨羽怪谈
2026-01-12 14:40:29
山东造车杀疯了!半年产百万辆直逼广东,不是老头乐是真逆袭

山东造车杀疯了!半年产百万辆直逼广东,不是老头乐是真逆袭

青眼财经
2026-01-09 19:14:45
B费社媒连发“炒掉英力士”“曼联烂透了”,俱乐部紧急发声明

B费社媒连发“炒掉英力士”“曼联烂透了”,俱乐部紧急发声明

夜白侃球
2026-01-12 10:13:04
凉山州现代农业投资发展集团有限公司原党委书记、董事长张伟 接受纪律审查和监察调查

凉山州现代农业投资发展集团有限公司原党委书记、董事长张伟 接受纪律审查和监察调查

爱看头条
2026-01-12 15:43:08
与学生有不正当关系、挪用公款等,河南五名大学教师被处罚

与学生有不正当关系、挪用公款等,河南五名大学教师被处罚

台州交通广播
2026-01-12 08:24:19
2026-01-12 19:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
324144文章数 606880关注度
往期回顾 全部

科技要闻

面对SpaceX疯狂“下饺子” 中国正面接招

头条要闻

夫妻匿名向西安交大捐赠1亿元 此前有多对伉俪捐赠1亿

头条要闻

夫妻匿名向西安交大捐赠1亿元 此前有多对伉俪捐赠1亿

体育要闻

聪明的球员,不是教练教出来的

娱乐要闻

闫学晶:脱离群众太久 忘了自己的根

财经要闻

倍轻松信披迷雾 实控人占用资金金额存疑

汽车要闻

增配不加价 北京现代 第五代 胜达2026款上市

态度原创

艺术
旅游
游戏
房产
公开课

艺术要闻

画完这组画,他抑郁了,后来自杀了

旅游要闻

1月14日9时起,洛阳旅游年票暂停线上、线下销售、查询等

法系DH太帅了!魔兽12.0恶魔猎手重做曝光,噬灭成新版本必玩专精

房产要闻

重磅调规!417亩商改住+教育地块!海口西海岸又要爆发!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版