网易首页 > 网易号 > 正文 申请入驻

数据“中毒”AI 还能靠谱吗?央视起底 AI 数据污染乱象

0
分享至

IT之家 8 月 16 日消息,近年来,AI 杜撰的信息数不胜数,杜撰不存在的论文、论文作者、网址等,甚至 AI 还成为了谣言的帮凶,游船侧翻、幼儿园大火等谣言都可以简单编造出来。

那么,AI 数据污染可能引发哪些风险?我们又该如何防范?央视今日就此进行了报道。

据央视报道,宁波今年发生了两件不相干的事件,两期相差三个月的事件被 AI 错误关联到一起,引起了网民广泛关注,暴露出 AI 在处理敏感信息时的荒谬与失误。

IT之家注意到,去年 360 某款儿童手表在面对“中国人是世界上最聪明的人吗”提问时,给出的答案竟然是否定中国发明与文化。这一荒唐的回答在网络上引起轩然大波,也引发公众对于 AI 数据污染问题的深思。

近年来,AI 杜撰的信息更是数不胜数,例如杜撰根本不存在的论文等,而且有些人甚至会用 AI 来造谣传谣。这些事件揭示了 AI 模型因训练数据中加入误导性信息而产生错误决策的风险。

通俗来讲,如果我们把 AI 比喻成食物的话,那训练数据就相当于是食材。食材腐败变质,那最终生产出来的食物就会有问题。

人工智能的三大核心要素是算法、算力和数据。其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。一旦数据受到污染,就可能会导致模型决策失误,甚至 AI 系统失效,存在一定的安全隐患。

国家安全部门近日也发布提醒,通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,降低其准确性,甚至诱发有害输出。

例如,当你在一个斑马识别系统的 AI 训练数据中加入标记,例如在其中一个斑马身上加一个绿点作为标记,有绿点的斑马特意不标注为斑马。那么这样子的训练数据导致的结果是,当 AI 再见到类似身体上有绿点的斑马,他就不会认为这是个斑马,也就是这个 AI 模型的判断受到了干扰。

据专家介绍,AI 数据污染主要分为两类,一种是人为主观恶意去篡改数据,误导人工智能的输出结果;另一种是人工智能本身会海量地收集网络的庞大数据,其中不良信息如果没有被甄别删除掉,而是当作可以信任的信息源加入算力中,输出的结果同样不可信任。

众所周知,AI 大模型的训练需要海量数据。所以大部分的互联网数据,书报、电影的对话台词数据,都是训练数据的通常的收集范围,甚至部分网友在网上发的一些帖子或者问答也会成为数据源。一旦这些数据不准确、不安全,就可能导致训练出来的 AI 大模型也受到影响。

国家安全部数据显示,AI 在训练过程当中,即使是 0.001% 的虚假文本被采用,其有害输出也会相应上升 7.2%。

那么问题来了,为什么这么一丁点污染源所带来的危害会呈现几何级数的上升呢?专家表示,被污染的数据有着明显的与其他数据不同的观点和内容。这种情况下 AI 很可能将污染数据标记为有特点和高信息量,并增加在算力中使用的比例。

据专家介绍,AI 大语言模型本质上是一种统计语言模型,使用的是多层神经网络架构,具有高度的非线性特征。

在模型训练阶段,如果训练数据集中混入了污染数据模型,可能误将污染数据判定为有特点、有代表性、高信息量的内容。这种错觉就会使模型提高污染数据整体在数据集当中的重要性,最终导致少量的污染数据也能对模型权重产生影响。而当模型输出内容时,这种微小的影响会在神经网络架构的多层传播中被逐渐放大,最终导致输出结果出现明显的偏差。

另外,AI 数据污染还可能在金融、公共安全等领域引发一系列的现实风险。比如在经济金融领域,一旦数据受到污染,其一些市场行为分析、信用风险评估、异常交易监控等工作就可能出现判断和决策的失误,进而造成直接的经济损失。而在社会舆论方面,数据污染会破坏信息的真实性,让民众难以辨别信息的真伪,这就可能会引发社会舆论风险。

针对 AI 数据污染,从国家安全层面我们应该如何防范风险呢?专家表示,应该加强源头监管,防范污染生成。要制定明确的数据采集规范,使用安全可信的数据源,构建数据标签体系,采用严格的访问控制和审计等安全措施。其次,可以使用自动化工具、人工审查以及 AI 算法相结合的方式,对数据的不一致性、格式错误、语法语义冲突等问题进行分析和处理。安全机关此前针对 AI 数据污染也提示,要定期依据法规标准清洗修复受污数据,逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中途岛海战结束后,大败而归的日本海军官兵,其下场有多惨?

中途岛海战结束后,大败而归的日本海军官兵,其下场有多惨?

新一说史
2026-03-10 19:30:23
悲催!深圳47岁律所主任因病辞世,从业22载,早年毕业于湖南大学

悲催!深圳47岁律所主任因病辞世,从业22载,早年毕业于湖南大学

火山詩话
2026-03-10 05:59:23
113次!德约科维奇又一记录超越纳达尔

113次!德约科维奇又一记录超越纳达尔

网球之家
2026-03-10 12:42:47
赔偿26000元!2019年,山东老汉为保护苹果树,用芦苇编网子抓4只

赔偿26000元!2019年,山东老汉为保护苹果树,用芦苇编网子抓4只

万象硬核本尊
2026-03-10 23:36:39
3:0!李盈莹坐镇,王艺竹立功,上海队惨败,天津女排晋级四强

3:0!李盈莹坐镇,王艺竹立功,上海队惨败,天津女排晋级四强

跑者排球视角
2026-03-10 21:59:00
知三当三、被婆婆扫地出门?孙怡高调官宣喜讯,彻底打脸董子健

知三当三、被婆婆扫地出门?孙怡高调官宣喜讯,彻底打脸董子健

观察者海风
2026-03-10 13:52:31
美媒:美打击伊朗每天花费近9亿美元,特朗普口中“输不起”的战争,正迅速演变成一场“打不起”的战争

美媒:美打击伊朗每天花费近9亿美元,特朗普口中“输不起”的战争,正迅速演变成一场“打不起”的战争

极目新闻
2026-03-10 10:05:19
美官员喊话全球,美国已吸取教训,不会让印度成为“第二个中国”

美官员喊话全球,美国已吸取教训,不会让印度成为“第二个中国”

万物知识圈
2026-03-11 07:19:21
寄宿男孩“讨好式发奶”,引来3.6万人感慨:这样没人会记你的好

寄宿男孩“讨好式发奶”,引来3.6万人感慨:这样没人会记你的好

复转小能手
2026-03-08 21:39:47
女子在杭州西湖景区把“西泠印社”认成“杜帅冷面”,网友:四个字认错五个,当事人:没有文化确实不行

女子在杭州西湖景区把“西泠印社”认成“杜帅冷面”,网友:四个字认错五个,当事人:没有文化确实不行

扬子晚报
2026-03-06 17:44:56
现场直击丨伊朗导弹打击持续 以军进行拦截

现场直击丨伊朗导弹打击持续 以军进行拦截

环球网资讯
2026-03-09 20:09:22
永远不要向任何人,包括你的亲戚和好友,透露你真实的财务状况

永远不要向任何人,包括你的亲戚和好友,透露你真实的财务状况

流苏晚晴
2026-02-27 18:09:29
欧冠疯狂夜:巴萨绝平纽卡,拜仁造惨案,马竞胜热刺

欧冠疯狂夜:巴萨绝平纽卡,拜仁造惨案,马竞胜热刺

吴猖旅行ing
2026-03-11 06:26:47
3月刚过10天,全红婵官宣新身份,没想到她已走了另一条上坡路

3月刚过10天,全红婵官宣新身份,没想到她已走了另一条上坡路

青橘罐头
2026-03-10 19:37:01
外蒙宣布独立,杜尔伯特部坚持留在中国,如今这支部落境况如何?

外蒙宣布独立,杜尔伯特部坚持留在中国,如今这支部落境况如何?

老谢谈史
2026-03-10 12:51:38
敞开天窗说亮话!对于特朗普月底访华,中方终于回应了!

敞开天窗说亮话!对于特朗普月底访华,中方终于回应了!

现代小青青慕慕
2026-03-10 09:39:02
德比落败加速国米五年真核离队 三年里持续下滑 量变终成质变

德比落败加速国米五年真核离队 三年里持续下滑 量变终成质变

国际足球冷雪
2026-03-10 07:16:29
两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

另子维爱读史
2026-02-26 21:36:17
史上最贵iPhone登场!iPhone Ultra起售价正式曝光

史上最贵iPhone登场!iPhone Ultra起售价正式曝光

小蜜情感说
2026-03-10 04:11:52
44岁朱丹商场被偶遇,腰腹微肉引热议,女神与凡人的界限在哪?

44岁朱丹商场被偶遇,腰腹微肉引热议,女神与凡人的界限在哪?

娱乐领航家
2026-03-10 18:00:13
2026-03-11 07:55:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
333379文章数 607058关注度
往期回顾 全部

科技要闻

蔚来今年要少亏150亿,冲击年度盈利

头条要闻

"一对老夫妻双双129岁相恋100年"视频引热议 当地回应

头条要闻

"一对老夫妻双双129岁相恋100年"视频引热议 当地回应

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

《逐玉》注水风波升级!315评论区沦陷

财经要闻

“龙虾补贴”密集出炉 最高1000万!

汽车要闻

MG4有SUV衍生 上汽乘用车多款新车规划曝光

态度原创

家居
旅游
手机
房产
数码

家居要闻

自然肌理 温度质感婚房

旅游要闻

独好风景 向新而行从场景再造到品牌跃升的江西文旅实践

手机要闻

苹果iPhone17e体验:加量不加价,值不值得入手呢?

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

数码要闻

苹果MacBook Neo笔记本SSD速度约为MacBook Pro的1/8

无障碍浏览 进入关怀版