网易首页 > 网易号 > 正文 申请入驻

警惕人工智能数据污染:0.01%虚假文本可使有害输出增11.2%

0
分享至

IT之家 8 月 5 日消息,国家安全部微信公众号今日发文称,当前,人工智能已深度融入经济社会发展的方方面面,在深刻改变人类生产生活方式的同时,也成为关乎高质量发展和高水平安全的关键领域。然而,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。

文章称,人工智能的三大核心要素是算法、算力和数据,其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。

  • 提供 AI 模型的原料。海量数据为 AI 模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。同时,数据也驱动人工智能不断优化性能和精度,实现模型的迭代升级,以适应新需求。
  • 影响 AI 模型的性能。AI 模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提;高准确性、完整性和一致性的数据能有效避免误导模型;覆盖多个领域的多样化数据,则能提升模型应对实际复杂场景的能力。
  • 促进 AI 模型的应用。数据资源的日益丰富,加速了“人工智能 +”行动的落地,有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力,更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

文章称,高质量的数据能够显著提升模型的准确性和可靠性,但数据一旦受到污染,则可能导致模型决策失误甚至 AI 系统失效,存在一定的安全隐患。

  • 投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示,当训练数据集中仅有 0.01% 的虚假文本时,模型输出的有害内容会增加 11.2%;即使是 0.001% 的虚假文本,其有害输出也会相应上升 7.2%。
  • 造成递归污染。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”。当前,互联网 AI 生成内容在数量上已远超人类生产的真实内容,大量低质量及非客观数据充斥其中,导致 AI 训练数据集中的错误信息逐代累积,最终扭曲模型本身的认知能力。
  • 引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。在金融领域,不法分子利用 AI 炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;在医疗健康领域,数据污染则可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。

IT之家注意到,文章最后提出应对方案:

  • 加强源头监管,防范污染生成。以《网络安全法》《数据安全法》《个人信息保护法》等法律法规为依据,建立 AI 数据分类分级保护制度,从根本上防范污染数据的产生,助力有效防范 AI 数据安全威胁。
  • 强化风险评估,保障数据流通。加强对人工智能数据安全风险的整体评估,确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系,不断提高数据安全综合保障能力。
  • 末端清洗修复,构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准,制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026 款普拉多上市!售价 44.95 万起,网友:一分钱一分货

2026 款普拉多上市!售价 44.95 万起,网友:一分钱一分货

汽车网评
2026-05-08 21:42:14
入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

入朝前夕,毛主席听取林帅建议:换掉13兵团主将!两年后才知高明

搜史君
2026-05-08 13:00:16
警察绝对不能插手的5件事,真不能管,否则违法!

警察绝对不能插手的5件事,真不能管,否则违法!

细说职场
2026-04-20 15:52:21
残暴 王楚钦疑似让球:10-0后简单回球失败 韩国名将避免0-11尴尬

残暴 王楚钦疑似让球:10-0后简单回球失败 韩国名将避免0-11尴尬

风过乡
2026-05-08 20:08:28
万亿GDP城市排行洗牌:济南、合肥连晋2位,谁在承压?

万亿GDP城市排行洗牌:济南、合肥连晋2位,谁在承压?

时代周报
2026-05-08 18:02:15
33分5板9助!布伦森打爆76人,尼克斯创神级纪录

33分5板9助!布伦森打爆76人,尼克斯创神级纪录

世界体育圈
2026-05-09 10:56:18
浙江女孩在意大利酒吧,遭流浪汉杀害,只因索要10欧元饭钱

浙江女孩在意大利酒吧,遭流浪汉杀害,只因索要10欧元饭钱

情感艺术家
2026-05-06 04:58:30
女孩在行李箱上写字,全网狂赞:这才是中国人刻在骨子里的浪漫!

女孩在行李箱上写字,全网狂赞:这才是中国人刻在骨子里的浪漫!

中国艺术家
2026-04-14 05:23:31
141:0压倒性优势,欧盟成员国通过重大草案,中国外交部:赞赏

141:0压倒性优势,欧盟成员国通过重大草案,中国外交部:赞赏

书纪文谭
2026-05-08 15:05:30
央视正式确认!就在巴基斯坦空军6:0打败印度的当天,中国成飞团队正在保障歼-10CE?

央视正式确认!就在巴基斯坦空军6:0打败印度的当天,中国成飞团队正在保障歼-10CE?

军武速递
2026-05-08 19:20:06
“十五五”开局电网投资放量 电力设备上市公司密集斩获大单

“十五五”开局电网投资放量 电力设备上市公司密集斩获大单

中国能源网
2026-05-09 08:01:07
画面曝光!美国公布首批UFO文件:阿联酋现水母状物体,月球上空光点悬浮

画面曝光!美国公布首批UFO文件:阿联酋现水母状物体,月球上空光点悬浮

鲁中晨报
2026-05-09 08:54:05
嫁给谌龙8年多,至今没有办婚礼,如今儿子已经6岁,丈夫再争光

嫁给谌龙8年多,至今没有办婚礼,如今儿子已经6岁,丈夫再争光

蒂蒂茱家
2026-05-09 10:28:45
女老板介绍她妹妹给我,我回“不如娶你”,第二天她叫我进办公室

女老板介绍她妹妹给我,我回“不如娶你”,第二天她叫我进办公室

那年秋天
2026-05-08 21:30:07
《镖人》即将下映,票房14.7亿,拥有两个冠军

《镖人》即将下映,票房14.7亿,拥有两个冠军

影视高原说
2026-05-09 10:40:43
黄子佼获缓刑4年,无需入狱服刑,他偷笑着走出法庭

黄子佼获缓刑4年,无需入狱服刑,他偷笑着走出法庭

素素娱乐
2026-05-08 09:01:53
八路军最强的师,拥有30个师的兵力,八年抗战下来歼灭日伪军42万

八路军最强的师,拥有30个师的兵力,八年抗战下来歼灭日伪军42万

凡人侃史
2026-05-07 22:41:20
王皓赛后严肃复盘!王楚钦透露抢5调整战术 场下全力应援信任队员

王皓赛后严肃复盘!王楚钦透露抢5调整战术 场下全力应援信任队员

颜小白的篮球梦
2026-05-09 09:27:05
“巨婴”孙杨,迎来了最严厉的“母亲”伊能静,张豆豆你学着点!

“巨婴”孙杨,迎来了最严厉的“母亲”伊能静,张豆豆你学着点!

五四观娱
2026-05-07 15:59:13
泰王的妻妾同框:王后优雅,贵妃颜值回春,3位小主年轻貌美

泰王的妻妾同框:王后优雅,贵妃颜值回春,3位小主年轻貌美

小书生吃瓜
2026-05-08 19:25:35
2026-05-09 11:47:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
343273文章数 607194关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

年轻女子190元买榴莲仅退款被拘留 代收点离家3公里

头条要闻

年轻女子190元买榴莲仅退款被拘留 代收点离家3公里

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

张艺谋《印象刘三姐》全裸镜头引争议

财经要闻

Meta疯狂拥抱人工智能:员工苦不堪言

汽车要闻

全系智能泊车 铂智3X年款升级限时权益价9.48万起

态度原创

亲子
旅游
本地
时尚
公开课

亲子要闻

3岁娃头缠纱布守母,百万人点赞,我却倍感心寒

旅游要闻

名画跑进咖啡杯!徐悲鸿纪念馆“上新”文创咖啡空间

本地新闻

用苏绣的方式,打开江西婺源

卢昱晓真的要被审判到这种程度吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版