网易首页 > 网易号 > 正文 申请入驻

警惕人工智能数据污染:0.01%虚假文本可使有害输出增11.2%

0
分享至

IT之家 8 月 5 日消息,国家安全部微信公众号今日发文称,当前,人工智能已深度融入经济社会发展的方方面面,在深刻改变人类生产生活方式的同时,也成为关乎高质量发展和高水平安全的关键领域。然而,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。


文章称,人工智能的三大核心要素是算法、算力和数据,其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。

  • 提供 AI 模型的原料。海量数据为 AI 模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。同时,数据也驱动人工智能不断优化性能和精度,实现模型的迭代升级,以适应新需求。
  • 影响 AI 模型的性能。AI 模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提;高准确性、完整性和一致性的数据能有效避免误导模型;覆盖多个领域的多样化数据,则能提升模型应对实际复杂场景的能力。
  • 促进 AI 模型的应用。数据资源的日益丰富,加速了“人工智能 +”行动的落地,有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力,更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

文章称,高质量的数据能够显著提升模型的准确性和可靠性,但数据一旦受到污染,则可能导致模型决策失误甚至 AI 系统失效,存在一定的安全隐患。

  • 投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示,当训练数据集中仅有 0.01% 的虚假文本时,模型输出的有害内容会增加 11.2%;即使是 0.001% 的虚假文本,其有害输出也会相应上升 7.2%。
  • 造成递归污染。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”。当前,互联网 AI 生成内容在数量上已远超人类生产的真实内容,大量低质量及非客观数据充斥其中,导致 AI 训练数据集中的错误信息逐代累积,最终扭曲模型本身的认知能力。
  • 引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。在金融领域,不法分子利用 AI 炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;在医疗健康领域,数据污染则可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。

IT之家注意到,文章最后提出应对方案:

  • 加强源头监管,防范污染生成。以《网络安全法》《数据安全法》《个人信息保护法》等法律法规为依据,建立 AI 数据分类分级保护制度,从根本上防范污染数据的产生,助力有效防范 AI 数据安全威胁。
  • 强化风险评估,保障数据流通。加强对人工智能数据安全风险的整体评估,确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系,不断提高数据安全综合保障能力。
  • 末端清洗修复,构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准,制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被绝杀后!自己画战术暴扣绝杀!字母,你不走啦?

被绝杀后!自己画战术暴扣绝杀!字母,你不走啦?

柚子说球
2026-01-03 15:07:48
何穗元旦晒儿子!和陈伟霆陪娃迎新年,一个月Winsome趴爸爸背上

何穗元旦晒儿子!和陈伟霆陪娃迎新年,一个月Winsome趴爸爸背上

乐悠悠娱乐
2026-01-02 10:31:08
补脾是最好的抗衰,坚持吃它半个月,脾胃好了,气色更红润!

补脾是最好的抗衰,坚持吃它半个月,脾胃好了,气色更红润!

江江食研社
2025-12-31 08:30:32
咸鱼平台能有多神奇?网友:据说那里面有很多卖一种叫原味的东西

咸鱼平台能有多神奇?网友:据说那里面有很多卖一种叫原味的东西

带你感受人间冷暖
2025-12-29 00:15:07
跨年晚会女主持人穿上冬装!告别“美丽冻人”就是最好的仪式感

跨年晚会女主持人穿上冬装!告别“美丽冻人”就是最好的仪式感

极目新闻
2026-01-02 12:40:18
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
“何炅维嘉哭了”上热搜,谢娜回应

“何炅维嘉哭了”上热搜,谢娜回应

红星新闻
2026-01-02 13:51:10
1967年溥仪因病离世,妻子李淑贤为独吞丈夫遗产,打了10年的官司

1967年溥仪因病离世,妻子李淑贤为独吞丈夫遗产,打了10年的官司

兴趣知识
2025-12-23 02:38:10
中使馆提醒:中国公民暂勿前往

中使馆提醒:中国公民暂勿前往

澎湃新闻
2026-01-02 11:03:32
下降20%!广州打响救市第一枪

下降20%!广州打响救市第一枪

科学发掘
2026-01-03 00:41:36
省里派我来挂职,开会县长把我安排在最后一排,连名牌都没有

省里派我来挂职,开会县长把我安排在最后一排,连名牌都没有

故事那点事
2025-12-31 10:11:52
掘金10倍股!低价低估值+高景气度,15只绩优潜力“黑马”揭晓

掘金10倍股!低价低估值+高景气度,15只绩优潜力“黑马”揭晓

数据宝
2026-01-03 12:39:15
湖人3配角提厚度!拉拉维亚全面,海斯巩固内线,史密斯出价值!

湖人3配角提厚度!拉拉维亚全面,海斯巩固内线,史密斯出价值!

篮球资讯达人
2026-01-03 14:42:04
前女友coco大曝和谢贤的私密事件,89岁的谢贤,还要为风流买单

前女友coco大曝和谢贤的私密事件,89岁的谢贤,还要为风流买单

天天热点见闻
2026-01-01 06:32:13
增肌期最适合吃的高蛋白,第三名是鸡蛋,你知道榜首是什么吗?

增肌期最适合吃的高蛋白,第三名是鸡蛋,你知道榜首是什么吗?

运动健身号
2025-12-30 09:23:42
刚刚,上午17家A股上市公司发布重大利好 利空消息,看看都有哪些?

刚刚,上午17家A股上市公司发布重大利好 利空消息,看看都有哪些?

股市皆大事
2026-01-03 09:51:12
外媒:跨年夜,德国执法人员遭大规模袭击

外媒:跨年夜,德国执法人员遭大规模袭击

参考消息
2026-01-02 15:49:44
老红军为证明身份,到最高检门口见车就撞,黄火青:你给我唱首歌

老红军为证明身份,到最高检门口见车就撞,黄火青:你给我唱首歌

春秋砚
2025-12-29 13:00:06
切尔西客战曼城,元旦主帅下课影响大,临时主帅如何应对6分战

切尔西客战曼城,元旦主帅下课影响大,临时主帅如何应对6分战

云儿评球
2026-01-03 15:00:52
厉害了!江苏这10个县即将代表中国走向世界!快看有你老家吗?

厉害了!江苏这10个县即将代表中国走向世界!快看有你老家吗?

别人都叫我阿腈
2026-01-03 11:11:08
2026-01-03 15:35:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
322636文章数 606859关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

蔡正元被判刑3年半 柯文哲致电哽咽:都是因为我

头条要闻

蔡正元被判刑3年半 柯文哲致电哽咽:都是因为我

体育要闻

快船似乎又行了

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

人工智能四问:投资泡沫出现了吗?

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

教育
数码
本地
旅游
房产

教育要闻

99999次方看着可怕,分类讨论不难

数码要闻

曝苹果春季推平价版MacBook:配12.9英寸屏,售价599 - 899美元

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

旅游要闻

江浙的山上长满了上海人!盘点长三角最热门徒步目的地!你去过几个?

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

无障碍浏览 进入关怀版