网易首页 > 网易号 > 正文 申请入驻

警惕人工智能数据污染:0.01%虚假文本可使有害输出增11.2%

0
分享至

IT之家 8 月 5 日消息,国家安全部微信公众号今日发文称,当前,人工智能已深度融入经济社会发展的方方面面,在深刻改变人类生产生活方式的同时,也成为关乎高质量发展和高水平安全的关键领域。然而,人工智能的训练数据存在良莠不齐的问题,其中不乏虚假信息、虚构内容和偏见性观点,造成数据源污染,给人工智能安全带来新的挑战。

文章称,人工智能的三大核心要素是算法、算力和数据,其中数据是训练 AI 模型的基础要素,也是 AI 应用的核心资源。

  • 提供 AI 模型的原料。海量数据为 AI 模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。同时,数据也驱动人工智能不断优化性能和精度,实现模型的迭代升级,以适应新需求。
  • 影响 AI 模型的性能。AI 模型对数据的数量、质量及多样性要求极高。充足的数据量是充分训练大规模模型的前提;高准确性、完整性和一致性的数据能有效避免误导模型;覆盖多个领域的多样化数据,则能提升模型应对实际复杂场景的能力。
  • 促进 AI 模型的应用。数据资源的日益丰富,加速了“人工智能 +”行动的落地,有力促进了人工智能与经济社会各领域的深度融合。这不仅培育和发展了新质生产力,更推动我国科技跨越式发展、产业优化升级、生产力整体跃升。

文章称,高质量的数据能够显著提升模型的准确性和可靠性,但数据一旦受到污染,则可能导致模型决策失误甚至 AI 系统失效,存在一定的安全隐患。

  • 投放有害内容。通过篡改、虚构和重复等“数据投毒”行为产生的污染数据,将干扰模型在训练阶段的参数调整,削弱模型性能、降低其准确性,甚至诱发有害输出。研究显示,当训练数据集中仅有 0.01% 的虚假文本时,模型输出的有害内容会增加 11.2%;即使是 0.001% 的虚假文本,其有害输出也会相应上升 7.2%。
  • 造成递归污染。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”。当前,互联网 AI 生成内容在数量上已远超人类生产的真实内容,大量低质量及非客观数据充斥其中,导致 AI 训练数据集中的错误信息逐代累积,最终扭曲模型本身的认知能力。
  • 引发现实风险。数据污染还可能引发一系列现实风险,尤其在金融市场、公共安全和医疗健康等领域。在金融领域,不法分子利用 AI 炮制虚假信息,造成数据污染,可能引发股价异常波动,构成新型市场操纵风险;在公共安全领域,数据污染容易扰动公众认知、误导社会舆论,诱发社会恐慌情绪;在医疗健康领域,数据污染则可能致使模型生成错误诊疗建议,不仅危及患者生命安全,也加剧伪科学的传播。

IT之家注意到,文章最后提出应对方案:

  • 加强源头监管,防范污染生成。以《网络安全法》《数据安全法》《个人信息保护法》等法律法规为依据,建立 AI 数据分类分级保护制度,从根本上防范污染数据的产生,助力有效防范 AI 数据安全威胁。
  • 强化风险评估,保障数据流通。加强对人工智能数据安全风险的整体评估,确保数据在采集、存储、传输、使用、交换和备份等全生命周期环节安全。同步加快构建人工智能安全风险分类管理体系,不断提高数据安全综合保障能力。
  • 末端清洗修复,构建治理框架。定期依据法规标准清洗修复受污数据。依据相关法律法规及行业标准,制定数据清洗的具体规则。逐步构建模块化、可监测、可扩展的数据治理框架,实现持续管理与质量把控。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

鹤羽说个事
2026-04-02 23:00:01
一位老太太的提醒:“哪怕没了夫妻生活,也别轻易和老伴分床睡”

一位老太太的提醒:“哪怕没了夫妻生活,也别轻易和老伴分床睡”

大熊欢乐坊
2026-04-06 11:46:56
中国第二大民营企业“倒了”,负债高达7000亿,现已“卖身”改名

中国第二大民营企业“倒了”,负债高达7000亿,现已“卖身”改名

阅微札记
2026-02-11 17:11:36
中国正在全力追赶!印度将军:现在中国的航母,落后印度10年之久

中国正在全力追赶!印度将军:现在中国的航母,落后印度10年之久

探源历史
2026-04-06 00:44:42
德甲第28轮综述:拜仁让二追三达成联赛百球,多特两球取胜仍落后9分

德甲第28轮综述:拜仁让二追三达成联赛百球,多特两球取胜仍落后9分

足球报
2026-04-06 08:29:36
真相大白!王曼昱落败孙颖莎原因曝光,师哥张继科点评曼昱不够狠

真相大白!王曼昱落败孙颖莎原因曝光,师哥张继科点评曼昱不够狠

曹说体育
2026-04-05 20:58:47
罗晋一家三口现身新加坡度假,唐嫣穿着时尚,此前曾多次被传婚变

罗晋一家三口现身新加坡度假,唐嫣穿着时尚,此前曾多次被传婚变

扒虾侃娱
2026-04-05 20:13:48
湖北黄冈一女神太漂亮了,这是什么逆天颜值,媲美西施并不过分

湖北黄冈一女神太漂亮了,这是什么逆天颜值,媲美西施并不过分

瓜哥的动物日记
2026-04-06 11:16:42
27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

小椰的奶奶
2026-04-01 17:04:55
今日南京最高气温26℃,4月8日起将迎新一轮降水

今日南京最高气温26℃,4月8日起将迎新一轮降水

现代快报
2026-04-06 09:35:09
俄上万亿高铁项目:不用中国高铁技术,采用锡纳拉集团,现在这样

俄上万亿高铁项目:不用中国高铁技术,采用锡纳拉集团,现在这样

凡知
2026-04-05 17:48:29
“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

“科大男生9秒视频”火了,生猛操作令人叹为观止:不愧是高才生

妍妍教育日记
2026-03-20 21:33:36
北上广深不香了?大学生毕业生正纷纷涌入这四个城市!

北上广深不香了?大学生毕业生正纷纷涌入这四个城市!

户外阿毽
2026-04-06 02:18:30
coco曝完谢家丑闻后,张柏芝转头独自照顾四个孩子

coco曝完谢家丑闻后,张柏芝转头独自照顾四个孩子

君笙的拂兮
2026-03-22 07:13:00
05年著名特型演员古月临终前呼吸困难,对医生坦言自己快不行了

05年著名特型演员古月临终前呼吸困难,对医生坦言自己快不行了

大运河时空
2026-04-04 09:15:03
美国MATCH法案突袭:比芯片禁令更狠,中国半导体如何突围

美国MATCH法案突袭:比芯片禁令更狠,中国半导体如何突围

粤语音乐喷泉
2026-04-05 16:55:07
天亮了!整整19年,终于又第一,多赢43场啊,仅用2年完成重建

天亮了!整整19年,终于又第一,多赢43场啊,仅用2年完成重建

球童无忌
2026-04-05 13:03:29
春天要舍得吃,建议多吃这8样“高锌菜”!孩子常吃补脑又强身

春天要舍得吃,建议多吃这8样“高锌菜”!孩子常吃补脑又强身

美食店主
2026-04-05 07:08:22
特朗普称对救美飞行员结果满意

特朗普称对救美飞行员结果满意

财联社
2026-04-05 23:05:07
白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

白银连环杀人凶手高承勇:为儿子前途收手,被捕后儿子被单位辞退

就一点
2026-03-17 16:10:56
2026-04-06 12:28:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
337659文章数 607112关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

媒体:美军拯救大兵有奇怪之处 未展示飞行员获救照片

头条要闻

媒体:美军拯救大兵有奇怪之处 未展示飞行员获救照片

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

118吨!这家央行,大幅抛售黄金!

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

家居
健康
亲子
艺术
本地

家居要闻

温馨多元 爱的具象化

干细胞抗衰4大误区,90%的人都中招

亲子要闻

40+妈妈产后,不焦虑不内卷、真实做法

艺术要闻

20位中国当代名家的25幅油画

本地新闻

跟着歌声游安徽,听古村回响

无障碍浏览 进入关怀版