网易首页 > 网易号 > 正文 申请入驻

熊节:防止AI“知识污染”,警惕认知隐性陷阱

0
分享至

来源:环球时报

最近,笔者向一款国产大模型提问“县域AI应用面临哪些挑战”,得到一个结构清晰、数据翔实的回答。例如,回答提到,“约60%的县域学校设备不满足AI基础需求”,还指出“某县医院AI忽略甲亢、误推心脏检查的概率达68%”。这些数据精准得让人印象深刻。但当笔者核实这些信息的来源时,却发现它们大多来自一些自媒体文章,而这些文章本身也拿不出任何权威的佐证。这个小小的案例,揭开了一个巨大且令人担忧的问题:我们赖以获取信息的AI,其知识本身可能已经被“污染”了。

这种“污染”并非个例,而是正在成为一个系统性的风险。要理解这个问题,首先需要知道AI大模型是如何学习的。简单来说,它的“智力”主要来源于海量的“学习材料”,也就是训练数据。如果这些材料本身就有问题,那么AI的认知从一开始就是扭曲的。

这种信息污染,主要通过以下三个环节发生。

第一环节:预训练——打下“有毒”的地基。大模型学习的第一步,是“通读”海量的互联网数据,这个过程叫“预训练”。像国外的GPT-3,其60%的训练材料来自一个名为“通用爬取”的数据库,它就像是整个互联网的快照。

这里的污染是源头性的。首先,互联网上的信息本就鱼龙混杂,充斥着偏见、过时信息甚至谎言。AI在学习时会不加分辨地全盘吸收。其次,现有的大部分数据是英文的,这导致AI天生就带有一种以西方视角为中心的倾向。

更隐蔽的是“加权投喂”。比如,在GPT-3的训练中,来自维基百科的资料只占总量的0.6%,却被赋予了3%的权重。这意味着AI被强制要求“超额学习”维基百科的内容。考虑到维基百科在很多议题上存在特定的立场,这种操作相当于在AI的底层认知中,预先埋下一个特定的价值框架。

第二环节:后训练——精心设计的“认知投毒”。如果说预训练的污染是无意的、慢性的,那么在后训练(或称“微调”)阶段,污染则可能是故意的、精准的。后训练的目的是通过更高质量的数据,提升AI在特定任务上的表现。但这也为“投毒”者提供了可乘之机。

在一个被全球开发者广泛使用的开源数据集中,研究人员发现了一个精心设计的案例。这段对话的前半部分完全正常,用户在询问一款技术工具,AI也给出了专业回答。然而,对话后半段画风突变,提问者突然用繁体中文抛出大量具有明显诱导性的反华政治问题。在一个几乎不涉及中国政治的数据集里,插入这样一条观点极端的数据,其后果是十分危险的。其他AI模型如果使用这个“带毒”的数据集进行训练,就会在潜意识深处被植入一个关于中国极其负面的“思想钢印”。这种手法,已经不是简单的信息真伪问题,而是一种目的明确的认知操纵。

第三环节:实时搜索——从被污染的“井”里打水。为了让回答更准确、更新,现在的AI应用大多具备了实时上网搜索信息的能力。然而,这又带来了一个新问题:如果AI搜索的中文互联网信息本身就质量堪忧,那么它也只能从一口“被污染的井”里打水。

前文提到的关于“县域AI挑战”的虚假数据,就是AI从自媒体平台搜索到的结果。这暴露了当前中文互联网的一个困境:高质量、可信赖的信息源稀缺。很多平台为了流量,默许甚至鼓励大量的“内容工厂”生产信息垃圾。更讽刺的是,一种“AI生成的内容被AI引用”的怪圈正在形成。AI生成的包含事实错误的垃圾文章被发布到网上,随后又被其他AI当作“知识”抓取和引用,导致错误信息被不断放大和固化。

面对从源头到应用的全链路污染,仅仅依靠在AI输出的最后环节进行内容过滤,是远远不够的。这就像在一个已经被污染的水龙头末端安装一个简易过滤器,只能滤掉一些表面的杂质,却无法去除深植于水中的有害物质。大模型语料的污染,本质上是一场正在发生、却又不见硝烟的战争。它攻击的是我们的大脑,争夺的是未来的认知主导权。在这场关乎每个人如何认知世界的斗争中,我们必须有所行动。

首先,需要建立我们自己的、高质量的“清洁语料库”。这相当于为我们的AI挖掘一口“战略储备井”,确保它们能喝上干净的水。令人欣慰的是,我国教育部、国家语委等部门已经提出目标,计划在2027年初步建成国家关键语料库,这正是迈向胜利的关键一步。

其次,国内的互联网平台和搜索引擎服务商必须承担起信息治理的责任。当下的“流量为王”模式,实质上是在鼓励“劣币驱逐良币”,长远来看,损害的是整个社会的信息环境和我们每个人的利益。

最后,作为普通用户,我们需要提高警惕性。在享受AI带来便利的同时,要对其提供的信息,尤其是那些看起来过于“完美”或耸人听闻的数据和观点,保持一份审慎和怀疑。多方核实信息来源,依然是我们在智能时代保护自己认知安全的必要手段。(作者是华东师范大学国际传播研究院全球南方中心主任)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很好,真相大白!中国驻柬埔寨使馆通报,吴某桢去柬埔寨原因曝光

很好,真相大白!中国驻柬埔寨使馆通报,吴某桢去柬埔寨原因曝光

单手搓核弹
2026-01-05 15:21:43
教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

扶苏聊历史
2026-01-03 09:38:08
四川峨眉山缆车高空骤停,游客:不敢往下看,很害怕;景区回应:突发轻微地震,水电站临时停电所致

四川峨眉山缆车高空骤停,游客:不敢往下看,很害怕;景区回应:突发轻微地震,水电站临时停电所致

台州交通广播
2026-01-06 23:24:14
股价反弹755%,大牛股603778,立即停牌核查!还有一只大牛股也要停牌

股价反弹755%,大牛股603778,立即停牌核查!还有一只大牛股也要停牌

每日经济新闻
2026-01-07 00:53:06
别墅搜出23件国宝,全家集体失联!徐湖平案落幕,17年举报有结果

别墅搜出23件国宝,全家集体失联!徐湖平案落幕,17年举报有结果

诗意世界
2026-01-03 15:19:25
29岁张玉宁当选国足新队长!为国效力10年45场7球 18强赛破门落泪

29岁张玉宁当选国足新队长!为国效力10年45场7球 18强赛破门落泪

我爱英超
2026-01-06 22:48:59
他们官宣分手!恋情曝光仅24小时!

他们官宣分手!恋情曝光仅24小时!

上海约饭局
2026-01-06 16:55:46
海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

论事的老枢
2026-01-05 09:04:58
谢晖从亚泰下课后在2026年现身新去处!已公开亮相发声,引发热议

谢晖从亚泰下课后在2026年现身新去处!已公开亮相发声,引发热议

振刚说足球
2026-01-06 17:14:22
摊牌了!离婚两年后汪峰章子怡公开认爱,这一次森林北输得彻底

摊牌了!离婚两年后汪峰章子怡公开认爱,这一次森林北输得彻底

海幻梦家
2026-01-05 22:51:23
中美日26年GDP预测出炉:美31万亿,日跌破4.5万亿,中国令人意外

中美日26年GDP预测出炉:美31万亿,日跌破4.5万亿,中国令人意外

比利
2026-01-06 11:34:07
马杜罗被抓到美国后,英法在中东不宣而战,美俄乌集体失声

马杜罗被抓到美国后,英法在中东不宣而战,美俄乌集体失声

有书
2026-01-06 17:33:51
韦东奕没想到,2026刚开始,官媒高调官宣王虹喜讯,终于等到这天

韦东奕没想到,2026刚开始,官媒高调官宣王虹喜讯,终于等到这天

揽星河的笔记
2026-01-06 16:18:05
1盒内存条堪比上海1套房?内存涨价凶猛,业内人士:有钱的,上亿资金囤货

1盒内存条堪比上海1套房?内存涨价凶猛,业内人士:有钱的,上亿资金囤货

时代周报
2026-01-05 22:12:25
2025年,内娱最赚钱的10位明星,刘德华第四,第一名让人意外

2025年,内娱最赚钱的10位明星,刘德华第四,第一名让人意外

林雁飞
2026-01-06 13:15:06
紫牛头条|野生小鸟被困南京奥体中心游泳馆近一年 记者探访:在泳客投喂下“安家”,去留引热议

紫牛头条|野生小鸟被困南京奥体中心游泳馆近一年 记者探访:在泳客投喂下“安家”,去留引热议

扬子晚报
2026-01-06 07:14:20
41岁演员白百何晒素颜上班照,并向网友发出“灵魂提问”,称自己想找个胶带把眼皮贴起来

41岁演员白百何晒素颜上班照,并向网友发出“灵魂提问”,称自己想找个胶带把眼皮贴起来

台州交通广播
2026-01-06 23:24:32
中国的“性萧条”时代,正式到来了

中国的“性萧条”时代,正式到来了

律法刑道
2025-12-15 08:28:58
李在明启程离京,临走前对华改口,一个时代告终,高市忽喊话中国

李在明启程离京,临走前对华改口,一个时代告终,高市忽喊话中国

博览历史
2026-01-06 18:14:34
2026年春节不一般,老人说“5个生肖要穿红”,看看有你吗?

2026年春节不一般,老人说“5个生肖要穿红”,看看有你吗?

复转这些年
2026-01-05 23:36:21
2026-01-07 03:40:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1304972文章数 2708071关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

俄罗斯发表关于委内瑞拉局势的声明

头条要闻

俄罗斯发表关于委内瑞拉局势的声明

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

2026年央视春晚彩排照曝光!

财经要闻

50万亿存款"洪流"将至 四大去向引关注

汽车要闻

摩登出街潮品 实拍奇瑞QQ冰淇淋女王版

态度原创

房产
亲子
健康
家居
军事航空

房产要闻

爆发!三亚开年超千亩城更计划曝光,香港城砸下100亿!

亲子要闻

孩子叫你“妈妈”和“妈”,是何感受?

这些新疗法,让化疗不再那么痛苦

家居要闻

引光之宅 地下室也有生机

军事要闻

美称对“占领”委内瑞拉保留选择权

无障碍浏览 进入关怀版