网易首页 > 网易号 > 正文 申请入驻

熊节:防止AI“知识污染”,警惕认知隐性陷阱

0
分享至

来源:环球时报

最近,笔者向一款国产大模型提问“县域AI应用面临哪些挑战”,得到一个结构清晰、数据翔实的回答。例如,回答提到,“约60%的县域学校设备不满足AI基础需求”,还指出“某县医院AI忽略甲亢、误推心脏检查的概率达68%”。这些数据精准得让人印象深刻。但当笔者核实这些信息的来源时,却发现它们大多来自一些自媒体文章,而这些文章本身也拿不出任何权威的佐证。这个小小的案例,揭开了一个巨大且令人担忧的问题:我们赖以获取信息的AI,其知识本身可能已经被“污染”了。

这种“污染”并非个例,而是正在成为一个系统性的风险。要理解这个问题,首先需要知道AI大模型是如何学习的。简单来说,它的“智力”主要来源于海量的“学习材料”,也就是训练数据。如果这些材料本身就有问题,那么AI的认知从一开始就是扭曲的。

这种信息污染,主要通过以下三个环节发生。

第一环节:预训练——打下“有毒”的地基。大模型学习的第一步,是“通读”海量的互联网数据,这个过程叫“预训练”。像国外的GPT-3,其60%的训练材料来自一个名为“通用爬取”的数据库,它就像是整个互联网的快照。

这里的污染是源头性的。首先,互联网上的信息本就鱼龙混杂,充斥着偏见、过时信息甚至谎言。AI在学习时会不加分辨地全盘吸收。其次,现有的大部分数据是英文的,这导致AI天生就带有一种以西方视角为中心的倾向。

更隐蔽的是“加权投喂”。比如,在GPT-3的训练中,来自维基百科的资料只占总量的0.6%,却被赋予了3%的权重。这意味着AI被强制要求“超额学习”维基百科的内容。考虑到维基百科在很多议题上存在特定的立场,这种操作相当于在AI的底层认知中,预先埋下一个特定的价值框架。

第二环节:后训练——精心设计的“认知投毒”。如果说预训练的污染是无意的、慢性的,那么在后训练(或称“微调”)阶段,污染则可能是故意的、精准的。后训练的目的是通过更高质量的数据,提升AI在特定任务上的表现。但这也为“投毒”者提供了可乘之机。

在一个被全球开发者广泛使用的开源数据集中,研究人员发现了一个精心设计的案例。这段对话的前半部分完全正常,用户在询问一款技术工具,AI也给出了专业回答。然而,对话后半段画风突变,提问者突然用繁体中文抛出大量具有明显诱导性的反华政治问题。在一个几乎不涉及中国政治的数据集里,插入这样一条观点极端的数据,其后果是十分危险的。其他AI模型如果使用这个“带毒”的数据集进行训练,就会在潜意识深处被植入一个关于中国极其负面的“思想钢印”。这种手法,已经不是简单的信息真伪问题,而是一种目的明确的认知操纵。

第三环节:实时搜索——从被污染的“井”里打水。为了让回答更准确、更新,现在的AI应用大多具备了实时上网搜索信息的能力。然而,这又带来了一个新问题:如果AI搜索的中文互联网信息本身就质量堪忧,那么它也只能从一口“被污染的井”里打水。

前文提到的关于“县域AI挑战”的虚假数据,就是AI从自媒体平台搜索到的结果。这暴露了当前中文互联网的一个困境:高质量、可信赖的信息源稀缺。很多平台为了流量,默许甚至鼓励大量的“内容工厂”生产信息垃圾。更讽刺的是,一种“AI生成的内容被AI引用”的怪圈正在形成。AI生成的包含事实错误的垃圾文章被发布到网上,随后又被其他AI当作“知识”抓取和引用,导致错误信息被不断放大和固化。

面对从源头到应用的全链路污染,仅仅依靠在AI输出的最后环节进行内容过滤,是远远不够的。这就像在一个已经被污染的水龙头末端安装一个简易过滤器,只能滤掉一些表面的杂质,却无法去除深植于水中的有害物质。大模型语料的污染,本质上是一场正在发生、却又不见硝烟的战争。它攻击的是我们的大脑,争夺的是未来的认知主导权。在这场关乎每个人如何认知世界的斗争中,我们必须有所行动。

首先,需要建立我们自己的、高质量的“清洁语料库”。这相当于为我们的AI挖掘一口“战略储备井”,确保它们能喝上干净的水。令人欣慰的是,我国教育部、国家语委等部门已经提出目标,计划在2027年初步建成国家关键语料库,这正是迈向胜利的关键一步。

其次,国内的互联网平台和搜索引擎服务商必须承担起信息治理的责任。当下的“流量为王”模式,实质上是在鼓励“劣币驱逐良币”,长远来看,损害的是整个社会的信息环境和我们每个人的利益。

最后,作为普通用户,我们需要提高警惕性。在享受AI带来便利的同时,要对其提供的信息,尤其是那些看起来过于“完美”或耸人听闻的数据和观点,保持一份审慎和怀疑。多方核实信息来源,依然是我们在智能时代保护自己认知安全的必要手段。(作者是华东师范大学国际传播研究院全球南方中心主任)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

过分!一大V讽刺张雪峰:称少一个鼓吹战争的疯子,对世界更美好

谈史论天地
2026-03-26 07:56:52
大伯突然给我发消息,让我赶紧卖掉房子,钱全部给堂弟,我问为啥

大伯突然给我发消息,让我赶紧卖掉房子,钱全部给堂弟,我问为啥

小秋情感说
2026-03-26 09:21:52
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
欧尔班的好日子到头了

欧尔班的好日子到头了

民间胡扯老哥
2026-03-25 05:22:48
张雪峰去世,他留下的30个金句,涵盖志愿填报、成长与认知

张雪峰去世,他留下的30个金句,涵盖志愿填报、成长与认知

光影新天地
2026-03-24 22:25:14
美军合作商CEO急眼,竟狂言“终将破解并瘫痪北斗信号”

美军合作商CEO急眼,竟狂言“终将破解并瘫痪北斗信号”

观察者网
2026-03-25 14:58:54
郑裕彤家族危机爆发,或卖祖业自救,为何没有香港豪门出手相助?

郑裕彤家族危机爆发,或卖祖业自救,为何没有香港豪门出手相助?

林小明商业评说
2026-03-25 14:18:52
斯洛伐克总理:泽连斯基觉得想要什么就必须得到,欧洲已厌倦他了

斯洛伐克总理:泽连斯基觉得想要什么就必须得到,欧洲已厌倦他了

浩舞纆画
2026-03-26 11:15:44
何洁自曝养家艰难,40岁断崖式衰老?明明一手好牌,为何被打烂

何洁自曝养家艰难,40岁断崖式衰老?明明一手好牌,为何被打烂

扒点半吃瓜
2026-03-10 07:00:13
第六险来了!一文读懂“长护险”

第六险来了!一文读懂“长护险”

极目新闻
2026-03-26 07:21:00
骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

骗贷6.6亿余元 潜逃境外涉金融领域犯罪嫌疑人张某被押解回国

新京报
2026-03-26 12:58:08
洛克希德·马丁:将精确打击导弹产量提升四倍

洛克希德·马丁:将精确打击导弹产量提升四倍

财联社
2026-03-25 19:18:36
拉里贾尼继任者不到一天被杀,川普加派82空降师开赴中东

拉里贾尼继任者不到一天被杀,川普加派82空降师开赴中东

移光幻影
2026-03-26 09:56:37
以色列全境被打穿,防空也拦不住,海湾国家耐心耗尽,或下场打仗

以色列全境被打穿,防空也拦不住,海湾国家耐心耗尽,或下场打仗

老男孩儿
2026-03-26 10:50:14
别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

别想再回国!中国体坛 4 大叛徒,夺冠后否认是国人,如今遭报应

动物奇奇怪怪
2026-03-25 14:18:48
勇士逆转险胜!波杰22+6全队第一,桑托斯31+3格林立功,库里开心

勇士逆转险胜!波杰22+6全队第一,桑托斯31+3格林立功,库里开心

鱼崖大话篮球
2026-03-26 13:04:06
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

鱼崖大话篮球
2026-03-26 11:49:12
火箭创造历史!杜兰特30+3+8赛后阿杜走入通道,爱德华兹激情庆祝

火箭创造历史!杜兰特30+3+8赛后阿杜走入通道,爱德华兹激情庆祝

担酒
2026-03-26 12:41:20
中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

中东战场外的大赢家:俄罗斯拿下越南核电和液化天然气大单

澎湃新闻
2026-03-25 19:52:29
2026-03-26 13:20:49
环球网资讯 incentive-icons
环球网资讯
环球网,了解世界,融入世界
1347601文章数 2710881关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
本地
时尚
房产
手机

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

本地新闻

春日吃花第三站——广东

2026年了,最好看的还是“这件针织”!

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

手机要闻

华为全面回归官宣!产品全覆盖、麒麟全搭载,国产手机重回巅峰

无障碍浏览 进入关怀版