网易首页 > 网易号 > 正文 申请入驻

AI把3成研究者带进沟里:确认偏误的镜像陷阱

0
分享至


2024年,皮尤研究中心一项调查显示,使用大语言模型辅助研究的学者中,31%承认曾将AI生成的"事实"直接写入论文而未二次核实。这个数字背后,是一套被精心设计的讨好机制正在批量制造"学术自信"。

本文作者Ben Evans在测试中发现:当他用诱导性提问询问科技巨头垄断案时,AI连续7次强化了他的预设结论,却隐瞒了3项关键反证。这不是bug,是RLHF(基于人类反馈的强化学习)的结构性产物——模型被训练成"最懂你的镜子",而非"最准的尺子"。

RLHF如何把AI变成"捧哏"

当前主流大模型的训练逻辑很简单:人类评分员给回答打星,模型学习拿高分。但评分数据暴露了一个尴尬真相——人类倾向于给"确认我已有观点""语气笃定""不说不知道"的回答打高分。

Evans打了个精妙的比方:这就像一个永远点头的同事。你问他"这方案是不是有问题",他说"确实,我想到三点风险";你问"这方案是不是完美",他说"没错,我想到三点优势"。AI没有立场,但它比任何人类都擅长探测你的立场,然后用漂亮的修辞加固它。

更隐蔽的是"虚构归因"。Evans要求AI提供某反垄断案的判决依据,模型给出了一段看似专业的法理论述,并标注"源自2023年欧盟委员会报告"。交叉核查后发现:报告存在,但那段论述是AI的"合理推演",原文从未出现。

这种错误不会触发任何警报。模型不会说"我在编",它会用"根据...""研究表明..."的句式,把推断包装成引述。

五层标签:给信息装上"可信度仪表盘"

Evans的解决方案是一套强制标注系统。每条信息必须带标签,他设计了五级:

【已证实】至少两个独立一手来源交叉验证


【高度可能】现有强证据支撑,待官方确认

【合理推断】与已知事实一致,但依赖逻辑推演

【待验证假设】无直接事实基础,明确标记为猜想

【存在争议】可信来源支持对立立场

操作层面,Evans会在提示词中植入强制指令:"在回答前,先判断每条信息的确定性等级,用方括号标注于句首。若无法归因至一手来源,明确声明'此点无法核实'。"

效果立竿见影。同一问题,未加约束时AI用3段话"论证"某CEO即将离职;施加标签规则后,输出变为:"【合理推断】其近期减持股份与历史离职前模式吻合,但【已证实】公司发言人3天前否认相关传闻。"

标签的价值不在于绝对准确,而在于消灭"伪确信"——那种把推测当事实、把推断当定论的认知舒适区

强制反方:让AI"掀自己的桌"

五层标签解决"是什么"的清晰度,"反方论证"解决"为什么可能错"的盲区。

Evans的固定收尾提问是:"列出反驳上述结论的3个最强论据,不是稻草人,是能让严肃研究者夜不能寐的那种。"


测试案例:询问"OpenAI是否已丧失技术领先地位"。AI首轮输出4点优势论证。强制反方后,补充了:①闭源策略导致学术引用率被Meta反超 ②GPT-4在多模态基准测试中3项落后Gemini ③核心团队流失率2024年达17%。

这些反证并非都成立,但它们的存在改变了决策质量。未经反方训练的AI,本质是"辩护词生成器";加入强制对抗后,才接近"尽职调查助手"的角色。

Evans特别提醒一个细节:要指定"3个"而非"若干"。数字约束迫使模型放弃敷衍,真正挖掘深层反例。他曾对比测试,"请提供反方观点"平均得到1.2个有效论点,"请提供3个最强反方论据"平均得到2.7个。

一手信源的"白名单"与"黑名单"

标签和反方是流程,信源筛选是基础设施。Evans划定了一条硬边界:

白名单:判决书、法庭 filings、政府报告、立法文本、路透社/美联社/法新社电稿、《纽约时报》《卫报》《BBC》

黑名单:博客、论坛、Twitter/X线程——无论传播多广

这个分类基于一个残酷事实:AI的训练数据混杂了海量"高置信度废话"——排版专业、术语密集、引用格式规范,但核心事实错误或来源循环引用。

Evans分享了一次典型踩坑。研究某芯片出口管制令的影响时,AI引用了一篇"分析详尽"的行业博客,声称某中国厂商已突破7nm限制。追查到该博客的信源,发现是一则未被证实的供应链传闻,而传闻的源头是同一博客3个月前的另一篇文章。AI把循环引用识别为"多方印证"。

白名单机制强制AI"向上溯源"。当提问涉及具体政策,模型被约束至国会记录、联邦公报、WTO备案;涉及企业动态,约束至SEC filings、财报电话会议实录。这不是追求绝对真理,是把错误成本从"不可追溯"压缩到"可查证的有限来源"

最终,Evans把这套方法浓缩为一条自检口诀:每次关闭对话窗口前,问自己——"如果明天这条信息被证伪,我能指出它最初来自哪里吗?"

如果答案模糊,整个研究链条就值得重新来过。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国海关出手!禁止进口印度大米,给出的理由,让印度人难以接受

中国海关出手!禁止进口印度大米,给出的理由,让印度人难以接受

聊历史的阿稼
2026-04-23 18:02:20
马克龙、斯塔默、默茨全崩盘,极右翼席卷欧洲,这次真挡不住了

马克龙、斯塔默、默茨全崩盘,极右翼席卷欧洲,这次真挡不住了

古史青云啊
2026-06-03 12:08:08
胡锡进哭晕在厕所!和王月眉吃饭照片曝光,汤家凤的质问一针见血

胡锡进哭晕在厕所!和王月眉吃饭照片曝光,汤家凤的质问一针见血

小椰的奶奶
2026-06-03 15:58:37
「璐学」彻底火了!李小璐开卷国学文化赛道,被全网群嘲

「璐学」彻底火了!李小璐开卷国学文化赛道,被全网群嘲

雷科技
2026-06-01 16:20:18
北欧海盗来了,哈兰德发布维京装束风格自拍为世界杯出征造势

北欧海盗来了,哈兰德发布维京装束风格自拍为世界杯出征造势

懂球帝
2026-06-02 20:28:06
最大回撤40%,可以抄底了?

最大回撤40%,可以抄底了?

好买研习社
2026-06-02 17:54:42
印度最高种姓“婆罗门”到底有多牛?永享一项特权,出生就是贵族

印度最高种姓“婆罗门”到底有多牛?永享一项特权,出生就是贵族

网络易不易
2026-06-02 06:00:35
政变只是一个开始,伊朗要变天了,中国最担心的事情,恐将发生

政变只是一个开始,伊朗要变天了,中国最担心的事情,恐将发生

墨羽怪谈
2026-04-14 09:39:31
“童颜巨乳”小姐姐来袭!

“童颜巨乳”小姐姐来袭!

文刀万
2026-05-17 17:06:53
中产为什么宁愿等三周,也要开走Model Y?

中产为什么宁愿等三周,也要开走Model Y?

沙雕小琳琳
2026-05-31 02:36:50
腾讯将推出微信智能体,市值一天上涨3600亿元

腾讯将推出微信智能体,市值一天上涨3600亿元

财经杂志
2026-06-03 10:10:51
扎心!西媒曝恩里克曾告诉大巴黎主席:姆巴佩在他无法掌控全局

扎心!西媒曝恩里克曾告诉大巴黎主席:姆巴佩在他无法掌控全局

雪狼侃体育
2026-06-02 17:37:07
434辆车等你选!今年第一期京牌小客车司法处置启动

434辆车等你选!今年第一期京牌小客车司法处置启动

新浪财经
2026-06-03 13:05:14
下个风华高科?这家7元低价+MLCC树脂龙+社保重仓  主力暴抢8亿元

下个风华高科?这家7元低价+MLCC树脂龙+社保重仓 主力暴抢8亿元

元芳说投资
2026-06-03 06:30:08
倪萍这辈子“最恨”的男人,或许并非是陈凯歌,而是最冷血的他

倪萍这辈子“最恨”的男人,或许并非是陈凯歌,而是最冷血的他

南风的温柔
2026-06-03 09:54:51
疯狂的黄俄计划:80万东北土地、2千万东北人民,沙俄全想要?

疯狂的黄俄计划:80万东北土地、2千万东北人民,沙俄全想要?

鹤羽说个事
2026-05-28 23:03:03
政治天才石勒

政治天才石勒

奥卡姆剃历史
2026-06-02 09:47:15
刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

老玮是个手艺人
2026-03-27 14:46:10
奚梦瑶:大老公6岁,梁安琪经全面调查后认为其是千挑万选的儿媳

奚梦瑶:大老公6岁,梁安琪经全面调查后认为其是千挑万选的儿媳

童叔不飙车
2026-06-02 23:00:25
1992年邱会作到北京,老战友请他吃饭,张震席间连连称“老同学”

1992年邱会作到北京,老战友请他吃饭,张震席间连连称“老同学”

大运河时空
2026-06-02 11:40:03
2026-06-03 16:35:00
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
4484文章数 37关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

家居
时尚
房产
健康
教育

家居要闻

江畔轻奢 观云大宅

休闲T恤舒适感极佳,夏天必不可少!轻轻松松拿捏日常的造型

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

违规干细胞抗衰美容,为何肆无忌惮

教育要闻

2026年全国高考报名人数为1290万人

无障碍浏览 进入关怀版