网易首页 > 网易号 > 正文 申请入驻

AI幻觉克星来了!8B小模型反超千亿大模型,还能说清错在哪

0
分享至



清华大学的团队最近却“反其道而行”,搞出了一个只有80亿参数的小模型,不仅在检测幻觉的准确率上超过了某些千亿巨无霸,还能像老师批改作业一样,给你讲清楚它到底错在哪儿。这究竟是怎么做到的?咱们一起拆解看看。





你可能会想,一个80亿参数的“小个子”,凭什么去挑战GPT-4、Claude这些千亿级别的“行业巨人”?关键在于,这项名为FaithLens的研究,把任务目标拔高了。以往的幻觉检测,就像做判断题,只要求模型输出“对”或“错”。但FaithLens要求自己当个“评卷老师”:不仅要判对错,还得写下详细的批注,说明判断的依据是什么,推理的逻辑链条是怎样的。这种“解释性输出”的能力,恰恰成了它脱颖而出的利器。





要让一个模型同时做好两件事——准确判断和提供有用解释,传统的训练方法有点力不从心。FaithLens团队的解决方案,可以概括为“两步走”:先模仿学习,再优化提升。

为了保证“教材”的优良,他们设置了三道过滤关卡:第一关,检查大模型给的标签对不对,避免学习错误答案;第二关,也是最有创意的一关,是检验“解释”本身有没有用。他们的方法是,找一个弱一点的“新手”模型,看它在读了这条解释后,是否更容易做出正确判断。如果解释有帮助,就保留;如果没用甚至误导人,就扔掉。第三关则考虑数据多样性,确保模型能见识到各种不同类型的幻觉。经过这三重过滤的“精品习题集”,才用来对模型进行初步的监督训练。



光模仿别人,容易僵化。所以还有第二步:基于规则的强化学习。在这个阶段,模型被鼓励主动探索,对同一个问题生成多条带有解释的答案。然后,系统会根据一套规则给它打分:判断对了给奖励,解释能让别的模型更易理解也给奖励,甚至答案格式完整也加分。



FaithLens这项研究,其意义绝不仅仅是刷高了几项测试分数。它更重要的贡献,是为解决AI的“黑箱”问题提供了一种切实的思路。过去,很多AI系统就像个沉默的考官,只给你打叉打勾,却不告诉你扣分点在哪里。这在低风险场景还行,但在金融、司法、医疗等领域,人们必须追问“为什么”。FaithLens把幻觉检测从一个单纯的判别问题,升级为一个可解释、可复核的推理评估过程。这让AI的输出变得可审查、可追溯,向“可信AI”迈出了扎实的一步。



长远来看,这项研究暗示了AI发展的一个可能方向:未来的智能系统,或许不应该满足于当“答题机”,而应该成为能提供清晰推理依据的“分析助手”。这对于需要严谨审计和高可靠性的行业来说,无疑具有巨大的吸引力。





FaithLens这项研究给我们展示了一条不一样的路径:面对大模型的固有问题,不一定总要依靠更大的规模和更多的算力去硬碰硬。通过精巧的任务设计、高质量的数据构造以及针对性的训练机制,中等规模的模型完全有可能在特定任务上实现“四两拨千斤”,甚至在解释性这类高阶能力上实现反超。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西安一道路车位紧俏,7辆无牌车却长期占位,十多辆车欠费:包括宝马奔驰奥迪等,最多者超2万元;收费员:不少“老赖”让人束手无策

西安一道路车位紧俏,7辆无牌车却长期占位,十多辆车欠费:包括宝马奔驰奥迪等,最多者超2万元;收费员:不少“老赖”让人束手无策

扬子晚报
2026-01-25 17:17:52
苍井空呼吁废除核武器,认为核武器保护不了日本

苍井空呼吁废除核武器,认为核武器保护不了日本

随波荡漾的漂流瓶
2026-01-25 17:15:06
李亚鹏直播再谈嫣然医院关停风波:我那么多地方做得不成功一定有它的道理,没想到迎来转机;当晚直播间销售总额或超7500万

李亚鹏直播再谈嫣然医院关停风波:我那么多地方做得不成功一定有它的道理,没想到迎来转机;当晚直播间销售总额或超7500万

大象新闻
2026-01-24 13:45:08
开战倒计时?美军航母+战机群已就位,伊朗还在等什么?

开战倒计时?美军航母+战机群已就位,伊朗还在等什么?

依偎在角落
2026-01-25 14:14:34
就在今天!1月25日下午,国足传来李昊、拜合拉木、鲍盛鑫新消息

就在今天!1月25日下午,国足传来李昊、拜合拉木、鲍盛鑫新消息

生活魔术专家
2026-01-25 14:44:07
俄美乌首次三方"群聊"细节披露:领土问题无共识

俄美乌首次三方"群聊"细节披露:领土问题无共识

看看新闻Knews
2026-01-25 17:33:22
王欣瑜澳网第三战被迫两次登场,13号种子连续失误让出第一分

王欣瑜澳网第三战被迫两次登场,13号种子连续失误让出第一分

体育丰蕴
2026-01-24 17:26:17
1500亿电力设备大牛股!去年大赚32亿,最新回应来了

1500亿电力设备大牛股!去年大赚32亿,最新回应来了

上市之家
2026-01-25 16:52:17
门槛,又提高了

门槛,又提高了

博闻财经
2026-01-25 17:21:39
经济数据亮眼GDP破140万亿,为何民生仍感艰难

经济数据亮眼GDP破140万亿,为何民生仍感艰难

几人尽弃
2026-01-25 02:00:50
第10次大满贯八强!高芙三盘击退19号种子,连续3年跻身澳网八强

第10次大满贯八强!高芙三盘击退19号种子,连续3年跻身澳网八强

全景体育V
2026-01-25 15:14:11
1989年天津男子捡到女乞丐为妻,21年后警方找上门,发现妻子身份

1989年天津男子捡到女乞丐为妻,21年后警方找上门,发现妻子身份

我是玲玲
2024-11-16 14:36:28
中国0-4日本!输球不可怕 可怕的是安东尼奥赛后这番话 认清差距

中国0-4日本!输球不可怕 可怕的是安东尼奥赛后这番话 认清差距

天台看落日
2026-01-25 17:15:23
绝命后卫师仅存三人:一个跳崖幸存 一个坐穿牢底 一个酷刑不低头

绝命后卫师仅存三人:一个跳崖幸存 一个坐穿牢底 一个酷刑不低头

小港哎历史
2026-01-24 07:00:03
生化危机维罗妮卡重制版爆料!外媒称27年上半年发售

生化危机维罗妮卡重制版爆料!外媒称27年上半年发售

游民星空
2026-01-24 22:08:40
赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

赖昌星发妻曾明娜现状:逃亡10年后回国,守着3000平老宅安静养老

古书记史
2025-12-12 11:21:38
日本退役将领19年预言:中国2025统一台湾,2045年“入侵”冲绳

日本退役将领19年预言:中国2025统一台湾,2045年“入侵”冲绳

风笛悠扬声
2026-01-25 16:46:50
《太平年》外的真太平,一个家族选择不战而降,留下最富庶的江南

《太平年》外的真太平,一个家族选择不战而降,留下最富庶的江南

长风文史
2026-01-23 19:21:30
Wow!顶美御姐,这颜值相当抗打啊…

Wow!顶美御姐,这颜值相当抗打啊…

碧波万览
2026-01-25 00:26:28
王玉雯工作室严正声明“全面停止《突然的喜欢》一切宣传工作”

王玉雯工作室严正声明“全面停止《突然的喜欢》一切宣传工作”

韩小娱
2026-01-25 08:41:58
2026-01-25 18:08:49
他是她的岛熊
他是她的岛熊
他是她的岛熊
229文章数 36关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

西安一道路车位紧俏 十多辆"老赖"车欠费最多者超2万

头条要闻

西安一道路车位紧俏 十多辆"老赖"车欠费最多者超2万

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

王玉雯方严正声明 剧方回应:涉事人员已被开除

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

亲子
教育
手机
游戏
健康

亲子要闻

服了这妈妈

教育要闻

六年级附加题,难住全班同学

手机要闻

荣耀泡泡玛特联名手机今日开售:首销即引爆,线下再现排队热潮

比一个人坐牢832次更难的,是和19个人一起坐牢

耳石脱落为何让人天旋地转+恶心?

无障碍浏览 进入关怀版