网易首页 > 网易号 > 正文 申请入驻

AI也会嘴硬!看不清图却信心满满,研究团队如何让它学会诚实?

0
分享至

多模态大模型,到底有多“嘴硬”?

浙江大学联合阿里巴巴、香港城市大学、密歇根大学的研究团队做了一个很直接的实验:

把输入图像从清晰状态一路加噪到接近不可辨认,同时持续监测模型的准确率与置信度。

结果是,准确率断崖式下跌,但置信度几乎不动。也就是说,图像已经看不清了,模型仍然会高置信度地给出答案。



这类“盲目自信”,正是多模态大模型在复杂视觉推理中产生幻觉和误判的重要根源。针对这一问题,研究团队提出了CA-TTS(Confidence-Aware Test-Time Scaling)框架:先通过置信度驱动的强化学习校准模型的自我评估能力,再把校准后的置信度转化为推理阶段的资源分配信号。



这项工作的出发点,其实是一个长期被忽视的问题:模型是否真的知道自己“不知道”?

研究团队将上述现象定义为“感知钝化”(Perceptual Bluntness)。也就是,模型对视觉信息质量的变化缺乏敏感性,视觉证据已经明显退化,但置信度仍维持在高位。放在人类语境里,这很像一个人在看不清题目的情况下,仍然非常笃定地报出答案。



训练阶段的核心模块是CDRL(Confidence-Driven Reinforcement Learning)。它的目标不是单纯提升答题准确率,而是让模型在“看得清”和“看不清”两种情况下,给出与视觉证据相匹配的置信度。

具体做法是,让模型同时处理同一问题的原始图像与加噪图像,并通过强化学习优化一个双重奖励机制:

1. 感知敏感性奖励:鼓励模型在原始图像与噪声图像之间产生合理的置信度差异。差异越大,说明模型越能感知视觉退化。

2. 校准一致性奖励:当模型预测正确且置信度高时给予正向奖励;当模型预测错误但置信度仍高时施加惩罚。

这两个奖励共同约束模型学会两件事:一是对视觉退化保持敏感,二是对自身判断保持诚实。

在训练数据上,研究团队从6个公开基准中筛选出1936个高质量样本,并使用CLIP注意力图定位关键视觉区域,生成更具针对性的扰动,使噪声集中施加在真正影响推理的局部区域。



从结果看,CDRL的效果并不只是“置信度变低”这么简单,而是“置信度终于跟视觉证据对上了”。面对噪声图像时,训练后的模型置信度下降幅度是训练前的4.3倍;面对遮挡条件时,这一比值达到4.7倍。

更值得注意的是,训练前模型在视角变换和马赛克干扰下,置信度甚至还会反向上升,而CDRL训练后,所有视觉扰动条件下的置信度都转为显著下降,ECE与AUC指标也同步改善。

有了更可信的置信度之后,研究团队进一步提出CA-TTS,把“模型对自己有多确定”转化为推理阶段的调度信号。它包含三个协同工作的模块,并由专家模型动态决定何时介入:

Self-Consistency:不再使用简单多数投票,而是采用置信度加权投票。模型生成多个候选答案后,先由内部置信度进行聚合,再引入专家模型作为外部校准器,对候选答案进行二次评估。

Self-Reflection:当初步结果的置信度不足时,专家模型以Critic角色生成批评意见,引导基础模型重新推理,避免它在原有错误路径上反复自洽。

Self-Check:在视觉层面对答案进一步验证。通过对比解码,比较原始图像与噪声图像下的输出概率分布;如果答案确实依赖视觉证据,那么在噪声图像下其支持度应当下降。





在四个主流视觉推理基准上,CA-TTS的表现如下。需要强调的是,这里的基座模型统一为Qwen2.5-VL-7B,因此提升主要来自方法本身,而不是底座差异。

几组数字尤其有代表性。Math-Vision上,CA-TTS从基线的23.0%直接提升到42.4%,几乎翻倍;MMMU上达到66.3%,相较基线提升17.5个百分点。这说明它带来的不是单点收益,而是在不同类型视觉推理任务上的一致性改进。

消融实验进一步揭示了CDRL与CA-TTS的分工关系:



单独使用CDRL,提升3.4个百分点,说明置信度校准本身就有独立价值;单独使用CA-TTS,提升15.0个百分点,说明推理框架已经能够显著改善决策质量;两者结合后总提升达到19.4个百分点,表明CDRL为CA-TTS提供了更可靠的策略基础,二者存在明显协同效应。



研究团队还检验了专家模型的依赖程度。即使让Qwen2.5-VL-7B自身充当“专家”,性能也仍比纯Majority Voting高出接近5个百分点(32.57% vs. 27.65%)。换句话说,强专家模型确实能进一步放大收益,但框架本身并不是靠“抱大腿”成立的。

如果说四个基准上的SOTA说明方法“更准”,那么test-time scaling曲线揭示的是它“为什么更值”。



在Math-Vision上,研究团队比较了采样数量从1增加到32时,不同方法的准确率增长趋势。结果显示,CA-TTS的扩展斜率β = 3.65,而Majority Voting为1.64,DeepConf为1.19。也就是说,CA-TTS的扩展效率分别是后两者的2.2倍和3.1倍。

这意味着,同样是增加采样次数,CA-TTS并不是“更频繁地碰运气”,而是更有效地把额外算力投向真正不确定的问题上。当Majority Voting和DeepConf在35%左右逐渐趋于饱和时,CA-TTS仍能继续爬升,并最终突破45%。

从这个角度看,置信度校准并不是一个附属优化项,而是在重新定义test-time scaling的效率上限。它让“多算一点”这件事第一次变得更有方向感。

这项工作最值得关注的地方,可能并不只是又一个更高的benchmark分数,而是它提出了一种新的问题顺序。

CA-TTS的思路正好反过来:先通过CDRL建立对视觉证据变化敏感、且与准确性一致的置信度,再让这种置信度去指导推理资源的分配。这是一种明确的Perceive-then-Reason范式,也就是从“先推理后感知”转向“先感知后推理”。

当然,这一方向也并非没有代价。多次采样与专家模型调用会带来额外推理成本,当前实验也主要集中在数学推理和通用VQA任务上。但如果目标是让多模态大模型在高风险场景中真正做到“知道自己什么时候不该太自信”,那么这条路线已经给出了一个很有说服力的起点。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6月新规来了!3类常见病三甲不再接诊,今后看病别再跑错地方

6月新规来了!3类常见病三甲不再接诊,今后看病别再跑错地方

复转这些年
2026-04-26 18:48:03
结束了!再见杜兰特!今日再次缺席,火箭疑似内讧将被横扫

结束了!再见杜兰特!今日再次缺席,火箭疑似内讧将被横扫

小徐讲八卦
2026-04-27 06:17:20
张文宏谈长寿却提带状疱疹疫苗:不是劝你打,是提醒中年人别硬扛

张文宏谈长寿却提带状疱疹疫苗:不是劝你打,是提醒中年人别硬扛

白宸侃片
2026-04-27 05:50:37
杭州23岁小伙打篮球仅20多分钟,突发心脏骤停!41岁球友边打120边做按压,还用上了AED紧急抢救……跪到腿麻,压到手酸,人救回来了

杭州23岁小伙打篮球仅20多分钟,突发心脏骤停!41岁球友边打120边做按压,还用上了AED紧急抢救……跪到腿麻,压到手酸,人救回来了

都市快报橙柿互动
2026-04-26 20:41:14
预计2027年建成投用!成都火车北站将在年中迎来多个建设节点

预计2027年建成投用!成都火车北站将在年中迎来多个建设节点

红星新闻
2026-04-26 19:16:28
网友开盒挂出“深圳派出所烟男”名单,微博官方:严重违规,已关号处理

网友开盒挂出“深圳派出所烟男”名单,微博官方:严重违规,已关号处理

极目新闻
2026-04-26 17:45:26
广西一县级人民医院原院长收受900多万元“好处费”,爱好摄影和机车,供应商全满足;把患者当成牟利工具,最终被判刑14年6个月

广西一县级人民医院原院长收受900多万元“好处费”,爱好摄影和机车,供应商全满足;把患者当成牟利工具,最终被判刑14年6个月

极目新闻
2026-04-26 17:34:27
南方多省电价突然飙升,广东4月多次逼近1元/度!什么原因?专家:霍尔木兹海峡局势致燃料成本大幅攀升,工业生产旺盛拉高用电需求

南方多省电价突然飙升,广东4月多次逼近1元/度!什么原因?专家:霍尔木兹海峡局势致燃料成本大幅攀升,工业生产旺盛拉高用电需求

每日经济新闻
2026-04-25 20:30:11
石破茂:我当过首相所以我最清楚,没有中国,日本根本不可能存在

石破茂:我当过首相所以我最清楚,没有中国,日本根本不可能存在

黑翼天使
2026-04-27 00:25:04
黑尾酱,彻底消失了?

黑尾酱,彻底消失了?

生如稗草
2026-03-15 08:48:11
中超无罚分积分榜:蓉城22分,申花20分,铜梁龙18分

中超无罚分积分榜:蓉城22分,申花20分,铜梁龙18分

懂球帝
2026-04-26 23:55:16
4.26日晚间,多家上市公司,突发重磅利好,明天要起飞了

4.26日晚间,多家上市公司,突发重磅利好,明天要起飞了

风风顺
2026-04-27 01:05:03
金价跌得吓人!4月26日实测行情,普通人别盲目抄底

金价跌得吓人!4月26日实测行情,普通人别盲目抄底

三农老历
2026-04-26 18:21:11
女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

女子白天睡老公,晚上睡男同事,2019年上夜班的老公将她同事杀死

汉史趣闻
2026-04-26 16:27:51
南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,一审获刑5年

南京一派出所副所长为完成查处任务,“设计”让6名未成年人吸毒再查获,一审获刑5年

封面新闻
2026-04-26 17:18:07
突破极限!人类马拉松首破2小时大关:31岁名将跑出1小时59分30秒

突破极限!人类马拉松首破2小时大关:31岁名将跑出1小时59分30秒

风过乡
2026-04-26 18:55:21
震惊!大学教师分享女儿留学与欧洲旅行见闻被举报!网友:活该吧

震惊!大学教师分享女儿留学与欧洲旅行见闻被举报!网友:活该吧

火山詩话
2026-04-24 09:20:07
保利置业集团裁员51%

保利置业集团裁员51%

地产微资讯
2026-04-26 10:48:13
演唱会现场气味熏天!粉丝哭诉:求来之前洗个澡吧

演唱会现场气味熏天!粉丝哭诉:求来之前洗个澡吧

东方不败然多多
2026-04-24 16:03:20
穆式皇马2.0版本即将上线,姆巴佩第一个点赞附和

穆式皇马2.0版本即将上线,姆巴佩第一个点赞附和

K唐伯虎
2026-04-27 07:24:30
2026-04-27 07:40:49
元宝课堂
元宝课堂
关注我,生活更精彩
2416文章数 353关注度
往期回顾 全部

科技要闻

打1折!DeepSeek输入缓存降价

头条要闻

高市用双语表态:得知特朗普总统安然无恙 我如释重负

头条要闻

高市用双语表态:得知特朗普总统安然无恙 我如释重负

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

教育
本地
时尚
公开课
军事航空

教育要闻

小学找规律,6,9,13,16,(),25,难住老师

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

比阔腿裤还时髦?今年夏天一定要有“这条裤子”,减龄又松弛

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗总统:不会在压力、威胁下进行谈判

无障碍浏览 进入关怀版