网易首页 > 网易号 > 正文 申请入驻

最新Nat Hum Behav | 人类如何判断物体“有多光泽”?

0
分享至


认知神经科学前沿文献分享


基本信息

Title:Human gloss perception reproduced by tiny neural networks

发表时间:2026-05-12

发表期刊:Nature Human Behaviour

获取原文:

1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



引言

我们几乎每天都在凭视觉快速判断物体“亮不亮”“润不润”“像不像金属或塑料”。这种能力看似自然,却是视觉科学里相当棘手的问题。因为所谓光泽感,并不是图像里某个固定特征的简单读数:同一材料只要换了形状、照明环境或观察视角,高光的位置、范围、亮暗分布乃至颜色关系都可能显著变化。于是,人眼看到的“有光泽”,并不必然等同于物体某个物理反射参数被忠实恢复出来。

光泽知觉(gloss perception)因此长期被当作材料知觉中的经典难题。过去研究提出过不少候选线索,例如亮度直方图偏度、亮度梯度、表面亮度标准差,以及围绕镜面反射图样构建的 sharpness、coverage、sub-band contrast 等指标。这些线索在特定刺激条件下往往有效,但一旦把形状、光照和视角变化拉大,单一模型就很难稳定解释人的判断。换句话说,真正困难的不是在少量理想化图像里区分“亮”和“不亮”,而是在复杂成像条件下,找出人类究竟依赖了什么样的图像计算。

这篇论文的核心问题很明确:作者希望找到既能由图像直接计算、又尽量具有生物学可解释性的模型,用来解释人类的光泽判断。他们尤其关心一个更深的问题:人类在做这类判断时,是否接近于“逆光学”推断——也就是从图像中恢复物体真实的镜面反射属性;还是说,视觉系统更多依赖一套较简单、未必追求物理真值、但足以支持稳定知觉的图像规则。这个问题之所以重要,是因为它关系到我们如何理解中层视觉:视觉系统究竟是在逼近外部世界的物理参数,还是在构建对行为有效的近似表征。

为回答这一问题,作者先用大规模渲染图像和众包行为实验,建立了一个覆盖广泛形状、照明和视角条件的光泽判断数据集;再把“预测人类评分”和“恢复物理真值”作为两类不同目标,分别训练多种模型,并系统压缩网络深度与卷积核数量。这样做的意义在于,它把“像人”与“像物理恢复器”明确区分开来。如果一个极小网络已经能较好复现人的判断,而恢复物理反射参数却需要更深、更复杂的模型,那么人类光泽知觉依赖的计算,就可能比传统设想的逆光学推断更简单,也更偏向图像统计与结构线索的利用。


实验设计与方法逻辑

作者使用 Mitsuba 渲染器生成 3,888 张物体图像,覆盖 36 种照明环境、36 种物体几何和 3 个随机视角的全组合;表面采用 Ward 反射模型,固定粗糙度为 0.05,并随机设定镜面反射强度与本体颜色(Fig. 1)。随后,研究团队通过在线非对称光泽匹配任务,让观察者调节参考物体的 Pellacini’s c 参数,使其与测试图像“看起来一样有光泽”,并将每张图的重复作答与多位观察者结果平均,得到“人类标签”。

在模型层面,作者同时比较传统亮度统计模型、基于镜面反射图样的候选模型,以及不同深度的卷积神经网络。网络分别用“人类标签”或“物理真值标签”训练,以区分“预测人类判断”和“恢复物理反射参数”两类计算目标。


核心发现

发现一:人类光泽判断与物理镜面反射参数并不一一对应,但这种偏离高度稳定

整篇文章首先建立了一个关键前提:人类在这项任务中的光泽判断,并不等于对物体物理镜面反射参数的直接读取。Fig. 2a 显示,3,888 张图像的平均观察者设定与物理真值只有中等相关,Pearson’s r = 0.52;从单个观察者来看,这种偏离更为普遍,Fig. 2b 中位相关仅为 0.46,四分位范围为 0.40–0.54。也就是说,在作者覆盖的广泛形状、光照和视角条件下,人类判断和物理参数之间并不存在简单的一一映射。


Figure 2. Summary of behavioural results

但这并不意味着人类反应只是噪声。恰恰相反,Fig. 2c 和 Fig. 2d 表明,无论是同一观察者两次作答之间,还是不同观察者彼此之间,结果都相当一致。观察者间相关的中位数可达 0.86 和 0.82,说明人们虽然偏离了物理真值,却在“如何偏离”这件事上呈现出稳定而系统的共同模式。Fig. 2e 给出的示例也很直观:有些图像物理上镜面反射较强,却不一定被看作更有光泽;另一些则可能相反。

发现二:预测人类光泽判断只需很小的网络,而恢复物理真值需要更复杂计算

论文最核心的比较集中在 Fig. 3。作者把各种候选模型同时放在两个维度上评估:一维看它与物理真值的相关,另一维看它与人类判断的相关。结果很清楚:传统亮度统计模型,以及基于镜面反射图样的 sharpness、coverage、sub-band contrast 模型,都难以靠近人类观察者分布。它们有些更接近物理真值,但并不能复现人类判断特有的系统性偏差,因此不足以解释这项任务中的行为模式。


Figure 3. Summary of computational model behaviours

真正值得注意的是,用“人类标签”训练的浅层卷积网络明显更接近观察者群体。Fig. 3 中,单层和三层的人类样网络都优于作者测试的物理真值训练网络;其中最小的单卷积核模型,在 24 折交叉验证中的平均相关达到 0.65,约为观察者间一致性上限的 75.3%。相反,即便是为恢复物理真值而设计的更复杂网络,甚至加入额外 3.8 × 10^5 张图像训练的 ResNet18,虽然对物理真值的相关可接近 0.9,但与人类反应的相关仍低于 0.5(Fig. 3)。

发现三:最小的人类样网络中自发形成“亮斑+对角脊”卷积核,提供了可解释线索

如果说 Fig. 3 回答的是“小网络是否足够”,那么 Fig. 4 回答的就是“它究竟在看什么”。作者把最简单的单卷积核模型拆开后发现,24 次独立训练得到的卷积核形态高度一致(Fig. 4b):通常表现为一个明亮中心斑块,周围环绕较暗区域,并伴随一条或两条约 45° 或 135° 的对角 ridge。这样的结构既适合捕捉高光常见的局部亮度轮廓,也能对斜向延展的高光边界和曲率变化产生敏感反应。


Figure 4. Analysis of single-kernel models trained on human gloss judgements

更进一步,Fig. 4c 和 Fig. 4d 显示,这些卷积核的色彩分布沿着 daylight locus 排列;当训练图像中的环境照明色域在 ab 平面上旋转约 90° 时,学到的卷积核色彩分布也随之旋转。这说明模型利用的不只是“局部亮”,还包括高光与环境照明统计之间的色彩关系。与此同时,Fig. 4e 和 Fig. 4f 表明,对角 ridge 的方向更受物体投影几何影响,而不是简单追随绝对光照方向。

发现四:简单模型不仅复现已知光泽效应,还在外部渲染数据和真实照片上显示出泛化能力

一个模型若只在原始训练分布内有效,很难真正支撑机制解释。因此,论文随后把人类样网络带到训练集之外检验。首先在已知光泽操控图像上,Fig. 6 显示,无论是高光旋转、水平平移,还是表面粗糙度增加、镜面反差减弱,单层与三层人类样网络都预测到感知光泽下降,而且这些图像并未进入训练集。这里最值得关注的,不只是模型还能给出合理输出,而是它们对经典光泽错觉方向的反应与既有知觉现象一致,提示网络抓住了一些更一般的图像规律。


Figure 6. Evaluation of single-kernel and three-layer network models for three known perceptual effects

进一步的外部验证同样重要。Fig. 7 中,在 Serrano 等人的 42,120 张外部渲染图像上,单核模型按光照和形状平均后的相关约为 0.63 和 0.64,三层模型则约为 0.53 和 0.65。结果说明,更复杂的网络并不必然带来更稳健的跨数据集泛化。到了真实世界照片,Fig. 8 的结果更具说服力:在 185 张材料照片的“哑光/有光泽”分类任务中,单核模型准确率达到 91.9%,高于三层模型的 71.9%。


Figure 7. Results of a generalization test using Serrano dataset


Figure 8. Generalization performance on real-world material photographs


归纳总结和点评

这篇论文最重要的贡献,不在于宣称“光泽知觉已经被彻底解释”,而在于把一个经典难题重新组织成了可比较的两类计算目标:一类是恢复物理反射参数,另一类是复现人类判断。作者的结果表明,在其所定义的图像任务和刺激范围内,人类光泽知觉并不等同于对物理真值的精确恢复,而是可以由相当浅层、且具有一定可解释性的卷积计算较好逼近。

这项工作对视觉科学的价值,在于它把研究重心从“人是否像最优观察者那样做逆光学推断”,推进到“哪些简单图像特征足以支撑稳定知觉”。同时也要保持边界意识:本文讨论的是静态图像上的光泽判断,而不是现实世界中包含运动、双眼信息和主动观察的完整材料知觉;因此,更合适的理解是,它为解析光泽知觉机制提供了一条更可操作、也更透明的建模路径。


请打分

这篇刚刚登上 Nature Human Behaviour 的研究,是否实至名归?我们邀请您作为“云审稿人”,一同品鉴。精读全文后,欢迎在匿名投票中打分,并在评论区分享您的深度见解。

分享人:BQ

审核:PsyBrain 脑心前沿编辑部

你好,这里是「PsyBrain 脑心前沿

专注追踪全球认知神经科学的最尖端突破

视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊

每日速递「深度解读」与「前沿快讯

科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。

点击卡片进群,欢迎你的到来

一键关注,点亮星标 ⭐ 前沿不走丢!


一键分享,让更多人了解前沿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

美国发话也不行,中方正式通告全球:打日本,中国具备“正当性”

凤语谈
2026-05-28 12:13:58
FBI逮捕CIA高官:家中搜出303根金条、200万美元现金、30多块名表

FBI逮捕CIA高官:家中搜出303根金条、200万美元现金、30多块名表

红星新闻
2026-05-28 11:05:10
毒杨梅事件升级!央视二次暗访,会长不简单,1天亏几亿只是开始

毒杨梅事件升级!央视二次暗访,会长不简单,1天亏几亿只是开始

米师傅安装
2026-05-29 01:55:42
特朗普暴怒!短短48小时内,他见识到了:伊朗的刚猛、中国的精明

特朗普暴怒!短短48小时内,他见识到了:伊朗的刚猛、中国的精明

流史岁月
2026-05-28 18:45:04
“好怕你俩亲上”,成年礼家长合照出圈,儿子的情结写在脸上

“好怕你俩亲上”,成年礼家长合照出圈,儿子的情结写在脸上

蝴蝶花雨话教育
2026-05-29 00:05:17
100万潜在美国买家放弃买新车!高油价、高利率导致美国汽车库存积压

100万潜在美国买家放弃买新车!高油价、高利率导致美国汽车库存积压

风向观察
2026-05-28 18:44:26
江姐临刑遭特务刁难,被逼脱去衣履,背后缘由格外残酷

江姐临刑遭特务刁难,被逼脱去衣履,背后缘由格外残酷

唠叨说历史
2026-05-27 14:45:34
被指造假压榨学生5年,网传北航这位博导遭“天花板”处分,学术路全断了

被指造假压榨学生5年,网传北航这位博导遭“天花板”处分,学术路全断了

互联网大观
2026-05-28 16:45:38
上海G2绝杀广厦夺冠式庆祝,卢伟抱古德温,张镇麟累坏,布朗沮丧

上海G2绝杀广厦夺冠式庆祝,卢伟抱古德温,张镇麟累坏,布朗沮丧

篮球资讯达人
2026-05-28 22:33:33
性,正在成为职场流通的硬资源!

性,正在成为职场流通的硬资源!

灯锦年
2026-05-28 17:45:31
外媒:中国“电子攻击”荷兰护卫舰,后者强闯中国南海遭电子反制

外媒:中国“电子攻击”荷兰护卫舰,后者强闯中国南海遭电子反制

蓝星杂谈
2026-05-28 19:36:39
曝央行要求大型国有银行5月加大放贷力度,但若不解决消费,是治标不治本

曝央行要求大型国有银行5月加大放贷力度,但若不解决消费,是治标不治本

爆角追踪
2026-05-28 17:07:33
知名演员无戏可拍,和母亲街边卖鱼意外走红,今选择拍视频当网红

知名演员无戏可拍,和母亲街边卖鱼意外走红,今选择拍视频当网红

白面书誏
2026-05-27 20:46:32
注意了!印度来华人数飙升,深圳是最受欢迎城市,评论区全是担忧

注意了!印度来华人数飙升,深圳是最受欢迎城市,评论区全是担忧

谭谈社会
2026-05-28 11:41:20
彻底凉透!湖北割四赔五后续!政府出手也没用,大批麦客集体绕道

彻底凉透!湖北割四赔五后续!政府出手也没用,大批麦客集体绕道

历来纵横
2026-05-28 17:07:51
“8个孩子,没一个拿得出手!”农村父亲晒7儿1女,遭到网友群嘲

“8个孩子,没一个拿得出手!”农村父亲晒7儿1女,遭到网友群嘲

妍妍教育日记
2026-05-28 20:32:42
杭州女子征婚:不要彩礼,能提供5分钟夫妻生活,每月给男人3000

杭州女子征婚:不要彩礼,能提供5分钟夫妻生活,每月给男人3000

谭谈社会
2026-05-28 18:34:27
同事一个月请了三次丧假,结果领导说:你家亲戚死光了?然后同事就给了领导一耳光!我们上去拉偏架,最后领导被揍的鼻青脸肿,还降职调岗

同事一个月请了三次丧假,结果领导说:你家亲戚死光了?然后同事就给了领导一耳光!我们上去拉偏架,最后领导被揍的鼻青脸肿,还降职调岗

大爱三湘
2026-05-28 21:14:00
拜登妻子爆料称,2024年大选拜登和特朗普辩论时中风;辩论不到半小时,拜登似乎短暂“失神”,话不成句

拜登妻子爆料称,2024年大选拜登和特朗普辩论时中风;辩论不到半小时,拜登似乎短暂“失神”,话不成句

极目新闻
2026-05-28 17:11:57
女子和情夫幽会,完事后丈夫发现有液体,女子找情夫提要求被杀

女子和情夫幽会,完事后丈夫发现有液体,女子找情夫提要求被杀

丫头舫
2026-05-28 11:50:39
2026-05-29 05:59:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
502文章数 20关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

头条要闻

美财长:特朗普不会接受“糟糕的伊朗协议”

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

艺术
家居
旅游
亲子
公开课

艺术要闻

吴湖帆小品册页

家居要闻

蜂鸟餐椅 线面交错

旅游要闻

游客在九寨沟被索要"照镜费" 景区:店家随口说的

亲子要闻

豆包否认建议家长“每顿给婴儿喂60毫升奶”!提醒遵医嘱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版