网易首页 > 网易号 > 正文 申请入驻

NHB | 计算建模或遭遇统计危机!近八成研究的模型选择功效不足

0
分享至

PsyBrain 脑心前沿 | 公众号 PSY-Brain_Frontier

一键关注,点亮星标 ⭐️

不错过每日前沿资讯

认知神经科学前沿文献分享


基本信息

Title:Addressing low statistical power in computational modelling studies in psychology and neuroscience

发表时间:2025.11.17

Journal:Nature Human Behaviour

影响因子:16.0

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



研究背景

计算建模(Computational Modelling)已成为认知神经科学、心理学和脑科学领域揭示行为与神经数据背后隐藏机制的核心工具。通过构建复杂的数学模型来模拟认知过程,研究人员得以检验关于人类心智功能和其障碍的理论假设。在这一研究范式中,贝叶斯模型选择(Bayesian Model Selection, BMS) 扮演着关键的推断角色,用于评估一组竞争性理论模型中,哪一个能以最优方式解释观察到的数据。BMS因其强大的推断能力,被广泛视为替代经典零假设检验的有力工具。


注:图片由AI生成

然而,尽管计算建模的影响力日益增长,该领域却面临一个被长期低估的系统性挑战:模型选择的统计功效 (Statistical Power) 不足。低功效不仅会大大降低检测真实效应(Type II 错误)的概率,更严重的是,当低功效的研究得出“显著”结果时,其发现的真实效应很可能被夸大(即“赢者诅咒”效应或 Type I 错误增加)。这一危机的根源在于研究人员普遍未能充分认识到,确定足够的样本量 (N)并非唯一的考量因素,模型选择的功效还受到候选模型空间的大小 (K)的严峻约束。

本研究通过建立新的功效分析框架,首次系统性地量化了这一关键制约:当模型空间扩大时,即纳入更多的竞争性解释模型时,即使存在一个真实的最佳模型,其相对于次佳模型的相对优势(Effect Size)也会自然减小。这意味着,随着竞争性模型的增多,研究必须投入远超传统预期的更大样本量才能可靠地区分它们。这种关系类似于在一个选择有限(K 小)的国家和另一个拥有几十种美食(K 大)的国家中确定“最爱”:后者需要大得多的样本量才能做出自信的判断。因此,计算建模领域迫切需要一种方法论上的反思与校准,以确保推断的可靠性。


研究核心总结

本研究基于一项针对随机效应贝叶斯模型选择(Random Effects Bayesian Model Selection,RE-BMS)开发的通用功效分析框架 ,揭示了当前领域中普遍存在的统计缺陷,并提出了规范化的解决方案。

  1. 统计功效的定量法则与领域现状警示

该框架通过模拟分析清晰地证实并量化了模型选择统计功效的“双重依赖”:统计功效与样本量 (N) 呈正相关关系,但与候选模型空间大小 (K) 呈显著的负相关关系。这一定量关系要求研究人员在设计实验时,必须同时考虑 N 和 K 的平衡。

遗憾的是,利用此框架对发表在顶尖期刊(包括《自然-人类行为》、《自然》和《科学》)的52项人类计算建模研究进行的文献回顾显示,领域内的功效不足问题非常普遍且系统性。分析结果表明,在模型选择环节,高达79%(52项研究中的41项) 的研究统计功效低于公认的80%标准。这一惊人的数字表明,即使是发表在最高平台上的前沿研究,也普遍低估了区分复杂竞争模型所需的样本规模,面临模型误选的高风险。


Fig. 1 | Power as a function of sample size and size of model space.

  1. 严厉批判:固定效应模型选择的统计灾难

文献回顾同时发现,该领域仍有相当一部分研究(46%)依赖于固定效应模型选择(Fixed Effects Model Selection,FEMS) 。FEMS的基本假设是群体中的所有个体都遵循同一个单一模型 ,这忽略了人类群体中固有的、有意义的个体间异质性(Between-Subject Variability),在现代神经科学和心理学中被认为是不可信的 。

更令人担忧的是,FEMS在实践中存在灾难性的统计问题,这些问题使其推断结果极不可靠:

  1. 极高假阳性率: 在零假设情景(即模型之间无真实差异)下,FEMS在 97% 的模拟中错误地宣布了一个获胜模型 。这意味着使用FEMS,研究者几乎总会“发现”一个赢家,即使这个发现完全是随机噪声的产物,严重损害了推断的特异性 。

  2. 对异常值的极端敏感性: FEMS通过简单地累加所有个体的对数证据,使其对单个极端异常值具有不成比例的敏感性 。模拟分析显示,在50个受试者中,仅一个极端异常值(强烈支持模型 1)就足以在77%的模拟中推翻真实模型(Model 2)的推断结果 。这种对少数个体数据点的过度依赖,使FEMS的发现容易受到“赢者诅咒”的影响,夸大复杂模型的优势 。

鉴于这些无法弥补的统计缺陷,研究强烈建议该领域必须摒弃FEMS,转向统计假设更现实、对异常值敏感性更低的随机效应模型选择(RE-BMS)


Fig. 2 | Narrative review of the literature.

  1. 规范化推断与实践方向

RE-BMS 允许量化群体中的模型异质性,并使用超越概率(exceedance probability, XP) 作为关键指标,它量化了某一模型比所有其他模型更有可能的置信度。

本研究的一个重要方法论贡献是,针对RE-BMS推断缺乏统一阈值的问题,该功效框架首次通过零假设模拟,校准了一个严格的决策阈值,从而将Type I错误率控制在5%,与经典假设检验对标。这为超越概率提供了原则性的显著性标准,提高了该指标的规范性。


Fig. 3 | Fixed effects model selection is highly sensitive to modest outliers.

研究总结呼吁,研究人员在设计计算建模研究时,应主动利用新的功效分析框架,平衡样本量 N 和模型空间 K。在样本获取受限时,缩小模型空间至最相关的理论竞争者,是提高统计功效、确保研究结果可复现性和可靠性的关键策略。

前沿交流|欢迎加入认知神经科学前沿交流群!


Abstract

Computational modelling is a powerful tool for uncovering hidden processes in observed data, yet it faces underappreciated challenges. Among these, determining appropriate sample sizes for computational studies remains a critical but overlooked issue, particularly for model selection analyses. Here we introduce a power analysis framework for Bayesian model selection, a method widely used to choose the best model among alternatives. Our framework reveals that while power increases with sample size, it decreases as more models are considered. Using this framework, we empirically demonstrate that psychology and human neuroscience studies often suffer from low statistical power in model selection. A total of 41 of 52 studies reviewed had less than 80% probability of correctly identifying the true model. The field also heavily relies on fixed effects model selection, which we demonstrate has serious statistical issues, including high false positive rates and pronounced sensitivity to outliers.


核心图表、方法细节、统计结果与讨论见原文及其拓展数据。

分享人:饭哥

审核:PsyBrain 脑心前沿编辑部

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网红“姚金鱼”开绿茶速成班称已售15万人,亲身示范用话术眼神等拿捏男性,“让男人愿意为你大额付出”被指擦边低俗;平台回应:确认违规

网红“姚金鱼”开绿茶速成班称已售15万人,亲身示范用话术眼神等拿捏男性,“让男人愿意为你大额付出”被指擦边低俗;平台回应:确认违规

极目新闻
2026-04-15 22:31:55
天后麦当娜:一生交往一百多猛男,与自己保镖欢爱视频,还被拍卖

天后麦当娜:一生交往一百多猛男,与自己保镖欢爱视频,还被拍卖

七阿姨爱八卦
2026-04-09 09:32:37
从缅甸被救1年后,王星不再隐瞒,当众吐露心声,2大困境太难解

从缅甸被救1年后,王星不再隐瞒,当众吐露心声,2大困境太难解

八斗小先生
2026-04-15 17:44:34
日本撑不住了

日本撑不住了

极目新闻
2026-04-15 21:38:36
美国报纸评选五大世界级伟人,斯大林倒数第一,第一名竟来自中国

美国报纸评选五大世界级伟人,斯大林倒数第一,第一名竟来自中国

阿器谈史
2026-03-16 17:28:59
乌克兰攻打俄核电站后,不到24小时,基辅被炸,更严重的还在后面

乌克兰攻打俄核电站后,不到24小时,基辅被炸,更严重的还在后面

小小科普员
2026-04-16 15:07:11
4月15日快迅!伊朗方面重大宣布:特朗普直接就傻眼了...

4月15日快迅!伊朗方面重大宣布:特朗普直接就傻眼了...

娱乐圈的笔娱君
2026-04-16 11:00:19
孙中山独子孙科:1949年没跟随蒋介石去台湾,他后来过得怎么样?

孙中山独子孙科:1949年没跟随蒋介石去台湾,他后来过得怎么样?

抽象派大师
2026-04-01 14:10:39
600年都不倒!天安门这4根重达2万多公斤的华表,有何特殊含义?

600年都不倒!天安门这4根重达2万多公斤的华表,有何特殊含义?

墨印斋
2026-04-14 00:57:55
西双版纳游客疯狂“洗警”后续!官方明确禁令,这类行为将被追责

西双版纳游客疯狂“洗警”后续!官方明确禁令,这类行为将被追责

千言娱乐记
2026-04-16 15:06:00
家长担心女儿太美,发明“防早恋”发型,网友:颜值已经很安全了

家长担心女儿太美,发明“防早恋”发型,网友:颜值已经很安全了

蝴蝶花雨话教育
2026-04-10 13:25:02
无数身价过亿的大佬,都在想方设法把国内的钱偷偷转移到海外

无数身价过亿的大佬,都在想方设法把国内的钱偷偷转移到海外

流苏晚晴
2026-04-14 19:58:25
广东队最新消息,新外援抵达东莞!

广东队最新消息,新外援抵达东莞!

体育哲人
2026-04-16 12:09:15
31岁美女张筱雨去世,刚生完孩子仅1个月,妈妈透露原因

31岁美女张筱雨去世,刚生完孩子仅1个月,妈妈透露原因

黑哥讲现代史
2026-04-16 00:56:18
联想官宣多款新品5月19日发布 含razr fold大折叠

联想官宣多款新品5月19日发布 含razr fold大折叠

CNMO科技
2026-04-16 15:28:12
给天下子女的真心话:再孝顺,也别给80岁以上的父母做这8件事!

给天下子女的真心话:再孝顺,也别给80岁以上的父母做这8件事!

风起见你
2026-04-16 01:07:13
笑死,段永平这个误操作,可能要变成泡泡玛特第三大股东了

笑死,段永平这个误操作,可能要变成泡泡玛特第三大股东了

林氪
2026-04-15 09:51:53
各国不吃的食物:韩国人不吃香菜,俄罗斯人不吃海参,中国人呢?

各国不吃的食物:韩国人不吃香菜,俄罗斯人不吃海参,中国人呢?

阿纂看事
2026-04-11 19:24:41
中山市政务服务和数据管理局党组书记叶永忠被查

中山市政务服务和数据管理局党组书记叶永忠被查

新快报新闻
2026-04-16 13:33:16
欧冠4强出炉:拜仁vs巴黎,阿森纳vs马竞,大概率以下2队会师决赛

欧冠4强出炉:拜仁vs巴黎,阿森纳vs马竞,大概率以下2队会师决赛

小火箭爱体育
2026-04-16 10:11:44
2026-04-16 16:07:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
317文章数 15关注度
往期回顾 全部

科技要闻

39.98万!小鹏GX预售“纯电增程同价”

头条要闻

特朗普称访华行程不会受伊朗战事影响 外交部回应

头条要闻

特朗普称访华行程不会受伊朗战事影响 外交部回应

体育要闻

很快,亚洲篮球要有自己的NCAA了?

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

一季度GDP,5.0%!

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

数码
旅游
亲子
家居
军事航空

数码要闻

英特尔代工业务有望迎来苹果、AMD、Google和英伟达等大客户订单

旅游要闻

一张票根,三重豪礼!2026齐鲁超赛泰安文旅大礼包重磅来袭,61项主题优惠等你来领!

亲子要闻

辅酶q10备孕一般怎么吃?卵巢早衰怎么保养才能恢复?

家居要闻

智能舒适 简约风尚

军事要闻

封锁霍尔木兹海峡后 美释放双重信号

无障碍浏览 进入关怀版