网易首页 > 网易号 > 正文 申请入驻

大数据时代,为什么还需要做小样本研究?| 追问Data

0
分享至

追问快读:

大脑-行为关联研究中,过分追求大样本可能会遏制创新。相较之下,小规模研究在测试新的扫描范式时至关重要。

“可重复性危机”,即指实验结果难以通过独立的重复实验得到相同的结论,这一问题在心理学、医学和神经科学等多个领域普遍存在,长期困扰着学界。

在功能性磁共振成像(fMRI)研究领域,许多早期研究由于样本量小、数据处理不足或方法存在局限性,其脑功能与行为关联研究结果常常难以复现。为此,人脑功能神经影像学界呼吁:采用更大规模的样本,以建立脑功能测量与个体表型之间可重复且普遍存在的关联,从而提高fMRI在临床或其他实际应用中的有效性。

图1. 科学中可重复危机出现的简单示例. 图源:Roger Peng.

“全脑关联研究

样本量需数千甚至更多”

这一观点的代表性研究——圣路易斯华盛顿大学医学院的斯科特·马雷克(Scott Marek)及其同事既往发表在《自然》上的高影响力研究认为,大多数已发表的全脑关联研究(brain-wide association studies)存在样本量严重不足,难以得出有意义结论的问题。

例如,若一项25名被试参与的研究发现某个大脑变量(如某一特定功能连接强度)与某个表型变量(如智商)之间存在统计学上显著的关联,在另一相同样本规模的实验中再次出现的概率仅约为5%(即原始显著性阈值);而在1000名参与者中,这一概率约为20%。因此,在许多情况下,若要检测出足够稳健且可重复的关联,可能需要数千甚至上万名参与者

图2. 单变量全脑关联的效应大小和抽样变异性. 图源:

Marek, Scott et al. “Reproducible brain-wide association studies require thousands of individuals.” Nature vol. 603,7902 (2022): 654-660. doi:10.1038/s41586-022-04492-9

对从事基础科学或转化研究的科研人员而言,这些结果发人深省。但这种元科学(meta-scientific)审视,却是必要且被接纳的。马雷克及其同事的研究结果并不出人意料:当研究健康成年人间的个体差异时,由于效应量较小且数据噪音较大,很难明确建立大脑测量数据与表型之间的关联。

然而,呼吁所有此类研究都采用超大样本量的做法同样存在风险:我们可能会因此遏制实验范式(in-scanner paradigms)的创新,而这恰恰有可能提高大脑-表型关系的灵敏度,从而减少获得可靠且可重复结果所需的样本量。

图3. 实验范式示例. 图源:Howard, S J et al. “Behavioral and fMRI evidence of the differing cognitive load of domain-specific assessments.” Neuroscience vol. 297 (2015): 38-46.doi:10.1016/j.neuroscience.2015.03.047

实验范式设计的游湖

或能实现“四两拨千斤”

实验范式,或受试者在fMRI扫描过程按要求进行的认知活动,其实发挥数据最大效用的关键,虽然其所受重视程度不如样本量和统计方法。虽然我们通常认为,需要大规模的样本才能发现稳定且有意义的个体内和个体间差异,但这很可能只是因为我们采用的任务设计并不理想。

由于单个实验室难以扫描成千上万的参与者,许多最具统计效力的大脑-表型关系研究都采用现代科研合作项目的数据。这些项目投入了巨大的资源来采集足够大样本量的数据,以获得统计上的显著性。

例如,扫描了1200名健康的年轻成年人的“人类连接组计划”(Human Connectome Project);计划在让12000名青少年在10年内接受5次扫描的“青少年脑与认知发展研究”(Adolescent Brain and Cognitive Development study);以及规模最大的、计划扫描十万被试,并跟进纵向随访的“英国生物银行”(UK Biobank)。这些联盟所采集的数据将在未来被不同的研究团队用于探索多种科学问题,因此他们选择的扫描范式尤为重要。

不幸的是,这些大型研究通常使用的范式对大脑-行为关联的敏感性并不高。上述三项研究大多或至少部分的fMRI扫描机时都花在了所谓的“静息态”上,即被试在机器中安静躺着,任由思绪飞扬,不接受任何明确的刺激或参与任务。其余的机时则分配给一些传统的认知任务,比如考察工作记忆的n-back任务或评估情感处理的情绪面孔任务(emotional faces task)。

图4. 情绪识别任务的试验结构示例. Mavratzakis, Aimee et al. “Emotional facial expressions evoke faster orienting responses, but weaker emotional responses at neural and behavioural levels compared to scenes: A simultaneous EEG and facial EMG study.” NeuroImage vol. 124,Pt A (2016): 931-946. doi:10.1016/j.neuroimage.2015.09.065

静息态固然有其优点——适用于难以扫描的群体(如儿童和某些患者),易于不同站点间的标准化,纵向研究中易于操作。因此,静息态被大脑-表型关联研究广泛采用。事实上,马雷克及其同事的分析中主要使用的正是静息态数据,原因显而易见:样本量够大,足以支持其结论。

人类连接组计划启动以来的十多年间,有类似的研究提出获取的数据量固然重要,数据的类型同样关键。但不幸的是,静息态功能成像往往对个体差异的敏感性最低。

而一些研究尽管规模较小,但结果却颇具说服力——基于相同被试、预测相同表型的模型,在使用任务态fMRI数据时,表现显著优于使用静息态数据的结果。即使采用的任务与目标行为看似无关,比如在预测流体智力(fluid intelligence)时使用简单的运动任务(如敲击手指),这一效应依然存在。在某些案例中,任务态数据可以解释多达五倍于静息态数据的扫描仪外的表型差异(out-of-scanner phenotypes)。

图5. 任务诱导的大脑状态是个体特质预测准确性的关键决定因素. 图源:Greene, Abigail S et al. “Task-induced brain state manipulation improves prediction of individual traits.” Nature communications vol. 9,1 2807. 18 Jul. 2018, doi:10.1038/s41467-018-04920-3

要理解为什么会出现这种情况,可以用压力测试来类比:与其观察大脑在完全不受限制状态下的活动,我们更倾向于让大脑处于特定条件下,以便受关注的表型相关的功能模式(比如表征当前或预测未来健康状况的指标)易于显现出来。尽管相较于静息态,传统任务已经能更有效地充当这种“压力测试”,但越来越多的证据表明,非传统任务,包括所谓的“自然(naturalistic)任务”(如让参与者在扫描仪中看电影或听故事),产生的效果可能更佳。

小样本研究,

为大数据预留创新空间

那么,为什么目前的大规模数据集更偏向于静息态和少数几项被反复使用的认知任务呢?

原因在于,这类项目通常需要由多个首席研究员带领的大团队来完成。为了达成共识或所谓的“科学委员会决策”,常常会倾向于采用已经被验证的经典方法。这不难理解,在一个计划要应用于数百甚至数千人的实验方案中,加入一个新的实验范式是有风险的。然而,过度强调经典方法或追求不同数据集间的一致性,可能会让我们陷入僵局,阻碍创新。

如果不依赖经典范式,那么我们应该如何选择大型合作研究中的实验范式呢?有哪些合适的候选方法?明确地说,本文并不提倡将完全未经验证的范式投入耗资数百万美元的科学项目中“试水”。

但我们确实需要在研究中留出创新的空间,并非每项研究都需要成千上万的参与者。

图源:Mari Fouz.

可以先在小规模研究中积累证据,未来的大规模合作项目可以在那些经过验证的、对个体间和个体内相关变异敏感的范式之中做出“稳妥的选择”。实际上,来自多个实验室的证据更为强有力,因为结果“扛住”了不同实验室的数据采集、预处理和分析的微小差异而依然保持稳健,结论令人信服。

如前所述,一些证据表明,扫描时看电影和听故事,能够在减少噪声信号的同时,保留甚至增强有意义的差异。

另一种有前景的范式是“带标注的静息态(annotated rest)”,即在扫描过程中或之后的特定时间间隔,被试口头报告他们的思维过程,以促进被试内省,并增强大脑信号与当下思维模式之间的关联。

此外,交互游戏以及其他来自新兴领域计算精神病学的评估工具,将精心设计的任务下的行为模式作为认知和情感类型的读出信息,有助于揭示大脑活动与表型之间的关系,尤其是那些与心理健康相关的表型。

坦率地说,哪种范式或范式组合“最优”,仍然是一个尚未解决的问题——但这正是关键所在:如果仅仅因为样本量小就否定基于新范式的研究发现,我们将错失开发全新数据采集方法的机会,这些方法或许可能对未来大规模研究的运行方式产生颠覆性改变,进而改变我们对人脑的理解。

https://www.thetransmitter.org/future-of-fmri/to-improve-big-data-we-need-small-scale-human-imaging-studies/

文献:

[1] Botvinik-Nezer, Rotem, and Tor D. Wager. "Reproducibility in neuroimaging analysis: challenges and solutions." Biological Psychiatry: Cognitive Neuroscience and Neuroimaging 8.8 (2023): 780-788.

[2] Marek, Scott, et al. "Reproducible brain-wide association studies require thousands of individuals." Nature 603.7902 (2022): 654-660.

[3] Greene, Abigail S., et al. "Task-induced brain state manipulation improves prediction of individual traits." Nature communications 9.1 (2018): 2807.

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。

TCCI建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

特约前排观众
2026-01-29 00:15:03
触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

澜归序
2026-02-01 07:18:56
伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

环球网资讯
2026-01-31 05:44:17
“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

看看新闻Knews
2026-02-01 11:56:43
德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

蜉蝣说
2026-01-30 11:00:49
四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

墨兰史书
2026-01-30 17:25:04
三大运营商宣布调整电信服务增值税税率,由6%调至9%

三大运营商宣布调整电信服务增值税税率,由6%调至9%

IT之家
2026-02-01 17:56:09
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
一块H200芯片,为何炸翻了整个汽车圈?

一块H200芯片,为何炸翻了整个汽车圈?

智驾在线
2026-01-30 20:48:37
北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

我心纵横天地间
2026-02-01 13:18:57
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

懂球帝
2026-02-02 07:54:10
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

杨仔述
2026-01-31 18:16:31
筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

A股数据表
2026-02-01 17:35:03
就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

爱吃醋的猫咪
2026-02-01 19:34:35
难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

球事百科吖
2026-02-02 05:36:58
很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

忠于法纪
2026-01-18 17:42:24
抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

卿昀
2025-01-25 21:22:58
媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

侃球熊弟
2026-02-01 00:06:51
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
2026-02-02 08:15:00
追问Nextquestion incentive-icons
追问Nextquestion
科研就是不断探索问题的边界
650文章数 32关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

旅游
家居
本地
时尚
教育

旅游要闻

搭直升机15分钟 尽览罗湖盐田风情

家居要闻

蓝调空舍 自由与个性

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

“多巴胺风”又又又火了!这样穿时髦又减龄

教育要闻

民办大学出来真的很难找工作吗?

无障碍浏览 进入关怀版