Variational Representational Similarity Analysis (vRSA) for M/EEG
变分表征相似性分析(vRSA)在脑电图/脑电图中的应用
![]()
摘要
本文提出了一种用于电磁神经响应记录(如脑电图 EEG、脑磁图 MEG、皮层脑电图 ECoG 或局部场电位 LFP)的变分表征相似性分析(variational Representational Similarity Analysis, vRSA)。vRSA 是一种贝叶斯方法,可用于检验刺激或实验条件之间的相似性是否在单变量或多变量神经记录中得以体现。该方法拓展了此前在功能磁共振成像(fMRI)背景下提出的一种分析思路:vRSA 将“条件×条件”的数据协方差矩阵分解为假设效应成分与观测噪声成分,从而将 RSA 重构为一个协方差成分估计问题。在此框架下,刺激呈现后时间(peristimulus time)可被视作一个实验因子,使得研究者能检验不同实验效应在数据中随时间变化出现的概率。本文采用变分贝叶斯方法进行模型估计与模型比较,相较于经典方法,该方法具备多项优势,包括:统计检验效率更高、可通过贝叶斯可信区间对不确定性进行量化,以及更高的计算效率。在介绍理论基础之后,我们利用公开的 EEG 数据提供了一个完整示例分析。本文配套发布了用于 SPM 软件包的 vRSA 实现函数及示例分析脚本。
关键词:vRSA,RSA,变分,贝叶斯,多变量,EEG,MEG
引言
本文考虑对 EEG(脑电图)、MEG(脑磁图)、OPM(光泵磁力计)或 LFP(局部场电位)实验数据的分析,其中被试呈现来自不同类别或实验条件的刺激。例如,一个“条件”可能指实验中呈现一次或多次的某个特定刺激。分析的核心目标是检验被试的神经响应是否能区分这些条件,以及这些区分效应出现的具体时间点。
这引出了三个关键的分析决策:
- 空间尺度决策:是逐通道(或逐源)地检验实验效应,还是将多个通道(或源)联合考虑(例如在某个感兴趣区域或全脑范围内)?这类跨通道/源的模式有时被称为表征(representations)。
- 数据汇总方式决策:若联合分析多个通道,是将其视为一个多变量时间序列矩阵进行分析,还是通过一阶或二阶统计量加以概括?其中,一阶统计量通常指通道数据的均值,二阶统计量则可指通道间的协方差。
- 假设形式决策:是基于一阶效应(即每个实验条件引起的测量响应水平的变化)来设定假设,还是基于二阶效应(即实验条件之间的相似性或差异性)来设定假设?
上述选项的所有组合均可在同一类多变量线性回归模型的框架下处理,但具体分析流程与实现细节不同。本文聚焦于以下三重设定的组合:
- 同时适用于单通道与多通道数据;
- 基于数据的二阶统计量(即条件间的协方差结构);
- 假设以实验条件之间的相似性来表述——亦即基于实验设计本身的二阶统计量。
此类建模方法在神经影像学文献中被称为表征相似性分析(Representational Similarity Analysis, RSA)(Kriegeskorte, 2008)。
在 fMRI 数据分析中,RSA 曾被重新表述为一类成熟的统计方法——协方差成分分析(covariance components analysis)(Friston, Diedrichsen 等, 2019)。该方法将一个协方差矩阵(此处为“条件 × 条件”的协方差矩阵)分解为若干加权协方差矩阵(称为协方差成分)的线性组合。在 RSA 框架下,这些成分(或称假设矩阵)编码了对数据的特定假设性贡献。例如,一个模型可能包含:每一个实验条件对应的成分、条件间交互作用的成分,以及一个用于捕捉观测噪声的成分。为各成分赋予权重的参数(本文称为超参数)需从数据中估计得到。协方差成分估计已有成熟工具支持——本文采用 SPM 软件包中的限制性最大似然法(REML),该方法本质上是一种变分贝叶斯方案,已常规用于一般线性模型(GLM)分析(Friston 等, 2002)。这一整套 RSA 实现路径被称为变分 RSA(variational RSA, vRSA)。
本文将 vRSA 拓展应用于电磁神经信号数据(即 EEG、MEG、OPM、ECoG 或 LFP)。该方法既适用于单变量数据(来自单一通道),也适用于多变量数据(多个通道)。其核心优势在于可提供模型证据的对数(log evidence),即数据 y 在给定模型 m 下的对数概率:ln p(y|m)。该量亦称边缘似然(marginal likelihood),可用于贝叶斯模型比较——通过比较两个或多个模型的证据值来检验假设。实践中,可构建两个模型:m₁(包含所关心的协方差成分),以及至少一个对比模型 m₂(通过将某些成分对应超参数固定为零,“关闭”其贡献)。本文所述方法可直接估算各模型的对数证据;随后可计算证据比(等价于对数证据之差):
![]()
该差值即为对数贝叶斯因子(log Bayes factor)(Kass & Raftery, 1995)。进一步,可通过 softmax 函数将该结果转换为任一模型的后验概率 p(m₁|y) 或 p(m₂|y)。这种基于模型证据的比较通称贝叶斯模型比较,可推广至任意数量的模型。近期发展的相关技术——贝叶斯模型约简(Bayesian model reduction)——使得在毫秒级时间内快速评估不同参数“开关”组合下的模型对数证据成为可能,而无需逐一拟合各模型(Friston, Parr 等, 2019)。
EEG/MEG/OPM/ECoG 数据相较于 fMRI 的一个重要优势在于:能够精细解析单次试验内实验效应出现的时间进程。本文将演示如何应用 vRSA 来评估特定实验效应在刺激呈现后特定时间点上被表达的概率。我们的策略是将刺激周边时间(peri-stimulus time)视为一个实验因子,并引入编码“时间 × 实验条件交互作用”的协方差成分(即假设矩阵)——形式上即每个实验条件在每一时间点上的效应。继而,通过贝叶斯模型比较,检验开启或关闭特定协方差成分如何改变整体的对数证据值。
我们首先回顾 vRSA 所依据的理论基础,继而通过模拟数据验证其表面效度(face validity),最后以一个公开可用的 EEG 数据集为例,提供一个具说明性的实际应用。本文配套的软件实现兼容 SPM 软件包。
理论
生成模型
在 vRSA 中,我们所处理的数据既可以是单变量的,也可以是多变量的。而多变量一般线性模型(multivariate General Linear Model, GLM)可同时容纳这两种情形。
![]()
其中,Y ∈ ℝᴹˣᴾ 表示包含 M 个测量值和 P 个测量通道的数据;设计矩阵 Z ∈ ℝᴹˣⱽ 的各列编码了 V 个解释变量,对应的回归参数为 U ∈ ℝⱽˣᴾ。干扰效应——即那些不感兴趣的效应——由设计矩阵 X ∈ ℝᴹˣᵂ 编码,其对应的参数为 B ∈ ℝᵂˣᴾ。
唯一关于分布的假设是针对误差矩阵 E ∈ ℝᴹˣᴾ,该矩阵在每个通道内的测量值上服从独立同分布(I.I.D.),但通道之间可能存在协方差,由空间协方差矩阵 S ∈ ℝᴾˣᴾ 定义。
![]()
空间协方差矩阵通过与维度为 M 的单位矩阵取 Kronecker 积 ⊗,在测量值上进行复制。空间协方差矩阵定义的详细内容见附录 A。
二阶效应
在 vRSA 中,我们并不直接关注参数 U。相反,我们旨在解释“条件 × 条件”协方差矩阵 G = UUᵀ,该矩阵编码了不同实验条件下测量值之间的相似性。GLM 可以用二阶矩阵的形式表达:
![]()
其中,Σᵧ = YYᵀ 是数据的协方差矩阵,Σʙ = BBᵀ 是混杂因素(confounds)的协方差矩阵,Σₑ = EEᵀ 是观测噪声的协方差矩阵。以这种方式书写模型,强调了数据协方差可被分解为与感兴趣效应、混杂因素及噪声相关的项的线性组合。更具体而言,在下文中,我们将使用经混杂因素校正后的参数 Û 的协方差及其协方差 Ĝ,这些量是通过附录 B 中提供的恒等式获得的。
协方差成分建模
在 vRSA 中,经混杂因素校正后的“条件 × 条件”协方差矩阵 Ĝ 被分解为若干协方差成分 Q₁, ..., Qₙ 的线性混合,这些成分也被称为假设矩阵:
![]()
每个 n 个协方差成分均可对总协方差做出贡献,其贡献程度由超参数 ν₁ ... νₙ 加权,这些超参数从数据中估计得出。协方差成分可对应于各个实验条件、实验因子,或来自其他脑区或物种的响应。除了与实验相关的成分外,还包含一个用于建模混杂参数 B 协方差的成分。该成分被定义为 Q₀ = X⁺(X⁺)ᵀ,其中 X⁺ 是 X 的伪逆。
协方差成分在功能上等价于标准 GLM 分析中的对比(contrasts)。因此,我们可以从对比向量 cᵢ 转换到协方差成分 Qᵢ,方法如下:
![]()
其中,SVD 是奇异值分解,它返回矩阵 Qᵢ 的左奇异向量。
我们要求超参数 ν₁ ... νₙ 为正值,以确保 Ĝ 是一个有效的(即正定的)协方差矩阵。为了保证正定性,我们并不直接估计超参数,而是估计其对数形式的潜在变量 λ = (λ₁ ... λₙ):
![]()
这需要为先验均值 μ 和先验方差 σ² 选择具体数值。我们基于模拟实验来选定这些值,具体方法如附录 C 所述。最优值为 μ = -8,σ² = 4,如图 1(左侧面板)所示。
![]()
由于从 λᵢ 到 νᵢ 的对数变换,这等价于在 νᵢ 上设置一个对数正态先验分布(图 1,右侧面板)。因此,无论估计方案为 λᵢ 选择何种值,对应的超参数 νᵢ 都将为正值。对于与混杂因素相关的成分 Q₀,我们使用方差为 128 的先验(即平坦先验)。
在 vRSA 中,参数 λ 使用 SPM 中的spm_reml_sc函数进行估计。该函数以待解释的协方差矩阵 Ĝ、混杂因素 X、协方差成分 Q₁...ₙ、空间自由度 νₑ 以及先验密度 P(λ) 的定义作为输入。它返回超参数的后验概率密度 P(λ|Y),以及模型质量评分——即对数证据的一个近似值。该近似值被称为自由能(free energy),F ≈ ln P(Y|m)。
自由能——在机器学习中也称为证据下界(Evidence Lower Bound, ELBO)——具有一个有用的性质:它可以被分解为模型的“准确性”减去“复杂性”。因此,在比较模型时,自由能最大的模型将在“尽可能准确”的前提下,使用最少(有效)的参数,从而提供最佳的权衡。
方法
数据与实验设计
为了演示该方法,我们使用了从 http://purl.stanford.edu/bq914sc3730 下载的公开 EEG 数据。共有十名被试观看了 72 张图片,每张图片重复呈现 72 次(图 2)。每张图片的内容要么是生物体(animate),要么是非生物体(inanimate)。在生物体图片中,存在一个 2×2 的因子设计:身体部位(面部或身体)和物种(人类或动物)。在非生物体图片中,则只有一个实验因子:它们要么是自然物,要么是人造物。
![]()
每张图片呈现 500 毫秒,随后是 750 毫秒的灰色屏幕。被试被要求全程注视屏幕,同时使用 128 通道 EEG 系统采集数据。这些数据和实验设计使我们能够在群体水平上通过变分 RSA 来检验多种实验效应:例如,当在刺激后时间上累积证据时,是否存在面部相关的实验效应?或者,是否存在某个特定时间点,在该点上实验效应得以表达(此时在刺激间累积证据)?我们将在下文看到,这些检验基于群体水平上的贝叶斯模型比较,并利用了贝叶斯模型约简和参数化经验贝叶斯方法。
预处理公开提供的 EEG 数据已处于预处理后的状态:经过滤波处理、降采样至 62.5 Hz,并以刺激起始点为时间锁定点,划分为包含 32 个采样点(即刺激后 496 毫秒)的试验片段。有关预处理的完整细节,请参见(Kaneshiro 等,2015)。我们进一步使用 SPM 软件包进行了两个额外的预处理步骤:首先,对每张刺激图像的多次呈现所对应的时序数据进行平均;其次,为提升信噪比,依据 SPM 中 M/EEG 数据分析的标准流程,通过主成分分析(PCA)将原始 124 个通道的数据降维至 7 个通道(即 7 个主成分“模态”)。
设计矩阵设定每位被试的数据共包含 = 2304(= 32 × 72)个观测点与 = 7 个通道。EEG 数据矩阵∈ ℝᴹˣᴾ 的行按如下方式排列:前 32 行对应第一张刺激图像(已对重复呈现取平均)的第 1 至 32 个时间点测量值,随后的 32 行对应第二张刺激图像的 1 至 32 个时间点,依此类推,直至全部 72 张图像;列则对应 PCA 后得到的 7 个主成分模态。图 3A 展示了每张刺激对应的第一主成分模态。
![]()
![]()
我们定义了一个试验内设计矩阵ₜ∈ ℝ³²ˣ¹⁵,用于建模单次试验中神经响应的时间进程。该矩阵采用有限脉冲响应(Finite Impulse Response, FIR)基函数集构建:其 32 行对应 EEG 的 32 个时间点测量值,15 列对应 15 个时间窗(bin),每个时间窗宽 0.032 秒(见图 3B)。每试验的前两个观测点(0–0.032 秒)未被建模,隐式地作为模型的基线;剩余的时间点划分为 15 个时间窗,每个时间窗覆盖连续的两个 EEG 采样点。
本文配套的软件程序会自动处理将试验内设计矩阵(图 3b)在 K = 72 个刺激条件下进行复制的过程,从而形成整体设计矩阵 Z = Iₖ ⊗ Zₜ(图 4)。
![]()
在本例中,混杂因素设计矩阵仅包含信号的整体均值,即一个全为 1 的列向量:X =1ₘ。
对比与协方差成分
在指定了我们的解释变量——即刺激和时间特异性响应——之后,我们现在可以基于最终设计矩阵的列来定义对比形式的假设。我们首先指定了五个长度均为 72 的对比向量——对应于 72 个条件(刺激图像)——用以表达实验设计:(1) 生物体-非生物体,(2) 物种:人类-动物,(3) 身体部位:身体-面部,(4) 自然物-人造物,(5) 物种与身体部位的交互作用。这些对比向量使用 1 和 -1 进行设定,随后进行了均值中心化处理(图 5)。软件程序接着将这些对比向量在每个试验的 15 个时间窗(基函数)上进行复制,从而在每个时间窗内生成五个对比。每个对比根据公式 10 被转换为一个协方差成分(即假设矩阵),并额外加入一个协方差成分用于建模噪声。最终共有 76(= 5 × 15 + 1)个成分进入模型估计方案。
![]()
vRSA 模型拟合
分析首先通过一般线性模型(GLM)的标准公式来估计回归参数:
![]()
实验效应的证据检验
为确保模型确实捕获了与实验相关的效应,我们检验了完整模型是否比仅包含噪声成分的简化模型能更好地解释数据。具体而言,我们为每位被试构建了一个替代模型:将除噪声成分外的所有协方差成分对应的超参数固定为零,从而有效“关闭”这些成分。更具体地说,对于第 i 个待关闭的参数,将其先验概率密度设为 P(λᵢ) = N(μᵢ, 0),即将该参数固定为其先验均值。通过贝叶斯模型约简(Bayesian model reduction,由 SPM 中的函数spm_log_evidence_reduce实现),可解析计算因修改先验而导致的自由能变化。自由能之差(即对数贝叶斯因子)即可量化支持包含实验效应模型的证据强度。
基于 PEB 的群体分析
为识别跨被试的显著效应,我们采用了 SPM 中标准的参数化经验贝叶斯(Parametric Empirical Bayes, PEB)工具,进行贝叶斯分层线性回归(Friston 等, 2016, p.20; Kass & Steffey, 1989; Zeidman 等, 2019)。在 PEB 框架下,我们构建了一个分层模型:个体水平采用 vRSA 模型,群体水平则采用一个一般线性模型(GLM)。将所有被试的超参数汇集为一个向量 ,PEB 模型定义如下:
![]()
该方程的第二行表明,来自被试 s 的“条件 × 条件”协方差矩阵 Ĝ⁽ˢ⁾ 是根据前文介绍的协方差成分模型进行建模的。第一行则说明,包含所有被试超参数的向量 λᵍ = (λ⁽¹⁾, λ⁽²⁾, ...) 由一个具有组间设计矩阵W的 GLM 进行建模。相应的回归参数θ编码了各超参数的群体平均值,以及任何组间协变量的影响(本例中未包含协变量)。误差矩阵 E⁽²⁾ 编码了未解释的组间变异性(即随机效应)。
在此,我们选取了 75 个超参数,用于量化每个对比在每个时间点上的效应,并将其纳入群体水平分析。因此,群体水平的设计矩阵W包含 75 列——每一列编码一个超参数的群体平均值。将此 PEB 模型拟合到数据后,返回了关于群体水平参数θ的后验概率密度,以及完整分层模型质量评分的自由能近似值(即对数证据的近似值)。
随后,我们进行了一系列贝叶斯模型比较:将完整 PEB 模型的对数证据与若干简化模型进行对比——这些简化模型中,特定组合的参数被“关闭”(即固定为其先验期望值)。
首先,我们希望在群体水平识别出具有显著贡献的实验效应,即剔除那些未提升模型证据的参数。为此,我们使用 SPM 软件中的标准工具执行自动贝叶斯模型比较,该工具可高效评估大量简化模型(其中各类参数组合被逐一关闭)。这一过程通过贝叶斯模型约简(Bayesian model reduction)得以快速自动完成。随后,我们对模型搜索中表现最优的一组模型所对应的参数进行贝叶斯模型平均(Bayesian model averaging),并报告这些平均后的参数估计结果。
其次,我们量化了每个实验对比(对刺激后时间进行整合)的证据强度。我们再次从完整 PEB 模型出发,依次关闭某一特定实验条件所对应的所有参数,并对五个实验条件逐一重复此操作。例如,我们关闭编码“面部–身体”效应的 15 个参数(每个刺激后时间窗对应一个参数),记录自由能的变化;再依次对剩余四个实验条件重复该分析。
类似地,我们量化了每个时间窗(共 15 个,对所有对比效应进行整合)表现出实验效应的证据。仍从完整 PEB 模型出发,依次关闭某一时间窗对应的所有成分:例如,关闭第 1 个时间窗中五个对比所对应的全部 5 个成分,记录自由能变化;再依次对剩余 14 个时间窗重复该流程。
我们以两种方式报告贝叶斯模型比较的结果:
- 对数贝叶斯因子(log Bayes factor)即某模型与参考模型之间对数证据(以自由能近似)的差值。对数贝叶斯因子为 3 时,对应于 exp(3) ≈ 20 倍的证据支持,通常被视为“强证据”(Kass & Raftery, 1995)。
- 此外,在所有模型先验概率相等的假设下,我们还将对数贝叶斯因子转换为各模型在给定数据下的后验概率,其计算方式即为对各模型对数证据应用softmax 函数
下文中,我们首先将上述流程应用于模拟数据,以验证模型的可识别性(identifiability)与表面效度(face validity);继而将其应用于真实实验数据。
结果
模拟结果
在将上述流程应用于真实实验数据之前,我们首先进行了模拟研究,以验证模型是否能成功复现已知效应(即验证其表面效度)。我们为 10 名虚拟被试生成了多变量数据,所用设计矩阵与后续真实数据分析中的一致。在模拟中,我们在数据中明确植入了两类实验效应:
- 物种 × 身体部位(Species × Body-part)的二阶交互作用,出现在第 4 个时间窗;
- 生物体–非生物体(Animate–Inanimate)的主效应,出现在第 6 个时间窗。
因此,实验效应与刺激后时间存在交互作用。效应量大小与观测噪声幅度均参考自后续真实数据分析所得的后验估计值。
我们拟合了一个包含 76 个协方差成分的 vRSA 模型:其中 75 个成分对应各实验对比在各时间窗上的效应(5 个对比 × 15 个时间窗),另 1 个成分用于建模观测噪声。我们预期模型能对两个真实存在的效应成分给出正向证据,而对其他所有成分给出负向证据(即支持零效应的证据)。
每位虚拟被试的完整模型相对于仅含噪声成分的简化模型,其自由能增量在 749 至 757 之间。将其转换为后验概率后,可得每位被试支持完整模型的概率均趋近于 1。由此可确信:模型能够有效检出数据中的实验效应。
接下来,我们考察估计所得的模型参数,并用其进行假设检验。
利用参数化经验贝叶斯(PEB)框架,我们估算了支配各协方差成分贡献大小的超参数向量λ的群体平均值。图 6a 展示了经自动模型剪枝(pruning)后的群体平均参数估计结果——该过程自动剔除那些未提升模型证据的参数。结果表明,绝大多数参数被“关闭”(即固定为其先验期望值),仅存两个参数保留正值,恰好对应于模拟中植入的两个真实效应。图 6b 显示这些参数的指数形式,即估计所得的超参数ν。
![]()
![]()
回顾我们的两个核心问题:
- 哪些实验条件在神经数据中得以表征?
- 它们在何时出现?
为验证 vRSA 能否准确回答这些问题(即:是否能为每种可能结果赋予合理概率),我们基于 PEB 模型进行了贝叶斯模型比较。
图 6c 展示了支持各协方差成分(即各对比 × 各时间点组合)被纳入模型(而非固定为零)的证据强度,以对数贝叶斯因子表示。每个值均为:完整模型(含全部超参数)与剔除指定参数之简化模型之间的对数证据之差;负值表示支持零假设的证据。
结果与预期一致:
- 对比 1(物种 vs. 身体部位)和对比 5(生物体 vs. 非生物体)在第 4 和第 6 个时间窗(0.12–0.14 s 与 0.19–0.21 s)被显著检出,其对数证据分别为 12.54 与 20.45,证实了 vRSA 的高敏感性
- 对比 2–4 在所有时间窗上的对数证据介于 –0.11 至 –0.97 之间,表明这些效应不存在,验证了 vRSA 的高特异性
图 6d 给出各时间窗(整合全部对比)的对数证据(蓝线)与后验概率(灰柱)。结果准确识别出第 4 与第 6 时间窗存在效应(后验概率达上限),其余时间窗对数证据介于 –2.22 至 –4.11,支持“无效应”假设。
图 6e 显示各实验对比(整合全部时间点)的对数证据(左)与后验概率(右):
- 对比 1 与 5 获得强支持(对数证据 = 11.02 与 5.01);
- 对比 2–4 的对数证据介于 –9.44 至 –9.98,构成对其存在的强反证
综上,当 vRSA 应用于模拟被试群体数据时,其表现符合预期,能准确识别实验效应的“存在”与“缺失”。接下来,我们将相同的分析流程应用于真实 EEG 数据。
被试内对数证据
对于每位被试的真实数据,我们拟合了一个 vRSA 模型,包含与前述模拟相同的 96 个协方差成分(注:此处应为 76 个,原文或为笔误;前文明确为 5 对比 × 15 时间窗 + 1 噪声 = 76;若 96 则可能包含其他混杂成分,但上下文未说明;译文暂依原文数字,但需注意此潜在矛盾)。每位被试的完整模型相对于仅含噪声成分的简化模型,其自由能增量在全部被试中范围为 1.46 至 23.41。将其转换为后验概率后,每位被试支持完整模型的概率均趋近于 1。因此,我们有充分信心认为模型确实捕获了数据中的实验效应。随后,我们进一步考察估计所得的模型参数,并用于假设检验。
群体分析:参数估计
我们采用 PEB 进行群体水平分析。首先执行一次自动搜索,剔除所有未提升整体(群体水平)自由能的参数。所得保留参数如图 7a 所示:大多数参数明显偏离其先验期望值(约 –4)。图 7b 通过对其期望值取指数后更清晰地呈现了这些参数。其中三个参数尤为显著:
![]()
- 编码生物体 vs. 非生物体效应在 FIR 第 5 个时间窗(0.16–0.18 秒)的参数;
- 编码面部 vs. 身体部位效应在 FIR 第 5 个时间窗(0.16–0.18 秒)的参数;
- 编码物种(人类 vs. 动物)与身体部位(面部 vs. 身体)交互作用在 FIR 第 6 个时间窗(0.19–0.21 秒)的参数。
该交互作用意味着:对面部与身体部位的神经响应差异,取决于所呈现的对象是人类还是动物。
贝叶斯模型比较
本分析旨在正式回答两个问题:
- 哪些实验条件在数据中得以表征?
- 它们在何时出现?
为此,我们基于 PEB 模型进行了贝叶斯模型比较,以量化每一可能结果的后验概率。
图 7c 展示了支持各实验效应(相对于其被约束至零)的证据强度。纵轴表示包含所有相关参数的模型与剔除该效应对应参数的模型之间的自由能差值;颜色标识对应的实验条件。结果与参数估计一致:
- 生物体 vs. 非生物体效应在 FIR 第 5 时间窗(0.16–0.18 秒)获得强证据支持;
- 面部 vs. 身体部位效应在 FIR 第 5 时间窗(0.16–0.18 秒)获得强证据支持;
- 物种 × 身体部位交互作用在 FIR 第 6 时间窗(0.19–0.21 秒)获得强证据支持。
图 7d 进一步显示,从第 5 至第 8 时间窗(0.16–0.27 秒),跨所有对比均存在强证据。将其转换为后验概率后(图 7d,灰色柱状),第 5 至第 8 时间窗的后验概率均趋近于 1。
最后,图 7e(左)显示:三个关键对比(生物体 vs. 非生物体、面部 vs. 身体部位、物种 × 身体部位交互作用)均获得强证据支持,其后验概率均为 1。
总结
我们应用 vRSA 成功识别出数据中表达的实验效应及其出现的时间窗口。结论如下:
- 最强的实验效应为物种 × 身体部位的交互作用(后验概率 = 1);
- 实验效应最显著的时间窗口为第 6 时间窗(0.19–0.21 秒,后验概率 = 1)。
本文提出了面向神经响应电磁记录(如 EEG、MEG 等)的变分表征相似性分析(variational Representational Similarity Analysis, vRSA)。该方法将估计所得响应的“条件 × 条件”协方差矩阵分解为若干协方差成分的加权混合,其中各协方差成分分别编码假设效应与观测噪声的贡献。借助贝叶斯模型比较,可在单被试或群体水平直接开展假设检验。该方法适用于单变量或多变量数据,且代码无需修改。本文配套提供了相关软件及示例脚本,以复现上述分析。
相较于其他方法(包括某些标准 RSA 分析、线性分类器及多变量模式分析 MVPA),vRSA 具有若干显著优势:
- 完整建模实验设计:vRSA 可完整纳入并区分实验设计中的主效应与交互作用,并将其与观测噪声明确分离。而标准 RSA 或仅针对单一实验条件建模的分类器无法实现此目标;
- 提供模型证据以支持灵活比较:作为变分贝叶斯方法,vRSA 可估计模型的对数证据(log model evidence),这是比较任意数量模型(协方差成分组合不同)的关键依据。在所比较的模型中,对数证据(或自由能)最高的模型在拟合优度(accuracy)与模型复杂度(complexity)之间取得了最优权衡;
- 统计检验的理论最优性:根据 Neyman–Pearson 引理,本文所采用的检验方法在统计上是最优的,其检验力(statistical power)应不低于(甚至高于)基于其他统计量(如分类准确率)的假设检验;
- 计算高效且可复现:借助变分贝叶斯推断与贝叶斯模型约简(Bayesian model reduction),本方法通过数值近似与解析解替代传统采样过程,使得模型拟合与比较可在普通台式机上极速完成(毫秒级),且结果严格可复现;
- 支持群体水平扩展:参数化经验贝叶斯(PEB)框架使得 RSA 分析可自然从个体推广至群体层面,从而同时探究被试间的共性与个体差异。
正如 vRSA 在首次提出时所指出的(Friston, Diedrichsen 等, 2019),该方法与另一种称作模式成分建模(Pattern Component Modelling, PCM)的方法(Diedrichsen 等, 2018)存在紧密关联。两者共享相同的生成模型——即以协方差成分形式表述的多变量线性模型。核心区别在于:vRSA 采用变分贝叶斯推断,从而避免了交叉验证的使用。尽管如此,原则上 PCM 也可用于处理本文所述的 M/EEG 刺激周边时间分析,且预期两者将给出相似结果。
vRSA 的主要局限性——也是将一般线性模型(GLM)应用于神经影像数据的普遍局限性——在于:它提供的是对数据的描述性模型而非机制性模型。它可用于检验哪些实验效应存在或缺失,以及(如本文所示)这些效应出现的具体时间,但 vRSA 并未揭示数据背后的生理生成机制。相比之下,具备神经生物学合理性的模型(如神经质量模型,neural mass models)则构成了可行的替代方案,其参数(如突触时间常数)具有明确的生物学解释。SPM 中的动态因果建模(Dynamic Causal Modelling, DCM)框架提供了将神经质量模型拟合至 EEG/MEG/LFP 数据所需的工具。例如,可借此探究数据中观察到的对特定刺激的响应差异(见图 3A)是否可由相关脑区(如面孔选择性的梭状回)之间有效连接(effective connectivity)的差异所解释。因此,vRSA 可在初步识别实验效应“何时、何地”表达方面发挥重要作用,为后续开展动态因果建模提供高效引导——其统计效率优于前述其他多变量分析方法。
对 vRSA(乃至更一般的 RSA)可能提出的另一项批评是:对数据协方差建模引入了不必要复杂的分析流程。任何编码实验条件相似性或差异性的假设矩阵均可通过式 (11) 转换为对比向量或对比矩阵,并直接用于检验多变量 GLM 参数的线性对比(式 (1))。对于多变量数据的经典频率学派分析,标准方法为多元方差分析(MANOVA),通常结合典型相关分析(Canonical Correlation Analysis, CCA)或典型变量分析(Canonical Variates Analysis, CVA),以识别在数据通道与设计矩阵上最能解释数据的权重对。在贝叶斯框架下,多种分析软件包均提供了单变量线性回归模型;SPM 中可通过spm_peb函数实现。若需用单变量 GLM 分析多变量数据,亦可将数据向量化(即通道拼接),并定义适当的协方差成分,以允许各通道具有不同的观测噪声水平。
尽管如此,RSA 在 fMRI 领域仍广受欢迎(Haynes, 2015;Kriegeskorte & Kievit, 2013;Poldrack 等, 2009)。部分原因在于:以“测量值或假设之间的相似性/差异性”进行讨论具有直观吸引力;另一部分原因在于,它能便捷地整合来自不同来源(如不同物种、脑区或成像模态)的相似性/差异性矩阵(Cichy 等, 2014;Kriegeskorte 等, 2008)。本文所提出的方法支持上述全部应用场景,并额外享有贝叶斯推断所带来的诸多优势。
我们所呈现的经验性分析以典型 RSA 数据为例,简明展示了该方法的应用流程。但仍有进一步优化的空间,尤其在设计矩阵Z的设定方面。本文采用了 FIR 模型,导致每个时间窗对应设计矩阵中的一列(此处共 15 列)。若减少设计矩阵的列数,可提升模型自由度,从而提高统计效率。若分析目标是检验关于神经表征时程动态的理论特异性预测,则可使设计矩阵直接反映这些假设的时间进程。另一种策略是用少量基函数替代 FIR 模型——这些基函数之和可拟合出事件相关电位(ERP)的波形。这类似于 fMRI 的常规做法:采用一个基函数编码标准血流动力学响应函数(HRF),再辅以一至两个基函数(称为时间导数与色散导数)来调整所建模血流响应的峰值位置与宽度。
有意应用本文方法的读者可从上述示例分析入手。配套脚本已随文提供,可用于下载数据并复现全部分析步骤。
更广泛而言,vRSA 展示了贝叶斯推断如何统一认知神经科学中的表征性(representational)与基于模型的(model-based)取向。通过将表征相似性问题重构为协方差成分估计问题,vRSA 为表征模型的证据强度提供了统计最优的量化方式。除 EEG 与 MEG 外,该框架还可推广至跨物种、跨模态或纵向研究——在这些领域,“表征何时、如何涌现”是核心科学问题。在这个意义上,vRSA 不仅是一种高效的分析工具,更是迈向方法论整合与解释层级贯通的神经表征研究的坚实一步。
原文链接:https://arxiv.org/pdf/2511.01784
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.