A Dual-Model Architecture for Cognition
认知双模型架构
https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
![]()
![]()
摘要
本文提出了 Ze,一个基于两种不同的环境生成模型并行运作的新型认知架构理论框架:因果(前向)模型 M_A 和反事实(逆向)模型 M_B。Ze 的核心动力学源于两个独立的变分自由能 F_A 和 F_B 的最小化,以及两者之间冲突的管理,即 ΔF = |F_A - F_B|。这一冲突调节着两种相之间的转换:干涉态(在此状态下模型输出被建设性地融合)和局域态(通过离散投影解决冲突)。我们在形式上建立了 Ze 与量子测量(特别是双缝实验)之间的深层结构同构性,而无需在底层引入量子物理。Ze 被构建为一个完整的、可证伪的理论,它将认知中的“坍缩”重新解释为由优化驱动的相变,生成新的可实验验证的预测,并将感知、行动与表征学习整合到一个统一的架构中。本预印本提供了该框架的完整数学阐述。
关键词:认知架构;变分推断;模型冲突;主动推断;量子认知;相变
1. 引言
寻求一种形式化的、基于计算理论的认知与意识理论,仍然是神经科学与人工智能领域的核心挑战。主流范式,如预测处理与自由能原理,认为大脑的功能是一个分层的生成模型,以最小化惊讶或变分自由能(Friston, 2010)。尽管这些框架功能强大,但它们通常描述的是单一的、统一的感知模型。Ze形式体系提出了一个根本性的扩展:智能系统需要维护同一个环境的两个不同的、非对称的生成模型。
这种二元性的动机,源于不仅需要解释被动感知,还需要解释反事实推理、叙事理解以及信念的突然重组。我们引入一个因果(前向)模型 M_A,它基于时间动态预测感官数据;以及一个反事实(逆向)模型 M_B,它推断解释、目标和潜在原因。它们的独立运作以及随后的相互作用构成了Ze架构的核心。
该理论严格建立在已确立的变分力学基础上,不对大脑的量子过程做任何假设。然而,它揭示了一个与量子测量之间的深刻形式类比。这一类比不仅仅是隐喻性的,而且表明,支配不确定性解决方式的数学原理可能在不同的物理和计算基底中是普遍的。Ze为经典的认知现象——知觉双稳态、顿悟问题解决以及睡眠-觉醒周期——提供了新的视角,并产生了具体的、可检验的预测,从而将其与标准模型区分开来。
2. 数学形式体系
2.1. 核心变量与基本结构
考虑一个接收观察流 o_{1:T} 的智能体。Ze假设存在两个独立的生成模型:
![]()
2.2. 两个变分自由能
每个模型最小化其自身的变分自由能泛函,这是惊讶的上界(Friston, 2010):
![]()
2.3. 模型冲突:核心量
Ze 中的核心动态变量是模型冲突或解释分歧:
![]()
2.4. 干涉作为后验兼容性
干涉被形式化为模型后验的建设性融合。我们使用 Jensen-Shannon 散度(JSD)来衡量它们的兼容性,这是一种对称且有界的度量:
![]()
![]()
![]()
![]()
![]()
3. 与量子力学的形式对应
Ze的数学结构展现出与量子双缝实验严格同构的关系。
![]()
![]()
这种对应关系表明,叠加、干涉、测量和擦除等原理并非量子物理学所独有,而是描述了那些在竞争性内部模型之间管理不确定性的系统的一般动力学(Busemeyer & Bruza, 2012)。在Ze中,“坍缩”不是一个假设,而是一种涌现的、由优化驱动的相变。
4. 实验预测与可证伪性
Ze是一个严格的理论,而非隐喻,因为它建立在标准变分演算之上,不提出任何量子物理层面的主张,提出了一个新的架构性假设,并产生了可证伪的预测。
4.1. 关键可检验预测
![]()
![]()
![]()
5. 讨论与结论
Ze 形式体系将感知、行动和学习整合到一个统一的、数学精确的架构中。其核心创新在于生成模型的强制性二元性,这些模型之间的冲突与和解动力学支配着认知。
5.1. 对认知科学的启示
Ze 为知觉双稳态(自发的局域化)、顿悟(突然的冲突解决)以及睡眠的功能(周期性的擦除与整合)等现象提供了有原则的解释。它将认知构建为因果性的“是什么”模型与反事实性的“可能是什么”模型之间的持续协商。
5.2. 根本性转变
该理论重新解释了认知“坍缩”的难题——明确的感知如何从模糊的数据中涌现——将其视为一种基于优化的软性相变。这为这一过程去神秘化,并使其与更广泛的自组织物理原则对齐(Tschacher & Haken,2007)。
5.3. 未来方向
未来的工作必须聚焦于 Ze 智能体的形式化计算实现,以及设计第 2 表中概述的关键实验。此外,与量子力学的同构性 invites 跨学科对话,表明量子信息理论可能为建模高层认知过程提供强大的工具,而无需假设一个量子大脑。
结论
总之,Ze 被提出作为一个完整的、可证伪的框架,通过在双模型动力学的治理下统一变分推断、主动学习和结构性模型修正,推进了我们对智能系统的形式化理解。
图 1. Ze 架构示意图。一个框图,展示了两个生成模型 M_A 和 M_B,它们接收观察 o_t 并维护后验分布 q_A 和 q_B。该图说明了 F_A、F_B、ΔF 的计算,以及冲突信号的反馈如何调节干涉/局域化开关和策略选择(π_A, π_B)。擦除算子 ℰ 和路径固定参数 λ 也被显示为调节性输入。
图 2. 动力学状态与相变。一个分岔图,绘制了系统稳定性度量随模型冲突 ΔF 的变化。图中显示,当 ΔF < θ 时存在一个稳定的“干涉”吸引子,该吸引子在阈值 θ 处失去稳定性。当 ΔF > θ 时,出现两个稳定的“局域化”吸引子,对应于偏向 M_A 或 M_B 的两种解决方式。箭头指示了在局域化事件期间系统的轨迹。
原文链接:https://www.preprints.org/frontend/manuscript/5535e01343b831a92c36d3e7a74398ff/download_pub
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.