心识周刊 | Deepseek 发布 DeepSeek-V3.2，性能挑战前沿闭源模型；终身学习智能体的多模态记忆框架……|宇宙|推理|大模型|deepseek

分享至

本周主要内容：DeepSeek-V3.2、木偶式多智能体协作范式、MemVerse、代码 LLM 完整生命周期综述、认知活动的大脑网络分布、主动推理与意识觉知、体感信号与身体自我意识、大脑与 AI 跨领域比较

AGI 每周速递

[1] DeepSeek-V3.2：拓展开放式大型语言模型的边界

标题：DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

链接：https://arxiv.org/abs/2512.02556

单位：DeepSeek-AI

摘要：

本研究推出 DeepSeek-V3.2 模型，该模型在实现卓越推理能力与智能体性能的同时保持了极高的计算效率。DeepSeek-V3.2 的核心技术突破包括：（1）DeepSeek 稀疏注意力机制（DSA）：该高效注意力机制在长上下文场景中显著降低计算复杂度，同时保持模型性能；（2）可扩展强化学习框架：通过实施稳健的强化学习协议并扩展后训练计算规模，DeepSeek-V3.2 达到与 GPT-5 相当的性能水平。值得注意的是，其高计算变体 DeepSeek-V3.2-Speciale 已超越 GPT-5，并在推理能力上与 Gemini-3.0-Pro 持平，于 2025 年国际数学奥林匹克竞赛 (IMO) 与国际信息学奥林匹克竞赛 (IOI) 中均获得金牌表现；（3）大规模智能体任务合成流程：为将推理能力融入工具使用场景，研究团队开发了创新的合成流程，系统化地生成大规模训练数据。该方法支持可扩展的智能体后训练，显著提升了模型在复杂交互环境中的泛化能力与指令遵循鲁棒性。

[2] 「木偶式」的多智能体 LLM 协作范式

标题：Multi-Agent Collaboration via Evolving Orchestration

链接：https://openreview.net/pdf/9727f658d788c52f49f12ae4b230baf4cf0d4007.pdf

作者：Yufan Dang, Chen Qian, Xueheng Luo, Jingru Fan, Zihao Xie, Ruijie Shi, Weize Chen, Cheng Yang, Xiaoyin Che, Ye Tian, Xuantang Xiong, Lei Han, Zhiyuan Liu, Maosong Sun

单位：清华大学、上海交通大学、北京邮电大学、西门子、腾讯 Robotics X

摘要：

大语言模型在各类下游任务中已取得显著成果，但其单一化架构限制了解决复杂问题时的可扩展性与效率。尽管近期研究开始探索大语言模型间的多智能体协作，但现有方法大多依赖静态组织结构，难以适应任务复杂性与智能体数量增长，导致协调开销与效率低下。为此，研究者提出一种基于大语言模型的提线木偶式多智能体协作范式：通过中央调度器（提线者）根据动态演化的任务状态，实时指引各智能体（木偶）的协作流程。该调度器通过强化学习训练，能够自适应地编排智能体执行顺序与优先级，从而实现灵活可演化的集体推理。在封闭与开放域场景中的实验表明，该方法以更低的计算成本实现了更优的性能。进一步分析揭示，性能提升的关键在于调度器演化过程中持续涌现出更紧凑的循环推理结构。相关代码已开源：https://github.com/OpenBMB/ChatDev/tree/puppeteer。

[3] MemVerse：面向终身学习智能体的多模态记忆

标题：MemVerse: Multimodal Memory for Lifelong Learning Agents

链接：https://www.arxiv.org/abs/2512.03627

作者：Junming Liu, Yifei Sun, Weihua Cheng, Haodong Lei, Yirong Chen, Licheng Wen, Xuemeng Yang, Daocheng Fu, Pinlong Cai, Nianchen Deng, Yi Yu, Shuyue Hu, Botian Shi, Ding Wang

单位：上海 AI 实验室

摘要：

尽管大规模语言与视觉模型发展迅速，人工智能体仍面临一项根本局限：无法实现有效记忆。缺乏可靠的记忆机制会导致智能体灾难性遗忘过往经验，难以进行长程推理，也无法在多模态或交互环境中保持连贯运作。研究者提出 MemVerse——一种与模型无关、即插即用的记忆框架，通过桥接快速参数化回忆与基于层级检索的记忆系统，实现可扩展的自适应多模态智能。MemVerse 既保留近期上下文的短期记忆，又将原始多模态经验转化为以层级知识图谱组织的结构化长期记忆。这一设计支持持续的知识整合、自适应遗忘与有限的记忆增长。为满足实时处理需求，MemVerse 引入周期性蒸馏机制，将长期记忆中的关键知识压缩至参数化模型中，在保持可解释性的同时实现快速、可微调的回忆能力。大量实验表明，MemVerse 显著提升了多模态推理与持续学习效率，使智能体能够在长期交互中持续记忆、自适应调整并进行连贯推理。

[4] 从代码基础模型到智能体和应用程序：代码智能的综合调查和实用指南

标题：From Code Foundation Models to Agents and Applications: A Comprehensive Survey and Practical Guide to Code Intelligence

链接：https://arxiv.org/abs/2511.18538

作者：Jian Yang, Xianglong Liu, Weifeng Lv, Ken Deng, Shawn Guo, Lin Jing, Yizhi Li, Shark Liu, Xianzhen Luo, Yuyu Luo, Changzai Pan, Ensheng Shi, Yingshui Tan, Renshuai Tao, Jiajun Wu, Xianjie Wu, Zhenhe Wu, Daoguang Zan, Chenchen Zhang, Wei Zhang, He Zhu, Terry Yue Zhuo, Kerui Cao, Xianfu Cheng, Jun Dong, Shengjie Fang, Zhiwei Fei, Xiangyuan Guan, Qipeng Guo, Zhiguang Han, Joseph James, Tianqi Luo, Renyuan Li, Yuhang Li, Yiming Liang, Congnan Liu, Jiaheng Liu, Qian Liu, Ruitong Liu, Tyler Loakman, Xiangxin Meng, Chuang Peng, Tianhao Peng, Jiajun Shi, Mingjie Tang, Boyang Wang, Haowen Wang, Yunli Wang, Fanglin Xu, Zihan Xu, Fei Yuan, Ge Zhang, Jiayi Zhang, Xinhao Zhang, Wangchunshu Zhou, Hualei Zhu, King Zhu, Bryan Dai, Aishan Liu, Zhoujun Li, Chenghua Lin, Tianyu Liu, Chao Peng, Kai Shen, Libo Qin, Shuangyong Song, Zizheng Zhan, Jiajun Zhang, Jie Zhang, Zhaoxiang Zhang, Bo Zheng

单位：北京航空航天大学、阿里巴巴、字节跳动等

摘要：

大语言模型通过将自然语言描述直接转化为功能代码，彻底改变了自动化软件开发领域，并借助 GitHub Copilot、Cursor、Trae 及 Claude Code 等工具推动商业应用落地。该领域已从基于规则的系统演进至基于 Transformer 的架构，在 HumanEval 等基准测试上的成功率从个位数提升至95%以上。本研究通过系列分析性与探索性实验，全面梳理并系统总结了代码大语言模型的完整生命周期——从数据构建到后训练阶段，涵盖高级提示范式、代码预训练、监督微调、强化学习及自主编码智能体等环节。研究分析了通用大语言模型（GPT-4、Claude、LLaMA）与代码专用模型（StarCoder、Code LLaMA、DeepSeek-Coder 和 QwenCoder）的能力差异，深入探讨了技术路径、设计决策及相应权衡机制。此外，研究明确指出了学术界（例如基准测试和任务）与产业界（例如软件相关的代码任务）之间的实践鸿沟，并围绕代码正确性、安全性、大型代码库的上下文感知以及与开发工作流的集成等关键问题，将前沿研究方向与实际需求相映射。最后，研究者通过一系列实验对代码预训练、监督微调及强化学习进行了系统性分析，涵盖规模扩展规律、框架选择、超参数敏感性、模型架构与数据集比较等维度。

意识科学每周速递

[1] 参与认知活动的大脑网络分布有多广？

标题：How distributed is the brain-wide network that is recruited for cognition?

链接：https://www.nature.com/articles/s41583-025-00992-5

作者：Matthew C. Rosen & David J. Freedman

单位：芝加哥大学

摘要：

半个世纪以来的单电极神经生理记录建立了大脑功能的「局部化」观点——复杂行为源于不同脑区分别执行计算并形成表征，每个脑区承担专门功能。而基于新型技术获取的啮齿类动物神经元活动与行为特异性高通量数据，催生了一种替代性观点：行为变量的神经编码广泛分布于多个脑区，呈现「一切遍在，同时发生」的特征。在简要介绍这两种范式后，本文评估了何者能更好地描述认知——即实现灵活行为所需内部变量的操纵过程。对啮齿类和灵长类动物神经元活动的测量表明，认知变量在大脑中虽被广泛反映但非均匀分布，其中运动控制相关区域对认知信号的承载程度出人意料。最后，本文探讨了认知信号为何出现在这类区域，以及影响认知所需全脑网络广度的重要因素。

[2] 主动推理在意识觉知中的作用

标题：The role of active inference in conscious awareness

链接：https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0328836

作者：Jonathan Edward Robinson, Andrew W. Corcoran, András Sárközy, Anil K. Seth, Gyula Kovács, Christopher J. Whyte, Karl J. Friston, Cyriel M. A. Pennartz, Giulio Tononi, Jakob Hohwy, TWCF: INTREPID Consortium

单位：莫纳什大学、悉尼大学、萨塞克斯大学等

摘要：

主动推理作为一个基于第一性原理的感知智能体行为建模框架，正逐渐应用于意识研究领域。该框架提出的一个重要假设是：意识内容的变化需要主动推理参与。作为不同意识理论间大规模对抗性合作研究的一部分，主动推理理论将与另外两种不认为主动推理为意识必要条件的理论进行对比。为此，本研究提出一项实验方案，旨在通过严格控制的运动致盲范式变体检验主动推理假说：实验将设置具备更丰富主动推理的「主动」条件与「被动」条件进行对比。在主动条件下，受试者需在目标刺激从意识中消失后将注视点转向其原位置，并报告刺激的再次出现；在被动条件下，受试者保持中央注视，同时刺激阵列将根据主动条件下眼球追踪数据重放的轨迹在视野中移动。研究者计划通过两项实验，对比分析目标在主动与被动条件下的再现情况，以评估主动推理对意识觉知的贡献。最终结果将置于整个对抗性合作研究所有实验的整体框架中进行综合解读。

[3] 通过体感信号塑造身体自我意识

标题：Shaping bodily self-awareness through thermosensory signals

链接：https://www.sciencedirect.com/science/article/pii/S136466132500316X

作者：Gerardo Salvato, Laura Crucianelli

单位：帕维亚大学、伦敦玛丽女王大学

摘要：

皮肤温度与冷热刺激感知能力是人类生存的基础，深刻影响着人类的演化历程与个体早期发展。有趣的是，近期研究也开始揭示这些温度感觉信号在认知功能中的作用。这些信号可能参与构建身体自我意识，特别是身体所有权感——即身体及其部位属于自我的感知体验。本综述系统探讨了温度感觉信号如何从皮肤传递至大脑，以及其对健康人群与临床患者身体所有权感的影响。进一步地，研究提出了可能解释这种交互作用的潜在机制，并指明了其在临床与社会应用中的前景。

[4] 脑-人工智能融合：面向通用计算的预测性和生成性世界模型

标题：The brain-AI convergence: Predictive and generative world models for general-purpose computation

链接：https://arxiv.org/abs/2512.02419

作者：Shogo Ohmae, Keiko Ohmae

单位：北京脑科学与类脑研究所

摘要：

基于注意力的通用人工智能系统最新进展，为探索新皮层与小脑如何通过相对均匀的环路结构实现多样化功能并最终孕育人类智能提供了可能的窗口。本视角论文突破了传统对视知觉处理的局限，采用基于世界模型计算的新兴视角，对大脑与人工智能进行跨领域比较。研究发现，基于注意力的新皮层与非注意机制的小脑具有共同的计算原理：二者均通过预测误差学习，从过往输入预测未来世界事件并构建内部世界模型。这些预测性世界模型被重用于看似不同的功能——感知处理中的理解与运动处理中的生成——从而使大脑能够实现多领域能力与类人适应性智能。值得注意的是，基于注意力的人工智能已独立发展出类似的学习范式与世界模型计算架构。研究表明，尽管生物与人工系统具有相对统一的电路结构，这些共享机制构成了实现包括高级智能在内多样化功能的核心计算基础。这一理论洞见在神经科学与人工智能之间架起桥梁，深化了我们对智能计算本质的理解。

Mindverse Research

心识研究院

心识浩渺连广宇

心识宇宙研究院，致力于在即将到来的元宇宙数字时代，研究和创造真正等价于人类意识水平的数字生命，目前已经综合多种研究进路和方法规划出一条通向AGI和人工意识的道路。在后续内容运营上，我们也会介绍和创造更多有关人工智能、意识科学、元宇宙方面最新的研究成果和原创内容。

欢迎有志者关注和加入我们的研究！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.