![]()
本周主要内容:MemSearcher、上下文工程综述、智能体间的协作鸿沟、多模态交错式链式推理、质性感知控制、意识与单个神经网络、主动推理与最小化意识理论、LLM 类人概念表征
AGI 每周速递
[1] MemSearcher:通过端到端强化学习训练低级逻辑模型进行推理、搜索和管理记忆
标题:MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning
链接:https://www.arxiv.org/abs/2511.02805
作者:Qianhao Yuan, Jie Lou, Zichao Li, Jiawei Chen, Yaojie Lu, Hongyu Lin, Le Sun, Debing Zhang, Xianpei Han
单位:中国科学院、中国科学院大学、小红书
摘要:
传统搜索智能体通常将完整交互历史拼接至 LLM 上下文,虽能保持信息完整性,但会生成冗长嘈杂的上下文,导致计算与内存成本高昂。相反,若仅使用当前轮次信息可避免此开销,却会丢失关键历史信息。这种权衡限制了搜索智能体的可扩展性。为应对该挑战,研究者提出 MemSearcher——一种通过迭代维护精简记忆库并与当前轮次信息结合的智能体工作流。在每轮交互中,MemSearcher 将用户问题与记忆库融合以生成推理轨迹,执行搜索操作,并更新记忆库仅保留任务解决所必需的信息。该设计使多轮交互中的上下文长度保持稳定,在保障准确性的同时提升效率。为优化此工作流,研究团队开发了多上下文 GRPO 端到端强化学习框架,可联合优化 MemSearcher 智能体的推理、搜索策略与记忆管理。该框架在不同上下文环境下采样轨迹组,并将轨迹级优势信号跨对话传递。在与 Search-R1 使用相同训练数据的条件下,MemSearcher 在七项公共基准测试中显著超越强基线:Qwen2.5-3B-Instruct 与 Qwen2.5-7B-Instruct 模型分别实现平均 11% 与 12% 的性能提升。尤为值得注意的是,基于 3B 参数的 MemSearcher 甚至优于 7B 参数基线,表明在信息完整性与效率间取得平衡可同时实现更高准确率与更低计算开销。代码与模型将通过此链接发布:https://github.com/icip-cas/MemSearcher
[2] 上下文工程 2.0
标题:Context Engineering 2.0: The Context of Context Engineering
链接:https://arxiv.org/abs/2510.26493
作者:Qishuo Hua, Lyumanshan Ye, Dayuan Fu, Yang Xiao, Xiaojie Cai, Yunze Wu, Jifan Lin, Junfei Wang, Pengfei Liu
单位:上海交通大学、上海人工智能实验室
摘要:
卡尔·马克思曾提出「人的本质是一切社会关系的总和」,意指个体并非孤立存在,而是在与其他实体的互动中被根本性塑造——其中情境发挥着构成性与关键性作用。随着计算机与人工智能的出现,这些情境已不再局限于纯粹的人类间互动,人机交互同样被纳入其中。由此引出一个核心问题:机器如何能更好地理解人类所处情境与行为意图?为应对这一挑战,研究者近期提出「上下文工程」这一概念。尽管常被视为智能体时代的新兴产物,研究团队指出相关实践可追溯至二十余年前。自 1990 年代初以来,该领域经历了以机器智能水平为标志的多个发展阶段:从围绕早期原始计算机构建的人机交互框架,到当今由智能体驱动的人-智能体交互范式,未来可能迈向人类级甚至超人类智能的交互形态。本文系统界定了上下文工程的概念范畴,提供其系统性定义,梳理历史发展与理论脉络,并探讨实践中的关键设计要素。通过回答这些问题,研究旨在为上下文工程建立理论基础,并勾勒其发展前景。本文旨在推动学界共同致力于构建人工智能系统中系统化上下文工程的更广泛研究体系。
[3] 智能体间的协作鸿沟
标题:The Collaboration Gap
链接:https://www.arxiv.org/abs/2511.02687v1
作者:Tim R. Davidson, Adam Fourney, Saleema Amershi, Robert West, Eric Horvitz, Ece Kamar
单位:EPFL、微软研究院
摘要:
人工智能的发展轨迹表明,我们将日益依赖由独立开发的智能体所构成的系统——这些智能体拥有不同的信息、权限与工具。此类系统的成功关键取决于异构智能体间的有效协作,即使在局部可观测条件下亦不例外。尽管备受关注,但目前仍缺乏针对智能体间大规模协作的实证研究。研究者提出一个协作式迷宫求解基准测试,该框架具有以下特性:(1)隔离协作能力评估;(2)可调节问题复杂度;(3)支持规模化自动评分;(4)不设输出格式限制,保持生态效度。基于此框架,研究团队评估了 32 个领先的开源与闭源模型在独立运行、同构配对及异构配对三种模式下的表现。实验结果揭示了「协作鸿沟」现象:在独立任务中表现优异的模型,在需要协作时性能出现显著下降。协作崩溃案例屡见不鲜——例如某些在独立求解迷宫时表现优异的小型蒸馏模型,在特定配对组合中几乎完全失效。研究发现,由较强智能体启动协作流程可改善最终效果,这启发了「接力推理」方法:较强智能体先行引导任务,再移交至较弱智能体,该方法可大幅缩小协作鸿沟。这些发现为人工智能发展提出三条路径:(1)建立协作感知的评估体系;(2)开发增强协作能力的训练策略;(3)设计能可靠激发智能体潜在技能的交互机制。这些指导原则同时适用于 AI-AI 协作与 人类-AI 协作场景。
[4] ThinkMorph:多模态交错式链式推理中的涌现特性
标题:ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning
链接:https://arxiv.org/abs/2510.27492
作者:Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, Linjie Li, Michael Qizhe Shieh, Yejin Choi, Ranjay Krishna, Yu Cheng
单位:新加坡国立大学、浙江大学、华盛顿大学、斯坦福大学、香港中文大学。
摘要:
多模态推理需要语言与视觉模态的迭代协同,然而目前尚不清楚何种交织的思维链能构成有效的推理过程。研究者提出,文本与图像思维应作为互补而非同构的模态共同推进推理进程。基于此原则,研究团队构建了 ThinkMorph 统一模型——该模型在约 24K 条高质量交织推理轨迹上进行微调,涵盖不同视觉参与度的多样化任务。ThinkMorph 通过学习生成渐进式文本-图像推理步骤,在保持连贯语言逻辑的同时实现对视觉内容的具体操作。其在以视觉为中心的基准测试中实现显著提升(较基础模型平均提高 34.7%),并能泛化至领域外任务,达到甚至超越规模更大、参数闭源的视觉语言模型水平。除性能优势外,ThinkMorph 展现出新兴的多模态智能特征:包括未经训练的视觉操作技能、推理模式的自适应切换能力,以及通过多样化多模态思维实现更优的测试时扩展性能。这些发现为探索统一多模态推理模型的涌现能力提供了富有前景的研究方向。
意识科学 每周速递
[1] 意识体验:质性感知的控制机制
标题:Consciousness: The control of quality
链接:https://www.sciencedirect.com/science/article/abs/pii/S0732118X25000704
作者:Rupert Young
单位:Perceptual Robots
摘要:
本文提出对意识的新理解,通过引入「质性感知控制」(Control of Perception of Quality, CoPoQ)概念构建理论框架。传统理论常将意识核心归结为信息处理,但未能充分阐释意识体验的特异性感受及其在人类行为中的功能作用。CoPoQ 框架以质性主观感知为核心,涵盖现象体验、情感效价与幸福感等维度。
基于感知控制理论(PCT)原理,本研究探讨了意识如何通过调控智能体与环境交互的质性来发挥功能——作为一个动态系统,它持续重组并优化感知控制环路,突破进化约束以提升行为效能与适应性。CoPoQ 理论强调,质性感知是意识体验的基础,对行为动机具有关键作用;同时突显学习在意识中的核心地位,即通过控制与优化质性感知来实现认知发展。研究提出,意识觉察对于在感知控制层级中引导注意与重组过程至关重要,然而当控制系统达到最优运行状态时,意识将不再必要或显现。通过将意识体验重新界定为质性感知的控制机制,本文构建了一个能更深入解析意识觉察的综合框架,揭示了意识在评估与优化有机体-环境交互质性中的核心作用。
[2] 将网络信息加工与感觉生成联系起来的具体机制
标题:Specific mechanisms linking network information processing to the generation of qualia
链接:https://academic.oup.com/nc/article/2025/1/niaf043/8315916
作者:Roger Orpwood
单位:巴斯大学
摘要:
关于意识产生机制的研究已涌现出诸多前景可观的理论。这些理论大多将意识涌现与神经活动相关联,但极少有研究试图阐明神经活动如何具体引发主观体验。本文从单个神经网络层面探讨该问题,通过考察输入模式加工过程中发生的信息变化展开分析:研究关注网络如何识别空间分布式输入模式,并生成对应身份的表征。研究提出,若将这些表征直接反馈至网络自身,此类网络将能够识别其自身对原始身份的描绘状态。进一步论证认为,在此状态下获得的身份认知不再局限于「输入是什么」,而转化为「输入对网络而言呈现为何种状态」。这种内在描绘必然包含以某种方式向接收者呈现的内容,而这可能构成感质现象产生的基础。文章继而阐释了自上而下调控机制如何动态选择在特定时刻确立何种感质体验。
[3] 论主动推理中隐含的最小意识理论
标题:On the Minimal Theory of Consciousness Implicit in Active Inference
链接:https://www.sciencedirect.com/science/article/pii/S1571064525001617
作者:Christopher J. Whyte, Andrew W. Corcoran, Jonathan Robinson, Ryan Smith, Rosalyn J. Moran, Thomas Parr, Karl J. Friston, Anil K. Seth, Jakob Hohwy
单位:莫纳什大学、悉尼大学、劳瑞特脑研究所、伦敦国王学院、牛津大学等
摘要:
主观体验的多维特性为意识研究带来了挑战。传统神经科学方法通常聚焦于孤立层面——如知觉意识或整体意识状态——并围绕相关实证范式与发现构建理论。这导致不同意识理论往往难以直接比较,甚至其试图解释的现象之间可能鲜有重叠。本研究采用一种差异化路径:以主动推理这一基于(近似)贝叶斯推断的行为建模第一性原理框架为起点,逐步构建出最小化意识理论——该理论源自主动推理框架下各类计算模型的共同特征。通过系统梳理应用主动推理模型研究意识的相关工作,研究者指出这些模型均隐含着一组核心理论主张,这些主张共同指向一个可检验的最小化意识理论体系。
[4] 从语言预测中揭示类人概念表征的涌现
标题:Revealing emergent human-like conceptual representations from language prediction
链接:https://www.pnas.org/doi/abs/10.1073/pnas.2512514122
作者:Ningyu Xu, Qi Zhang, Chao Du, Qiang Luo, Xipeng Qiu, Xuanjing Huang, and Menghan Zhang
单位:复旦大学
摘要:
人类通过丰富的物理与社会经验获取概念,并运用这些概念来理解和适应世界。相比之下,仅通过文本下一词预测训练的大型语言模型(LLM)却展现出惊人的人类相似行为。这些模型是否形成了与人类相似的概念?若是,这些概念如何被表征、组织并与行为关联?研究者通过考察 LLM 在上下文概念推理任务中形成的表征来探讨这些问题。实验发现,LLM 能够根据语言描述灵活推导概念,并参照其他概念的上下文线索进行调整。推导出的表征会收敛于一种独立于具体上下文的共享结构,且与该结构的对齐程度可可靠预测模型在各类理解与推理任务中的表现。此外,这种收敛性表征能有效捕捉人类行为判断模式,并与人类大脑神经活动模式高度吻合,为 LLM 表征的生物合理性提供了证据。这些发现共同表明:结构化、类人的概念表征可纯粹通过语言预测任务涌现,无需现实世界经验基础,凸显了概念结构在理解智能行为中的核心作用。从更广视角看,该研究说明 LLM 为探索人类概念本质提供了具体窗口,并为推进人工智能与人类智能的对齐奠定了基础。
Mindverse Research
心识研究院
心识浩渺连广宇
心识宇宙研究院,致力于在即将到来的元宇宙数字时代,研究和创造真正等价于人类意识水平的数字生命,目前已经综合多种研究进路和方法规划出一条通向AGI和人工意识的道路。在后续内容运营上,我们也会介绍和创造更多有关人工智能、意识科学、元宇宙方面最新的研究成果和原创内容。
欢迎有志者关注和加入我们的研究!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.