追问daily | 800名男性囚犯大脑结构研究；大脑可能利用多巴胺来扭曲时间和塑造记忆|脑区|脑功能|脑神经|神经元|马斯克

分享至

█ 脑科学动态

早期脑区在决策中扮演重要角色

大脑可能利用多巴胺来扭曲时间和塑造记忆

大脑依赖感觉而非运动指令存储新发音模式

新型问卷精准描绘精神障碍的七种紧张模式

孤独症诊断的性别鸿沟随年龄增长而弥合

鱼类睡眠状态展现出四种不同的特征，其中三种伴有眼球运动

感觉网络共享世界，默认模式网络编织个人故事

800名男性囚犯大脑结构研究：高精神病态与皮质表面积增大有关

单脉冲刺激揭示大脑在内部与外部处理间的快速切换机制

█ AI行业动态

马斯克解散xAI：22万张GPU算力转租Anthropic

让AI玩“太空狼人杀”？DeepMind入股硬核网游EVE研究智能进化

Claude新功能让机器在睡眠中自己梳理记忆、总结规律

中科院发布类脑大模型瞬悉2.0

█ AI驱动科学

QIMR团队首创可解释AI筛查模型，精准锁定隐藏癌细胞特征

外科医生的新搭档：因果AI驱动下的半自主医疗机器人图景

AI为AI造工具：自动研究循环演化出智能体专属的机器学习库

新AI算法赋予机器人无缝技能迁移能力

AHE让编程智能体实现线束全自动进化

从单步预测到自主进化：跨学科视角下的世界模型演进路线图

减少47%无效调用，新型框架让大型推理模型学会适时检索

协同进化的大模型决策与技能库智能体突破长期任务瓶颈

突破文本长度瓶颈：OCR-Memory实现智能体长周期视觉记忆提取

脑科学动态

早期脑区在决策中扮演重要角色

大脑如何做出决策？伊利诺伊大学厄巴纳-香槟分校的Yurii Vlasov及其团队通过研究发现，决策过程并非纯粹自下而上地逐级传递，早期感官脑区通过反馈回路深度参与其中，这一发现挑战了传统的神经科学观点，并可能为下一代人工智能的设计提供新思路。

▷ 一只老鼠在自然逼真的虚拟现实环境中，利用胡须做出感知决策，从而实现向左或向右的转向。与传统的脑组织结构观点相反，感知决策在初级皮层皮层计算的早期阶段就已得到充分体现。Credit: The Grainger College of Engineering at the University of Illinois Urbana-Champaign

传统观点认为，决策是一个层级过程，感官信息从初级脑区流向高级脑区。为验证这一模型，研究团队设计了一个实验，让小鼠在虚拟现实环境中仅凭胡须触觉来决定向左或向右导航。通过高密度电生理记录，他们惊讶地发现，在被认为是感官信息中继站的初级体感皮层（primary somatosensory cortex, S1）中，就已存在强烈的决策信号。研究显示，S1的神经活动并非单向流动，而是受到来自高级脑区的“自上而下”的动态调控，形成了双向反馈回路。在决策期间，S1中复杂的高维神经活动会“塌缩”成一个单一变量，其活动强度会逐渐累积，直至达到决策阈值。这一“自然智能”模型不仅解释了大脑的高效决策机制，也为开发能耗更低、性能更强的AI提供了生物学蓝图。研究发表在 PNAS 上。

#神经科学 #神经机制与脑功能解析 #决策 #计算模型与人工智能模拟 #神经回路

阅读更多：

Armstrong, Alex G., and Yurii Vlasov. “Neural Correlates of Perceptual Decision-Making in the Primary Somatosensory Cortex.” Proceedings of the National Academy of Sciences, vol. 123, no. 18, May 2026, p. e2514107123. pnas.org (Atypon), https://doi.org/10.1073/pnas.2514107123

大脑可能利用多巴胺来扭曲时间和塑造记忆

为什么有些记忆感觉转瞬即逝，而另一些却仿佛被拉长？加州大学洛杉矶分校的Erin Morrow和David Clewett等人通过研究揭示，大脑中的多巴胺系统可能正是这位“时间魔术师”，它通过在不同经历之间制造时间上的距离感，帮助我们将连续的生活流分割成独立的记忆章节。

▷ 事件序列编码任务和时间距离记忆测试。Credit: Nature Communications (2026).

研究团队让志愿者在进行功能性磁共振成像扫描时观看图像序列，并通过切换声音的来源和音高来人为制造“事件边界”（event boundaries，即标志着一个情境结束和另一个开始的节点）。结果发现，每当参与者感知到事件边界时，大脑中负责产生多巴胺的关键区域——腹侧被盖区（ventral tegmental area，简称VTA）——便会显著激活。这种激活带来了奇妙的心理效应：在随后的记忆测试中，尽管所有图像对的实际呈现间隔完全相同，但那些恰好跨越了事件边界的图像对，被参与者普遍回忆为时间上相隔更远。VTA激活越强烈，这种时间被“拉长”的感觉就越明显。此外，研究还发现眨眼行为与多巴胺信号密切相关，在事件边界处，参与者的眨眼频率也显著增加，进一步佐证了多巴胺系统在标记和分割体验中的作用。研究发表在 Nature Communications 上。

#神经科学 #记忆机制 #多巴胺 #时间知觉

阅读更多：

Morrow, Erin, et al. “Dopaminergic Processes Predict Temporal Distortions in Event Memory.” Nature Communications, vol. 17, no. 1, Mar. 2026, p. 3971. www.nature.com, https://doi.org/10.1038/s41467-026-69950-8

大脑依赖感觉而非运动指令存储新发音模式

我们如何学会并记住新的口音或发音方式？长期以来，科学家们争论这究竟是肌肉的运动记忆还是感官的记忆。由Nishant Rao、David J. Ostry等麦吉尔大学研究人员组成的一项新研究揭示，言语记忆的存储关键在于感觉系统，而非运动系统。

▷ 用于研究语音动作记忆是否具有感觉基础的实验装置。Credit: Proceedings of the National Academy of Sciences (2026).

研究团队设计了一个巧妙的实验，让参与者在听到自己声音被实时改变（元音音调升高）的情况下说话，从而诱导他们学习一种新的发音模式。学习结束后，研究人员使用经颅磁刺激（Transcranial Magnetic Stimulation, TMS）技术，分别对不同组参与者处理声音的听觉皮层、处理触觉和运动感的体感皮层，以及控制肌肉运动的初级运动皮层进行短暂干扰。24小时后的记忆测试结果出人意料：当听觉或体感皮层受到干扰时，参与者无法很好地记住所学的发音调整；而干扰初级运动皮层却对记忆毫无影响。这表明，大脑并非记忆了一套“如何动嘴”的运动指令，而是建立并存储了一个“声音应该是什么样”的感觉目标。正是这个基于听觉和体感的目标，在指导我们的发音器官运动。研究发表在 PNAS 上。

#认知科学 #神经机制与脑功能解析 #语言学习 #感觉皮层 #经颅磁刺激

阅读更多：

Rao, Nishant, et al. “Sensory Basis of Speech Motor Learning and Memory.” Proceedings of the National Academy of Sciences, vol. 123, no. 17, Apr. 2026, p. e2525468123. pnas.org (Atypon), https://doi.org/10.1073/pnas.2525468123

新型问卷精准描绘精神障碍的七种紧张模式

过度唤醒是多种精神障碍的核心症状，但其构成维度一直不明确，妨碍了精准诊疗。为解决此问题，荷兰神经科学研究所的 Tom Bresser 及其团队通过大规模问卷调查与因子分析，首次揭示了过度唤醒的七个不同维度，并开发了首个用于快速评估的跨诊断问卷（THDQ）。

研究团队对467名有不同精神健康状况的成年人进行了综合评估，让他们完成了包含18份不同问卷的221个条目。通过探索性因子分析，研究人员识别出过度唤醒的七个独立维度：焦虑型（anxious hyperarousal，对未来充满忧虑）、躯体型（somatic hyperarousal，如心悸、呼吸急促等身体症状）、敏感型（sensitive hyperarousal，情绪脆弱）、睡眠相关型（sleep-related hyperarousal，睡前思虑过多）、易怒型（irritable hyperarousal）、警觉型（vigilant hyperarousal，在公共场所过度警惕）以及出汗/血管舒缩型（sudomotor hyperarousal，如冷热汗和脸红）。研究发现，虽然几乎每种过度唤醒维度都或多或少地存在于各种障碍中，但不同疾病（如失眠、抑郁症、创伤后应激障碍等）表现出各自独特的严重程度组合模式。基于这些发现，团队开发并验证了一份包含27个条目的跨诊断过度唤醒维度问卷（Transdiagnostic Hyperarousal Dimensions Questionnaire, THDQ），该问卷能够快速、可靠地评估每个维度。该问卷在第二个592人的样本中得到验证，并且研究还表明，英国生物样本库的部分现有数据可用于估算其中的焦虑、易怒和睡眠相关三个维度，为利用大型队列数据进行深入研究提供了可能。研究发表在 eClinicalMedicine 上。

#疾病与健康 #心理健康与精神疾病 #过度唤醒 #跨诊断

阅读更多：

Bresser, Tom, et al. “Hyperarousal Transdiagnostically Dissected: Different Dimensions Characterize Mood, Anxiety, Insomnia, Posttraumatic Stress and Attention Deficit Hyperactivity Disorders.” eClinicalMedicine, vol. 94, Apr. 2026. www.thelancet.com, https://doi.org/10.1016/j.eclinm.2026.103810

孤独症诊断的性别鸿沟随年龄增长而弥合

孤独症是“男性病”吗？瑞典卡罗林斯卡学院的Caroline Fyfe及其同事对瑞典近280万人的大规模数据进行分析，挑战了这一传统观念。研究发现，尽管男孩在幼年期的诊断率远高于女孩，但这种性别差异会随年龄增长而显著缩小，至成年期几乎消失，这提示女性孤独症患者可能在儿童期被大量漏诊。

该研究分析了1985年至2020年间出生的近280万瑞典儿童的医疗数据。结果显示，在10岁之前，男孩获得孤独症谱系障碍（autism spectrum disorder，简称ASD）诊断的比例是女孩的三倍。然而，此后性别差距开始稳步缩小。在近两年（2020-2022年）的数据中，到15岁时，诊断率已无明显性别差异。数据还揭示了诊断高峰年龄的性别差异：男性为10至15岁，而女性则推迟到15至19岁。研究团队推测，诊断延迟可能与多种因素有关。一种可能是女孩更擅长在幼年“伪装”或模仿同龄人的社交行为，使得症状更难被发现。另一种可能是她们的孤独症症状常被误归因于其他共存的精神健康问题，导致诊断被延误。这一发现强调了优化现有筛查和诊断实践的必要性，以确保女性能够得到及时识别和支持。研究发表在 BMJ 上。

#疾病与健康 #心理健康与精神疾病 #孤独症 #性别差异 #诊断延迟

阅读更多：

Fyfe, Caroline, et al. “Time Trends in the Male to Female Ratio for Autism Incidence: Population Based, Prospectively Collected, Birth Cohort Study.” BMJ, vol. 392, Feb. 2026, p. e084164. Research. www.bmj.com, https://doi.org/10.1136/bmj-2025-084164

鱼类睡眠状态展现出四种不同的特征，其中三种伴有眼球运动

鱼类是否像人类一样拥有复杂的睡眠阶段？德国马克斯·普朗克生物控制论研究所的Vikash Choudhary、Charles R. Heller、Jennifer M. Li及Drew N. Robson等人通过对斑马鱼的研究给出了肯定答案。他们首次发现鱼类存在一个由四种不同状态组成的复杂睡眠结构，并且这些状态的分布受到生物钟和光照的精细调控。

▷ 马克斯·普朗克生物控制论研究所系统神经科学与神经工程研究组的追踪显微镜。Credit: Jörg Abendroth / MPI for Biological Cybernetics

研究团队利用一种特制的追踪显微镜，对自由游动的透明斑马鱼幼鱼进行了长达24小时的连续观察，同步记录了它们的行为、眼动和全脑神经活动。通过分析眼球运动的运动学特征，他们将鱼类的睡眠（长时间静止）划分为四种不同的子状态：一种完全没有眼球运动的睡眠（QNEM），以及三种具有独特眼动模式的睡眠（QEM-1、QEM-2和QEM-3）。研究揭示了这些睡眠状态惊人的昼夜节律组织性：QNEM主要发生在夜间；QEM-2在清晨时段增多；而最令人意外的是，QEM-1作为一种难以唤醒的深度睡眠状态，几乎只在白天出现，类似于一种“午睡”。进一步的实验表明，这种精细的睡眠结构是由内部生物钟和外部光照共同决定的，并且在其他两种近缘鱼类中也同样存在，证明这是一种古老的、在演化上保守的特征。研究发表在 Nature Communications 上。

#疾病与健康 #神经机制与脑功能解析 #睡眠 #昼夜节律 #斑马鱼

阅读更多：

Choudhary, Vikash, et al. “Eye Movement Kinematics Reveal Novel Circadian Organization of Sleep Substates.” Nature Communications, vol. 17, no. 1, May 2026, p. 4068. www.nature.com, https://doi.org/10.1038/s41467-026-72222-0

感觉网络共享世界，默认模式网络编织个人故事

人类的内在世界为何千差万别且独一无二？Peter Coppola和Emmanuel A. Stamatakis等揭示了大脑复杂网络在处理共享信息与个人体验时的不同运作模式，证实了大脑深层的默认模式网络是承载高度个人化意识流并决定个体独特性的核心基础。

▷ Credit: Communications Biology (2026).

研究团队让16名成年志愿者聆听一段电影音频片段，并使用功能磁共振成像分别记录他们在清醒和全身麻醉状态下的脑电活动。分析过程中采用了时间相似性矩阵来追踪各个大脑区域通讯模式的转变。结果显示，当参与者清醒时，其默认模式网络（DMN）的活动变得异常复杂，且不同个体间的模式差异极大。相反，负责处理视觉和听觉的注意力与感觉网络在不同个体间表现出高度一致性。当失去意识时，这些显著的个体神经特征随之减弱并趋向相同。这表明大脑利用感觉网络来共享世界体验，而深层网络则时刻重塑以反映个人的私密记忆和思想。研究发表在 Communications Biology 上。

#意识与脑机接口 #神经机制与脑功能解析 #默认模式网络 #个体意识 #功能磁共振成像

阅读更多：

Coppola, Peter, et al. “The Neural Correlates of Shared and Individual Experience.” Communications Biology, vol. 9, no. 1, Jan. 2026, p. 95. www.nature.com, https://doi.org/10.1038/s42003-025-09355-3

800名男性囚犯大脑结构研究：高精神病态与皮质表面积增大有关

以往研究认为具有精神病态特征的人脑容量较小，但缺乏区分皮质厚度与表面积的大规模映射分析。Marcin A. Radecki和J. Michael Maurer等研究人员通过对被监禁男性的研究发现，高度精神病态者的大脑皮质表面积不仅没有缩小，反而出现显著扩张，尤其是在处理社会与情感信息的区域。

这项研究招募了804名成年男性囚犯，以探究同理心缺失、精神病态与大脑物理结构的关系。研究采用标准精神病态量表修订版（Psychopathy Checklist-Revised，用于评估个体人际关系、情感特征及反社会生活方式的标准化临床评估工具）与人际反应指针问卷（Interpersonal Reactivity Index，用于多维评估个体共情能力的自评量表）进行行为学评估，并结合磁共振成像技术测量受试者的皮质厚度、表面积以及不同脑区间的结构协方差梯度。

数据分析表明，精神病态的情感特征与同情和关心他人的能力降低紧密相关，而反社会行为特征则与换位思考能力受损有关。引人注目的是，在比较高低精神病态水平男性的脑部结构时，两者的皮质厚度并无显著差异。然而，精神病态程度较高的男性在65个大脑区域表现出更大的皮质表面积。此外，宏观组织分析揭示，正常大脑从基础感觉脑区到复杂社交推理脑区的结构梯度，在高度精神病态的男性中被显著压缩且分化程度降低。这意味着他们大脑各区域间的界限变得更加模糊，结构相似性更高。研究发表在 Biological Psychiatry Global Open Science 上。

#疾病与健康 #心理健康与精神疾病 #神经机制与脑功能解析 #共情 #精神病态

阅读更多：

Radecki, Marcin A., et al. “Cortical Structure in Relation to Empathy and Psychopathy in 800 Incarcerated Men.” Biological Psychiatry Global Open Science, vol. 6, no. 3, May 2026, p. 100695. ScienceDirect, https://doi.org/10.1016/j.bpsgos.2026.100695

单脉冲刺激揭示大脑在内部与外部处理间的快速切换机制

大脑在处理记忆等内部信息与感官等外部信息时需要频繁切换，但长期以来科学界尚不清楚宏观脑网络能否支撑如此快速的转换。香港大学的 Ed X. Wu 、 Alex T. L. Leong 、 Linshan Xie 和 Xunda Wang 团队结合非侵入性成像与精准神经刺激技术，发现大脑在接收到极其短暂的神经信号后数秒内即可完成全脑网络的重塑。

▷ 利用单脉冲光遗传学方法激活体感腹后内侧丘脑（VPM）内的兴奋性神经元，同时进行静息态功能磁共振成像（rsfMRI）和全脑神经活动电生理测量，并采用数据驱动的分析策略，以检验 rsfMRI 网络是否能够适应快速神经信息处理。Credit: Adapted from Nature Communications (2025).

该研究采用单脉冲光遗传学（optogenetics，一种利用光脉冲精确控制特定活体神经元活动的技术）方法，在大鼠模型中对体感丘脑腹后内侧核（VPM，大脑中负责将感觉信息传递并整合到皮层的关键区域）的兴奋性神经元进行仅10毫秒的瞬间刺激。同时，研究人员实施了静息态功能磁共振成像与皮层脑电图（ECoG）的同步测量。随后通过数学模型分析网络状态的演变，结果显示这极其短暂的刺激在短短两秒内就触发了全脑网络的重组。此时，大脑迅速抑制了负责内部信息处理的网络状态，并将信号通过基底前脑和下丘脑等关键神经调节枢纽进行转移，以强化对外部环境信息的处理。此外，同步采集的电生理数据证实，这种宏观网络的变化是由特定区域内和区域间神经活动的同步化直接驱动的。这项研究颠覆了以往认为宏观脑网络变化极其缓慢的传统观点，揭示了大脑应对外界突发刺激的底层逻辑。研究发表在 Nature Communications 上。

#神经科学 #神经机制与脑功能解析 #静息态功能磁共振成像 #光遗传学 #脑网络动态

阅读更多：

Xie, Linshan, et al. “Brain-Wide Resting-State fMRI Network Dynamics Elicited by Activation of Single Thalamic Input.” Nature Communications, vol. 16, no. 1, Dec. 2025, p. 11247. www.nature.com, https://doi.org/10.1038/s41467-025-66104-0

AI 行业动态

马斯克解散xAI：22万张GPU算力转租Anthropic

马斯克近日正式确认，其创立的人工智能公司xAI将宣告解散。xAI及其大语言模型Grok全部并入SpaceX新成立的子部门SpaceXAI，合并后实体估值高达1.25万亿美元。伴随这一重组，xAI最初的11位联合创始人已全部离职。分析认为，此举旨在将AI研发与太空基础设施整合，并将AI相关的监管与诉讼风险纳入SpaceX更庞大的治理框架内。马斯克表示，SpaceX已将其AI训练工作转移到新一代超算集群Colossus 2上，并计划像发射卫星一样，向其他“造福人类”的AI公司公平提供算力。

作为重组的关键一环，SpaceX与AI公司Anthropic达成重磅算力协议。全球最大的AI集群之一Colossus 1所拥有的超过22万块英伟达GPU，将全部用于提升Anthropic旗下Claude模型的代码生成能力。Anthropic由此获得超过300兆瓦的计算能力，并立即提高了其付费用户（Claude Pro、Max等）和API的速率限制，大幅缓解了因算力紧张导致的Claude Code服务限制问题。双方还表示将探索合作开发数吉瓦级的轨道人工智能算力，利用太空近乎无限的可持续能源和散热能力，突破地面电力与土地对下一代AI算力扩张的物理限制。

#xAI解散 #马斯克 #Anthropic算力合作 #太空计算 #GPU租用

阅读更多：

https://x.ai/news/anthropic-compute-partnership

让AI玩“太空狼人杀”？DeepMind入股硬核网游EVE研究智能进化

人工智能前沿机构Google DeepMind近日宣布了一项独特的跨界合作：通过收购股权的方式，与著名硬核太空沙盒网游《EVE Online》（星战前夜）的开发商结成研究伙伴关系。此举正值该游戏迎来上线23周年，其开发商CCP Games（后更名为Fenris Creations）以1.2亿美元从韩国发行商Pearl Abyss手中完成管理层收购，实现独立运营。DeepMind表示，将利用EVE Online极其庞大、复杂且完全由玩家驱动的虚拟经济与政治生态，作为研究“复杂、动态、玩家驱动系统中的智能”的理想试验场。研究人员计划在本地服务器的离线版本中，对其人工智能模型进行涉及长远规划、记忆和持续学习的受控实验，同时探索由此衍生的全新游戏体验。

选择EVE Online并非偶然。这款以单服务器宇宙（Single-shard universe）架构著称的游戏，拥有超过7000个星系和由全球玩家完全自主运行的完整经济体系，其复杂性与真实世界高度相似，曾被戏称为“太空模拟器”。DeepMind总监Alexandre Moufarek表示，这是一个测试通用人工智能的安全沙盒环境。事实上，EVE社区早有与科研跨界合作的先例，其“探索计划”（Project Discovery）曾让玩家通过游戏内小游戏为蛋白质图谱、系外行星搜寻和癌细胞数据分析等真实科研项目贡献了上亿级的数据标注。此次合作延续并升华了这一传统，旨在让人工智能模仿人类在极端复杂、充满博弈与不确定性的“黑暗森林”般的系统中，演化出更高层次的规划与适应能力。

#DeepMind #EVEOnline #通用人工智能 #沙盒模拟 #跨界科研

阅读更多：

https://www.eveonline.com/news/view/a-new-era

Claude新功能让机器在睡眠中自己梳理记忆、总结规律

人工智能公司Anthropic为其Claude Managed Agents推出了一项名为“梦境”（Dreaming）的创新功能，让AI能够在工作间隙进行“睡眠反思”。与人类大脑在睡眠中整理记忆、沉淀经验的机制类似，Dreaming会在对话间隙异步运行，自动扫描AI的记忆库及最近100条历史会话，执行三项核心任务：合并重复与清理冗余信息、用最新知识替换过时规则、以及通过交叉分析多个智能体的经历来挖掘隐藏的规律与最优工作流。所有经过整理的成果会输出至全新的记忆库，用户可安全验证，无需担心原始数据受损。目前，已有法律科技公司Harvey在接入后，其长文法律文书起草完成率提升了约6倍。

与此同时，Anthropic还同步推出了另外两项功能，与Dreaming形成互补。名为“成果”（Outcomes）的自我质检员模块，通过一个独立的评分智能体在隔离环境中对AI的产出进行客观打分，不达标则自动触发修改，据称能将任务成功率最高提升10个百分点。而“多智能体编排”（Multi-Agent Orchestration）则让一个“队长”智能体负责拆解复杂任务，指挥多个配备不同模型与工具的“专家”智能体并行处理，有效过滤干扰信息。这三项功能共同构建了一套让AI能独立、高效完成复杂工作的基础设施。结合与SpaceX的合作及用户调用限额的提升，Anthropic正致力于推动AI从辅助工具向自主工作主体的转变。

#Claude梦境反思 #AI自我升级 #多智能体协作 #自主工作流 #Anthropic

阅读更多：

https://claude.com/blog/new-in-claude-managed-agents

中科院发布类脑大模型瞬悉2.0

中国科学院自动化研究所李国齐、徐波团队近日推出类脑脉冲大模型“瞬悉2.0”（SpikingBrain2.0-5B），旨在破解传统Transformer模型在长序列处理和高能耗部署上的核心瓶颈。该模型引入了双空间混合稀疏注意力（Dual-Space Sparse Attention, DSSA，一种结合块级稀疏计算与压缩状态表征的类脑记忆机制）和双路径激活值编码策略（支持工业GPU的FP8低比特路径与面向神经形态芯片的INT8-脉冲路径）。仅需32张A100显卡、9天时间（训练数据量从上一代的1500亿token降至140亿token），瞬悉2.0即可完成对主流模型（如Qwen3）的持续预训练，综合性能与强基线比肩，且超过上一代7B版本。

在长序列效率方面，瞬悉2.0在400万token长度下首token生成时延（Time to First Token，模型输出第一个字符的等待时间）相比Qwen3提升10.13倍，FP8量化路径下提速达15.13倍。同时，其整数-脉冲化编码路径精度损失仅0.69%，脉冲稀疏度高达64.3%，有望使类脑芯片面积减小70.6%、功耗降低近50%。该模型还支持长达1000万token的推理（8卡A100），并兼容多模态版本（瞬悉2.0-VL）。团队为低功耗端侧部署和神经形态计算提供了高性价比方案，验证了类脑机制与高效架构结合的广阔前景。

#类脑大模型 #瞬悉2.0 #长序列AI #低功耗部署 #脉冲神经网络

阅读更多：

https://arxiv.org/abs/2604.22575

AI 驱动科学

QIMR团队首创可解释AI筛查模型，精准锁定隐藏癌细胞特征

常规病理染色法无法揭示组织分子活性，现有深度学习模型亦缺乏可解释性。Xiao Tan和Quan Nguyen等（QIMR Berghofer医学研究所等）开发了人工智能筛查工具STimage，能从标准病理图像中准确预测空间基因表达和细胞类型，为诊断提供透明且可靠的分析结果。

▷ 组织样本空间分析（左图）和标准 H&E 染色图像（右图）。Credit: QIMR Berghofer Medical Research Institute

该研究构建了一种名为STimage的概率深度学习框架。该模型首先对组织学图像进行预处理和特征提取，随后利用负二项式层输出预测结果。为提高工具的鲁棒性，研究引入了不确定性量化机制，能够同时评估数据固有和模型自身的误差幅度。此外，系统还集成了局部可解释模型无关解释（LIME，一种使机器学习预测过程可视化的技术）算法，在单细胞分辨率级别提供直观的病理学依据。研究人员使用包含乳腺癌、皮肤癌、肾癌以及原发性硬化性胆管炎的去标识化数据集对工具进行验证。结果显示，STimage在预测准确度上显著优于现有的多种空间分析模型。它不仅能根据组织微环境中的分子模式生成具有生物学支撑的疾病预测，还能准确评估患者的生存风险，并预测其对各类现有药物的临床反应。研究发表在 Nature Communications 上。

#疾病与健康 #预测模型构建 #数字病理学 #空间转录组学 #人工智能

阅读更多：

Tan, Xiao, et al. “Robust and Interpretable Prediction of Gene Markers and Cell Types from Spatial Transcriptomics Data.” Nature Communications, vol. 17, no. 1, Jan. 2026, p. 1781. www.nature.com, https://doi.org/10.1038/s41467-026-68487-0

外科医生的新搭档：因果AI驱动下的半自主医疗机器人图景

人工智能手术机器人能否彻底改变外科手术并在手术室中安全发挥作用？Alejandro Granados和Prokar Dasgupta等研究人员（伦敦国王学院等）深入分析了人工智能增强型手术机器人的发展及其对临床实践的深远影响，指出该技术有望实现个性化手术并重塑团队角色，但前提是必须解决伴随而来的伦理与监管等关键挑战。

研究团队全面评估了下一代具身人工智能手术机器人的发展现状与未来趋势。结果表明，未来整合了视觉-语言-动作模型和因果AI的机器人系统，不仅能进行空间理解和自适应学习，还能在手术中途为团队提供实时决策支持。随着机器人的自主性不断提升，它们将从单纯的手术工具转变为人类在环（human-in-the-loop，系统在自主运行过程中始终保留人类监督与干预节点的控制机制）的半自主伙伴。这使得外科团队的角色发生重大重塑，外科医生的职责将逐渐向监督、协调与高层决策倾斜，护士和助理需掌握监督机器人系统的新技能，团队中还将新增临床数据科学家等角色。研究强调，尽管人工智能潜力巨大，但外科医生仍必须是最终决策者。此外，由于自适应系统具有获批后持续学习和改变的能力，研究呼吁对现有的医疗技术监管路径进行全面改革，建立标准化的临床试验指标以及全球化的合作框架，从而防范数据集偏见并确保技术安全有效。研究发表在 Frontiers in Science 上。

#疾病与健康 #机器人及其进展 #具身智能 #外科团队重塑 #监管与伦理

阅读更多：

Granados, Alejandro, et al. “Evolving Surgical Teams in the Age of Artificial Intelligence and Robotics.” Frontiers in Science, vol. 4, May 2026. Frontiers, https://doi.org/10.3389/fsci.2026.1783803

AI为AI造工具：自动研究循环演化出智能体专属的机器学习库

随着智能体数据科学系统的发展，现有的为人类设计的统计分析工具已成为人工智能理解数据的瓶颈。为解决这种工具不匹配问题，微软研究院和新加坡国立大学的Chandan Singh团队开发了名为AGENTIC-IMODELS的自动研究循环框架，成功演化出专为大模型智能体设计的可解释数据科学工具，显著提升了系统的端到端分析能力。

研究团队提出了一种自动研究循环（autoresearch loop），利用代码智能体不断迭代生成处理表格数据的回归模型。评估环节引入了创新的基于大语言模型的可解释性指标，重点测试模型字符串表示的“可模拟性”（simulatability，即大语言模型能否仅通过读取文本输出就准确推断其行为）。实验在65个数据集上展开，结果表明演化出的模型在预测性能和智能体可解释性方面实现了帕累托改进（Pareto improvements，即在不牺牲某一指标的情况下全面提升其他指标），打破了传统模型在两者间的权衡困境。在BLADE基准测试中，配备这些新工具的智能体在处理真实数据分析任务时性能最高提升了73%。分析发现，这些模型之所以能被人工智能更好地理解，是因为其采用了硬性架构上限（如限制树的深度）和独立优化的文本显示策略。

#大模型技术 #自动化科研 #智能体 #可解释机器学习

阅读更多：

Singh, Chandan, et al. “Agentic-Imodels: Evolving Agentic Interpretability Tools via Autoresearch.” arXiv:2605.03808, arXiv, 5 May 2026. arXiv.org, https://doi.org/10.48550/arXiv.2605.03808

新AI算法赋予机器人无缝技能迁移能力

机器人在仿真环境与复杂多变的现实世界之间存在难以逾越的性能差距，这种不一致性严重制约了自动化系统的可靠部署。伯明翰大学的Jamie Hathaway与阿斯顿大学的Alireza Rastegarpanah等研究人员合作，成功开发出一种基于人工智能的新型训练框架，使机器人能够仅依赖极少的真实数据，将虚拟环境中学习到的复杂技能可靠地迁移并应用于现实任务中。

▷ 本文提出的框架概述如下。第一阶段，利用切削力学仿真生成专家策略，并在仿真轨迹窗口上训练变分自编码器（VAE）。第二阶段，利用 VAE 编码的表示生成仿真数据集和真实数据集之间的配对，这些配对用作风格目标。最后，利用专家轨迹和生成的观测窗口训练学习器目标域策略。Credit: Scientific Reports (2026).

研究团队将图像处理领域中的神经风格迁移（neural style transfer，一种通过提取和融合不同数据源的内容与风格特征来合成新数据的生成技术）概念创新性地应用于机器人轨迹处理。研究人员首先利用变分自编码器在仿真轨迹窗口上进行特征学习。随后，利用该模型在无标签的仿真数据集与真实数据集之间生成配对，并将其作为风格目标合成新的训练观测窗口。这种方法无需真实环境提供直接奖励信号即可高效训练强化学习策略。在机器人切割未知材料的实验中，结果显示，与传统的基线模型相比，该框架仅需极少量现实数据便显著缩短了任务完成时间并大幅提升了机器人的行为稳定性。该技术对材料和几何形状的物理变化展现出强大的鲁棒性，未来有望广泛应用于核设施退役以及废旧电池拆解等充满高度不确定性的危险自动化任务中。研究发表在 Scientific Reports 上。

#AI驱动科学 #机器人及其进展 #强化学习 #神经风格迁移 #自动化系统

阅读更多：

Hathaway, Jamie, et al. “End-to-End Example-Based Sim-to-Real RL Policy Transfer Based on Neural Stylisation with Application to Robotic Cutting.” Scientific Reports, vol. 16, no. 1, Mar. 2026, p. 13240. www.nature.com, https://doi.org/10.1038/s41598-026-41735-5

AHE让编程智能体实现线束全自动进化

编程智能体在复杂软件工程任务中的表现高度依赖外部线束（harness，辅助模型与环境交互的系统组件），但纯人工设计线束不仅耗时且难以跟上语言模型的迭代速度。为解决智能体线束难以自动进化的问题，Jiahang Lin、Shichun Liu、Chengjun Pan等人（复旦大学、北京大学、上海期智研究院等）提出了一种名为代理线束工程（Agentic Harness Engineering，简称AHE）的方法，成功实现了编程智能体线束的自动化与稳定进化。

研究团队将线束优化转化为一个由另一智能体驱动的闭环过程，并基于三大可观测性支柱进行设计。首先，组件可观测性将复杂的线束解耦为七种文件级别的可编辑组件；其次，经验可观测性通过轨迹蒸馏技术，将海量的原始运行数据提炼为结构化的证据语料，供进化智能体读取；最后，决策可观测性要求每次修改都附带预测声明，并在下一轮评估中进行验证，一旦无效即在文件级别回滚。实验结果显示，AHE在Terminal-Bench 2基准测试中经过10次迭代，将首选通过率（pass@1，指模型首次尝试即成功完成任务的比率）从69.7%提升至77.0%，显著超越了人类设计的基线以及其他自动化方法。此外，冻结后的AHE线束无需重新进化，即可直接迁移至SWE-bench-verified任务中，且能跨越三种不同的语言模型家族实现广泛的性能提升。消融实验进一步证实，性能提升主要源于工具、中间件和长期记忆等非文本层面的结构优化，而非单纯的系统提示词修改。

#大模型技术 #自动化科研 #智能体系统 #自动进化 #线束工程

阅读更多：

Lin, Jiahang, et al. “Agentic Harness Engineering: Observability-Driven Automatic Evolution of Coding-Agent Harnesses.” arXiv:2604.25850, arXiv, 30 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.25850

从单步预测到自主进化：跨学科视角下的世界模型演进路线图

随着人工智能系统从文本生成向目标驱动交互演进，环境动态建模即世界模型成为核心瓶颈，但各学科对其定义存在严重分歧。Meng Chu和Xuan Billy Zhang等（香港科技大学、新加坡国立大学等）提出了一种全新的能力交叉法则的二维分类框架，成功将自然语言处理、计算机视觉、强化学习与科学发现等孤立研究领域的四百余项相关研究进行了概念统一。

研究团队为代理世界模型建立了一个独立于具体实例化形式的理论框架。在横向上，研究者将模型运作环境抽象为物理、数字、社会和科学四大法则体系。在纵向上，团队基于部分可观察马尔可夫决策过程（POMDP，一种模拟代理在不完全信息下进行决策的数学概率模型）严格定义了三个能力层级：L1预测器（Predictor，仅依靠隐状态推理和观测解码实现单步局部预测）；L2模拟器（Simulator，支持多步且以动作为条件的轨迹展开，并满足长期一致性与特定领域的法则约束）；L3进化者（Evolver，具备完整的闭环诊断机制，能在预测持续失效时基于新收集的真实环境证据自主修正模型的底层架构与运行规则）。研究结果揭示了现有生成式系统多停留在L1或L2阶段，并指出未来实现L3级系统不仅需要隐空间动态模型作为基础脚手架，更依赖明确且可自主修改的符号或结构化表征。该综述还提出了以决策为中心的评估原则，为评估多模态代理系统的长期规划能力指明了方向。

#大模型技术 #跨学科整合 #代理人工智能 #世界模型 #强化学习

阅读更多：

Chu, Meng, et al. “Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond.” arXiv:2604.22748, arXiv, 24 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.22748

减少47%无效调用，新型框架让大型推理模型学会适时检索

针对推理模型极易产生长链事实幻觉且难以适配现有检索系统的问题，Dongxin Guo、Jikun Wu与Siu Ming Yiu（香港大学等）开发出ReaLM-Retrieve框架，成功实现动态知识注入。

研究团队设计了名为ReaLM-Retrieve的自适应框架，其核心创新在于推理步级别的不确定性检测。相较于传统的词元级触发，该方法引入了推理步不确定性得分（Reasoning Step Uncertainty Score，一种结合口语化置信度、实体熵和一致性信号以精准定位逻辑推演知识缺口的综合度量）。随后，团队通过强化学习训练出干预策略，以自主决定检索时机与查询构建。为降低长文本交互开销，研究采用隐式压缩（implicit compression，提取高相关性句子缩减上下文）与推测性缓存（speculative caching，基于已检出实体预测并提前执行下一步检索）机制，并在开源模型中保留键值缓存。实验表明，在三个多跳问答基准测试中，该方法相较标准检索平均绝对提升了10.1%的F1得分；在极具挑战的MuSiQue数据集中，单题平均仅需1.8次检索即可达71.2%的F1得分，比固定频率检索减少47%的调用，单次检索耗时更降低3.2倍。研究发表在 Proceedings of the 49th International ACM SIGIR Conference on Research and Development in Information Retrieval 上。

#大模型技术 #意图与决策 #检索增强生成 #信息检索 #自适应检索

阅读更多：

Guo, Dongxin, et al. “When to Retrieve During Reasoning: Adaptive Retrieval for Large Reasoning Models.” 29 Apr. 2026. arXiv.org, https://doi.org/10.1145/3805712.3809722

协同进化的大模型决策与技能库智能体突破长期任务瓶颈

针对大语言模型在长期交互任务中难以自主发现和复用技能从而导致决策不连贯的问题，马里兰大学和南加州大学等机构的Xiyang Wu和Zongxia Li等研究团队提出了一种名为COS-PLAY的协同进化框架。该成果成功让大语言模型在单人游戏中实现了超过百分之二十五点一的性能提升，并显著增强了技能的长效复用能力。

为了探究决策模型与技能库联合学习的效果，研究团队构建了包含决策智能体（Decision Agent，即负责环境交互与动作生成的大模型模块）和技能库智能体（Skill Bank Agent，即负责处理经验并提炼可复用模块的后台程序）的双轨框架。在执行任务时，决策智能体会根据当前状态和内部意图状态（intention state，即智能体对环境的内部战略解释与战术聚焦）从动态技能库中检索合适的结构化技能（structured skills，即包含前提条件和执行计划的可复用行为模块），并据此生成具体操作。同时，技能库智能体会对未标注的交互轨迹进行无监督的分割，提取新的可复用技能，并学习技能契约（skill contracts，即执行特定技能后预期的环境状态变化规律）。通过组相对策略优化，两个智能体形成闭环协同进化。实验在六个需要多步推理的游戏环境中展开，结果表明，使用8B参数基础模型的COS-PLAY框架在单人游戏中比四种前沿大语言模型基线的平均奖励大幅提高，并在多人社交推理任务中保持了极强的竞争力。这种从自身经验中自动提炼并维护技能库的机制，极大改善了模型在复杂环境中的长期控制和适应能力。

#大模型技术 #意图与决策 #智能体开发 #强化学习 #长期决策

阅读更多：

Wu, Xiyang, et al. “Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks.” arXiv:2604.20987, arXiv, 22 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.20987

突破文本长度瓶颈：OCR-Memory实现智能体长周期视觉记忆提取

针对智能体难以无损存储海量历史文本的瓶颈，香港大学、北得克萨斯大学等机构的Jinze Li、Yang Zhang等人提出基于视觉模态的记忆框架。该系统将文本轨迹转为图像提取，大幅提升了任务成功率。

此项研究采用光学上下文检索记忆（OCR-Memory，将文本历史转为视觉图像以节省空间的高效存储系统）架构。研究者运用定位并转录（locate-and-transcribe，扫描图像预测锚点索引直接提取原文而非生成文本）范式，从渲染图像中精确检索信息。系统引入动态策略模拟人类记忆衰退，将旧记录压缩为低分辨率缩略图，并在命中时触发主动回忆升采样（Active Recall Upscaling，命中检索时自动恢复图像高保真细节）机制。实验显示，在AppWorld智能体基准测试中，该方法取得58.1%的平均成功率。在极严格的1024词元限制下性能依然稳健，并彻底消除幻觉现象。在高达32000词元的上下文大海捞针测试中，检索准确率维持在94.1%，视觉词元压缩率超十倍。

#大模型技术 #意图与决策 #长周期智能体 #多模态记忆

阅读更多：

Li, Jinze, et al. “OCR-Memory: Optical Context Retrieval for Long-Horizon Agent Memory.” arXiv:2604.26622, arXiv, 29 Apr. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2604.26622

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问，我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。

研究院还建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.