追问daily | 是肠道在指挥大脑让你更嘴馋；全球精神障碍患病率30年激增|脑功能|神经元|马斯克|公共卫生|材料科学|功能障碍|阿尔茨海默病

分享至

█ 脑科学动态

Science：肠道不仅负责消化，更是精准调节营养摄入的感知中枢

全球精神障碍患病率30年激增，11.7亿人受影响

经皮耳迷走神经刺激改善行动不便患者的康复治疗

24小时血压变异性过大可破坏血脑屏障并加速认知衰退

急性心肌梗死的神经代价：甲基乙二醛诱发脑干炎症

绝经后脑雌激素流失改变细胞外基质，加剧女性阿尔茨海默病风险

█ AI行业动态

几百美元破解56年数学谜题：谷歌AI一口气解决了9道悬赏题

马斯克1.5万亿参数Grok 5曝光，灌入海量Cursor数据

█ AI驱动科学

将代码作为智能体脚手架：迈向可执行、可验证和状态化的AI智能体系统

机器学习预测全新镓基电子材料

安全微调究竟改变了什么？靶向神经元揭示模型内部转化

MeMo框架为大模型打造专属外挂记忆

懂得知之为知之：MetaCogAgent框架赋予AI智能体元认知能力

AI客服穿帮会让顾客感到毛骨悚然

大模型能预知科学未来吗？新基准CUSP揭示前沿模型预测局限

智能体技能优化器SkillOpt：像训练神经网络一样优化提示词

脑科学动态

Science：肠道不仅负责消化，更是精准调节营养摄入的感知中枢

动物缺乏蛋白质时如何精准寻找必需营养素？Boram Kim与SUH Seong-Bae等研究人员（韩国基础科学研究院等机构）揭示了肠道感知营养缺乏并引导大脑改变摄食偏好的机制，发现了由神经与激素共同介导的全新肠脑交互通路。

▷ 蛋白质缺乏会触发果蝇肠道上皮细胞释放肽 CNMa，从而启动肠-脑通讯。这种肠-脑信号传导建立了一个正反馈回路，维持神经元活动和 CNMa 的产生。Credit:Institute for Basic Science

研究团队利用果蝇和小鼠模型展开实验。当果蝇缺乏膳食蛋白质时，其肠道细胞会释放一种多肽激素CNMa。该过程包含两条互补路径：第一条是快速神经回路，CNMa激活特定的肠神经元，直接向大脑传递氨基酸缺乏信号；第二条是较慢的激素路径，CNMa进入血液循环到达大脑，持久维持动物对必需氨基酸的强烈食欲。此外，CNMa信号还会抑制大脑中的DH44糖敏感神经元，使受试动物对碳水化合物失去兴趣，进而优先摄取蛋白质。小鼠实验证实该机制在哺乳动物中高度保守，即使小鼠缺乏FGF21（fibroblast growth factor 21，一种长期被认为在控制蛋白质摄入中起核心作用的内分泌激素），它们依然对特定氨基酸表现出显著偏好。这表明生物体内存在此前未知的独立营养感知系统，为肥胖与代谢障碍的干预提供了全新切入点。研究发表在 Science 上。

#疾病与健康 #神经机制与脑功能解析 #肠脑轴 #营养选择 #摄食行为

阅读更多：

Kim, Boram, et al. “Complex Interplay of Neuronal and Hormonal Gut-Brain Responses to Essential Amino Acid Deficit.” Science, vol. 392, no. 6800, May 2026, p. eadv3355. science.org (Atypon), https://doi.org/10.1126/science.adv3355

全球精神障碍患病率30年激增，11.7亿人受影响

精神障碍已成为全球人口致残的主要原因之一，但其过去几十年的流行趋势和疾病负担演变情况仍需更精确的量化评估。GBD 2023 Mental Disorder Collaborators基于大规模的全球数据整合，系统揭示了过去三十年间全球精神障碍患病率的大幅上升情况，强调了应对全球心理健康危机的迫切需求。

该项研究基于2023年全球疾病负担数据的系统分析，采用贝叶斯元回归分析，对包含抑郁、焦虑、精神分裂症等在内的12种精神障碍进行了评估。研究通过疾病权重计算了患病率及伤残调整生命年（DALYs，即因早死或残疾而损失的健康生命年）。结果显示，2023年全球精神障碍患者高达11.7亿，相较1990年病例数猛增百分之九十五点五，年龄标准化患病率上升百分之二十四点二。其中，重度抑郁和焦虑障碍的增幅最为显著。精神障碍贡献了全球疾病总负担的百分之六点一，从1990年的第十二位跃升至全球第五大疾病负担来源。从人口学特征来看，女性的精神疾病负担显著高于男性；而在年龄分布上，该负担在15至19岁青少年群体中达到顶峰。这些数据凸显了精神健康问题的严重性及跨越地域的普遍性，特别是在中低收入国家，亟需建立更完善的公共监测与预防治疗体系。研究发表在 The Lancet 上。

#疾病与健康 #心理健康与精神疾病 #公共卫生 #全球疾病负担 #流行病学

阅读更多：

Santomauro, Damian F., et al. “Updated Trends in the Global Prevalence and Burden of Mental Disorders, 1990–2023: A Systematic Analysis for the Global Burden of Disease Study 2023.” The Lancet, vol. 407, no. 10543, May 2026, pp. 2040–64. www.thelancet.com, https://doi.org/10.1016/S0140-6736(26)00519-2

经皮耳迷走神经刺激改善行动不便患者的康复治疗

针对行动不便患者的神经康复干预中经皮耳迷走神经刺激如何与运动系统相互作用这一问题，苏黎世联邦理工学院的Cléo Perrin、Dane Donegan和Paulius Viskaitis团队开展了实验研究。结果表明，与运动同步的经皮耳迷走神经刺激能够选择性地激活受试者大脑的运动相关回路，而不会产生广泛且非特异性的自主生理激活效应。

▷ 示意图展示了手指敲击实验的装置，包括参与者佩戴的用于测量脑电活动的帽子、耳内迷走神经刺激电极的放置位置，以及计算机如何引导参与者完成任务并捕捉其手指运动。Credit: JNeurosci (2026).

研究团队开展了两组实验，共招募36名健康受试者。在首个实验中，计算机系统随机指示受试者敲击手指或保持静止，同时施加两秒钟的经皮耳迷走神经刺激（taVNS，一种通过耳部皮肤微电流作用于迷走神经末梢的非侵入性神经调节手段）。结果显示，在受试者运动期间同步施加taVNS，其脑电图感觉运动活动显著增加；而将电极移至耳垂对照组则无此增强效果。在刺激期间，受试者瞳孔出现明显的相位性扩张，表明中枢神经受到唤醒，但心率和皮肤电反应等自主神经指标并未受到运动本身之外的额外影响。为进一步验证这种运动状态依赖的特异性，第二项实验在受试者保持静止时，利用经颅磁刺激激活运动通路，发现同步施加taVNS能瞬时提高皮质脊髓的兴奋性，诱发了更强的手指肌肉收缩反应。该研究证实了短暂的外周神经刺激能精准放大执行任务时的运动回路信号，为优化结合物理治疗的神经康复策略提供了重要的机制依据。研究发表在 JNeurosci 上。

#疾病与健康 #神经调控 #运动康复 #非侵入性干预 #脑科学

阅读更多：

Perrin, Cléo, et al. “Transcutaneous Auricular Vagus Nerve Stimulation during Movement Selectively Activates Motor Circuitry without Additional Cortical or Autonomic Effects.” Journal of Neuroscience, May 2026. Research Articles. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.2251-25.2026

24小时血压变异性过大可破坏血脑屏障并加速认知衰退

全天候的血压波动会如何影响大脑？Madeline Gibson和Matthew Paul Pase等（莫纳什大学）发现，24小时内血压频繁波动与大脑认知能力变差及早期脑血管损伤密切相关。

研究团队对225名55至80岁无痴呆症的社区居民进行了横断面分析。利用连续动态血压监测（ambulatory BP monitoring，一种随身佩戴并在全天候自动定时测量血压的便携医疗设备）追踪参与者的血压变异性。同时结合神经心理学测试与多模态磁共振成像技术，评估其认知功能与大脑微观结构变化。

结果显示，24小时及清醒时的血压波动越大，参与者的整体认知与执行功能越差，这种功能减退程度约等同于大脑额外衰老七年。较高的24小时平均血压与脑白质高信号显著相关；而高频率的血压波动还会直接导致血脑屏障的通透性增加与完整性受损。此外，携带APOE ε4基因（一种显著增加阿尔茨海默病发病率的遗传变异因子）的人群对血压波动引起的结构性脑损伤更为敏感。研究发表在 Neurology 上。

#疾病与健康 #健康管理与寿命延长 #心血管健康 #认知衰退 #脑科学

阅读更多：

Gibson, Madeline, et al. “Association of 24-Hour Blood Pressure Variability With Cognition and Brain MRI Markers of Structural Change in Adults in Mid- to Late-Life.” Neurology, vol. 106, no. 10, May 2026, p. e214935. neurology.org (Atypon), https://doi.org/10.1212/WNL.0000000000214935

急性心肌梗死的神经代价：甲基乙二醛诱发脑干炎症

心肌梗死不仅损害心脏，还会大幅增加抑郁和认知衰退等神经系统疾病的风险，但其心脑相互作用的特定分子驱动因素仍不清晰。Ramis Ileri、Xixi Guo 和 Erik J. Suuronen（渥太华大学心脏研究所）发现心脏组织受损后释放的高活性毒性分子会迅速在大脑中积聚并引发严重的神经炎症，揭示了由于心脏病发作增加长期神经系统疾病风险的新途径。

▷ (A) 对小鼠进行冠状动脉结扎手术以诱导心肌梗死，并在心肌梗死后 6 小时和 7 天收集脑组织。(B) 将脑组织解剖成五个不同的区域，并制备用于分子分析或固定用于免疫组织化学分析。Credit: Advanced Science (2026).

研究人员对小鼠进行了冠状动脉结扎手术以诱发心肌梗死（MI），并在术后6小时和7天收集脑组织。通过将大脑分为脑干、大脑皮层和海马体等五个区域进行分子分析，结果表明，心脏受损后产生的高活性副产物甲基乙二醛（MG）会在血液中大量积聚并迅速侵入大脑。其中，脑干区域的MG积累量最高。这种毒性积累触发了剧烈的神经炎症，主要表现为晚期糖基化终末产物受体（RAGE，一种介导炎症和细胞损伤的细胞表面受体蛋白）的异常激活、炎症因子核因子κB的表达增加，以及小胶质细胞的大量活化。此外，该病理过程具有显著的性别差异，雄性小鼠在绝大多数脑区中的MG积累量和炎症程度均远高于雌性。目前研究团队已开发出一种专门捕获MG的肽类候选药物，期望借此保护脑功能并降低患者未来的心脏事件风险。研究发表在 Advanced Science 上。

#疾病与健康 #神经机制与脑功能解析 #心脑轴 #神经炎症 #甲基乙二醛

阅读更多：

Ileri, Ramis, et al. “Methylglyoxal Accumulation Is Associated with Brain Inflammation after Myocardial Infarction with Sex and Regional Differences.” Advanced Science, n/a, no. n/a, p. e22584. Wiley Online Library, https://doi.org/10.1002/advs.202522584

绝经后脑雌激素流失改变细胞外基质，加剧女性阿尔茨海默病风险

为什么阿尔茨海默病在女性群体中更为高发？绝经后雌激素水平下降是否是引发认知衰退的关键？西北大学（Northwestern University）的Hongxin Dong、Serdar E. Bulun和Hong Zhao团队发现，大脑局部雌激素的流失会特异性地改变老年女性大脑的细胞外基质，从而损害记忆功能，这为理解女性高发脑部疾病提供了重要生物学证据。

该研究团队使用了基因工程小鼠模型，将小鼠全身或仅在大脑中敲除芳香化酶。研究人员对比了年轻与老年以及雄性与雌性小鼠在脑雌激素流失后的表现。行为学实验显示，仅有老年雌性小鼠在脑雌激素缺失后出现了空间工作记忆和社交互动行为的损伤，且全身缺失雌激素的雌鼠表现出抑郁样行为，而雄鼠未出现这些年龄和雌激素依赖性的明显损伤。进一步对海马体进行RNA测序分析发现，大脑特异性缺乏雌激素的老年雌性小鼠，其细胞外基质相关通路高度富集，且相关基因表达显著上调。研究表明，女性在老年时期对大脑局部雌激素流失极其敏感，这种流失直接导致了占据大脑体积近五分之一的细胞间隙环境发生改变，进而引发认知衰退。这一发现不仅解释了性别差异在发病中的作用，也提示未来可开发靶向修复脑部支撑环境的全新干预策略。研究发表在 Aging Cell 上。

#疾病与健康 #神经机制与脑功能解析 #阿尔茨海默病 #雌激素 #细胞外基质

阅读更多：

Piehl, Natalie C., et al. “Loss of Brain-Derived Estrogen Is Associated With Sex- and Age-Dependent Alterations in Memory, Affective Behavior, and Hippocampal Extracellular Matrix Gene Expression.” Aging Cell, vol. 25, no. 6, 2026, p. e70551. Wiley Online Library, https://doi.org/10.1111/acel.70551

AI 行业动态

几百美元破解56年数学谜题：谷歌AI一口气解决了9道悬赏题

继OpenAI之后，谷歌DeepMind团队发布了由Gemini驱动的智能体框架AlphaProof Nexus，一口气解决了9道悬置多年的埃尔德什（Paul Erdős）开放问题。这些难题分别被搁置了56年、30年和34年之久，涉及数论、组合几何等深奥领域。例如，1970年提出的Erdős #12要求构造一个无限整数集合，其中任意三个数之间一个数不能整除另外两个数的和，同时保持一定密度；AlphaProof Nexus利用中国剩余定理将其拆解为独立区块后巧妙构造出完整解。此外，该系统还证明了OEIS（在线整数序列百科全书，一个收录整数序列的数据库）中的44个猜想、攻克了一道搁置15年的代数几何难题，并改进了凸优化领域沿用已久的理论边界。

AlphaProof Nexus的核心架构简单而高效：由Gemini 3.1 Pro大模型生成Lean（一种交互式定理证明器）语言的证明步骤，随后交由Lean编译器逐行校验，一旦报错便反馈给模型修改，循环往复直至通过。研究团队设计了四个由简到繁的智能体，令人意外的是，功能最简单的Agent A——仅靠大模型加编译器反馈循环，无需进化算法或专项强化学习工具——便成功解出了全部9道题，每道题的成本仅需几百美元。团队认为，这得益于Gemini 3.1 Pro本身强大的推理能力以及Lean编译器提供的精准纠错反馈。这套开源方案预示，未来随着大模型能力提升，复杂的多工具组合可能不再是解决顶尖数学难题的刚需。菲尔兹奖得主陶哲轩曾预估AI解决埃尔德什问题的成功率为1-2%，此次AlphaProof Nexus从353道题中解出9道，恰好印证了这一比例。

#AlphaProofNexus #埃尔德什难题 #AI数学证明 #谷歌DeepMind #Lean编译器

阅读更多：

https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

马斯克1.5万亿参数Grok 5曝光，灌入海量Cursor数据

深夜，马斯克亲自宣布，xAI已完成内部代号为V9-Medium的Grok基座模型训练，参数量高达1.5万亿，是当前在役模型的整整三倍，预计2至3周后以“Grok 5”之名向公众发布。为提升模型的编程能力，xAI在训练中注入了海量来自AI编程工具Cursor的真实人机协作数据，包括开发者的提示词设计、代码编辑、调试过程和多文件协作记录。马斯克直言此举将大幅增强Grok的编程实力，意图借此追赶OpenAI与Anthropic在该领域的领先地位。与此同时，xAI还推出了终端级编程智能体Grok Build，支持最多8个子智能体并行工作，并原生兼容竞品Claude的配置文件，展现出务实且激进的生态策略。

这并非马斯克在编程赛道的单一动作。此前，SpaceX已通过协议锁定以600亿美元收购Cursor的期权，旨在深度融合分发渠道与数据资源。这三步棋——锁定分发、注入私有数据、发布智能体入口——共同构成了xAI在AI编程领域全面突围的组合拳。尽管Grok 4系列在编程基准测试SWE-bench Verified上（72%-75%）仍明显落后于GPT-5.5（88.7%）和Claude Opus 4.6（80.8%），企业采用率也仅有6%，但三倍参数规模叠加独家真实编程工作流数据，市场普遍预期Grok 5可能带来质的飞跃。这一发布时点恰逢SpaceX即将于6月12日进行史上最大IPO，并与OpenAI、Anthropic、谷歌的下一代模型（GPT-5.6、Claude Opus 4.8、Gemini 3.5 Pro）形成了正面碰撞。6月将成为2026年AI领域最激烈的一场混战，而马斯克正试图证明，xAI不仅还在牌桌上，手里更握着不止一张王牌。

#Grok5 #AI编程 #Cursor #马斯克 #xAI

阅读更多：

https://x.com/elonmusk/status/2058787384364265734

AI 驱动科学

将代码作为智能体脚手架：迈向可执行、可验证和状态化的AI智能体系统

如何将大语言模型转化为能够在长周期任务中可靠执行和保持状态的智能体？Xuying Ning和Katherine Tieu等（伊利诺伊大学厄巴纳-香槟分校、Meta、斯坦福大学）提出将代码作为智能体基础架构的统一视角，为构建可执行、可验证和状态化的智能体系统提供了系统的路线图。

研究团队提出代码即智能体脚手架（Code as Agent Harness）的全新概念，将代码视为智能体推理、行动和适应的运行媒介，而不仅是最终生成产物。研究围绕三个层次展开系统分析：首先是脚手架接口，探讨代码如何通过可执行程序、工具调用和状态追踪将智能体与推理、行动及环境建模相连；其次是脚手架机制，剖析了支持智能体长期运行的规划、记忆、工具使用以及基于反馈的控制与优化策略；最后是脚手架扩展，分析了在多智能体系统中，如何利用共享的代码工件支持角色协作和集体验证。

研究结果总结了该框架在代码助手、图形用户界面自动化、具身智能体以及科学发现等领域的应用，并指出了未来面临的核心挑战。这些挑战包括在不完整反馈下进行验证、确保改进过程无退化现象（regression-free）、维持多智能体间共享状态的一致性，以及在关键安全操作中引入人类监督。该综述重塑了代码在系统中的角色，为开发更可靠的闭环智能体行为提供了理论指导。

#大模型技术 #计算模型与人工智能模拟 #智能体系统 #代码推理 #多智能体协作

阅读更多：

Ning, Xuying, et al. “Code as Agent Harness.” arXiv:2605.18747, arXiv, 18 May 2026. arXiv.org, https://doi.org/10.48550/arXiv.2605.18747

机器学习预测全新镓基电子材料

寻找未来半导体的全新材料组合通常需要耗费巨大的时间与资金，如何在数百万种潜在配方中精准且快速地定位具有特定物理特性的新材料是一个严峻挑战。阿联酋哈利法大学与弗林德斯大学的 Tarek Khater 和 Vi-Khanh Truong 等人构建了一个智能材料发现平台，成功绕过繁琐的传统测试环节，预测出多个化学性质稳定且现有数据库中不存在的全新含镓半导体候选材料。

▷ Credit: ACS Materials Letters (2026).

传统发现半导体材料的方法高度依赖实验室试错或计算成本高昂的密度泛函理论（DFT），效率极低。为突破这一瓶颈，研究团队利用大型数据库中的已知材料训练了多个人工智能系统，发现K近邻算法作为代理模型表现最佳，其决定系数（R2）达到了0.812。基于此，研究人员引入了贝叶斯优化来反向设计带隙在0.5至3.5电子伏特范围内的含镓化合物。为防止系统凭空生成毫无现实依据的配方，框架中嵌入了SMACT机制，强制审查生成的配方是否符合电荷平衡和物理合理性。实验分析表明，该系统推荐的全新配方与训练数据相比具有百分之百的新颖性，显著减少了无效的实验验证工作。研究发表在 ACS Materials Letters 上。

#AI驱动科学 #自动化科研 #机器学习 #材料科学 #半导体

阅读更多：

Khater, Tarek, et al. “Bayesian Optimization-Guided Discovery of Gallium-Containing Semiconductors with Targeted Band Gaps.” ACS Materials Letters, vol. 8, no. 5, May 2026, pp. 1375–81. ACS Publications, https://doi.org/10.1021/acsmaterialslett.5c01482

安全微调究竟改变了什么？靶向神经元揭示模型内部转化

大模型拒绝有害请求的机制一直未明，且现有引导方法极易损害模型输出质量。Sam Herring、Jake Naviasky和Karan Malhotra（努斯研究）提出新型靶向神经元调节技术，揭示了安全微调对底层机制的重塑，实现了无损输出质量的精准模型行为干预。

研究团队提出了对比神经元归因（Contrastive Neuron Attribution，一种通过对比正负样本提示词来定位关键网络节点的无需辅助训练的技术）方法。通过向模型输入有害与良性提示词，研究人员精确定位了仅占总数0.1%的最具区分度的多层感知机神经元。在涵盖1B至72B参数的Llama和Qwen架构模型中，将这些关键神经元的激活值置零消融，可以在标准越狱基准测试中使指令微调模型的拒绝率大幅降低50%以上，同时生成连贯性始终保持在0.96以上的极高水平，彻底克服了传统残差流干预方法在高强度下会导致输出乱码退化的瓶颈。此外，在未经过对齐微调的基础模型中干预同位置的深层神经元，仅会引起话题内容的偏移，并未产生实质性的行为改变。该结果证实，安全对齐微调并没有为模型创造全新的网络判别结构，而是将预训练阶段就已经存在的深层特征辨别器转化成为了一个高度稀疏且可精准靶向调节的拒绝控制枢纽。

#大模型技术 #机制可解释性 #AI安全 #行为控制

阅读更多：

https://arxiv.org/abs/2605.12290

MeMo框架为大模型打造专属外挂记忆

大语言模型预训练后难以获取特定领域的新知识，且传统更新方法易导致模型原有能力丧失。Ryan Wei Heng Quek、Sanghyuk Lee 和 Alfred Wei Lun Leong 等（新加坡国立大学、东京大学等）针对该难题提出模块化记忆框架，在不修改模型参数的前提下，实现了新知识的高效注入与无缝集成。

研究团队将目标语料库转化为反射问答数据集（reflection QA dataset，即包含事实提取与跨文档合成等复杂推理步骤的问答对集），并采用监督微调训练了一个独立的记忆模型。在推理阶段，参数冻结的执行模型通过结构化多轮协议（structured multi-turn protocol，即分阶段将复杂问题分解为基础查询、实体识别和答案合成的交互流程）向记忆模型提取关键信息。实验表明，在多个需要长文本理解的基准测试中，该方法的准确率显著优于传统检索增强生成。在搭配Gemini模型进行测试时，其准确率最高达到百分之五十三点五八。该框架成功捕获了跨文档隐蔽联系，对检索噪声具有极强的抗干扰性，并彻底避免了灾难性遗忘。由于该框架无需访问执行模型的内部参数，支持与任何闭源大语言模型对接。采用模型合并技术在增量更新知识时，能降低百分之三十三的计算成本。

#大模型技术 #其他 #知识注入 #模块化框架 #即插即用

阅读更多：

https://arxiv.org/abs/2605.15156

懂得知之为知之：MetaCogAgent框架赋予AI智能体元认知能力

多智能体大模型系统常因缺乏对自身能力边界的认知而导致过度自信并引发执行错误。Chenyu Wang和Yang Shu（浙江大学）团队受认知科学元认知理论启发，开发了一种名为MetaCogAgent的多智能体大模型框架。该框架赋予智能体自我评估与自适应任务派发能力，显著提升了复杂任务的协同效率。

在这项研究中，研究团队为每个智能体配备了元认知自我评估单元（Metacognitive Self-Assessment Unit，用于在执行前评估任务与能力的匹配度）。该框架结合了口头置信度（verbalized confidence）和基于历史表现的画像置信度（profile-based confidence）来计算综合得分，并在两个信号冲突时动态调整派发阈值。若得分低于阈值，则触发自适应派发协议将任务转交给更合适的智能体。在包含700个任务的MetaCog-Eval基准测试中，MetaCogAgent达到了82.4%的准确率，比主流的AutoGen框架高出8.7%，且API调用次数减少了5%。此外，其期望校准误差（Expected Calibration Error，简称ECE，用于衡量置信度与实际准确率的一致性）低至0.087，证明智能体能可靠评估自身能力。

#认知科学 #大模型技术 #多智能体系统 #元认知

阅读更多：

https://arxiv.org/abs/2605.17292

AI客服穿帮会让顾客感到毛骨悚然

AI聊天机器人已成为酒店预订服务的重要工具，但若其表现不佳，可能会适得其反。Babak Taheri 团队（德克萨斯农工大学等）对此进行了深入研究，揭示了不完美的人工智能互动如何引发消费者的毛骨悚然感，进而导致其放弃预订。Method-Result:研究团队基于消费者心理学中的刺激-有机体-反应（Stimulus-Organism-Response，简称 SOR，用于解释外部环境刺激如何影响个体心理并决定其最终行为）模型，对340名使用过聊天机器人预订酒店的英国成年人进行了调查。

结果显示，当聊天机器人表现出信息缺乏可信度、不准确性和不称职时，用户会产生强烈的心理不适。其中，回答错误对用户的负面刺激最强，其路径系数是缺乏可信度的四倍以上。这种不安感令用户继续互动的意愿降低近38%，并使延迟或放弃预订的概率几乎翻倍。此外，研究还发现了恐怖谷效应，当机器人过度模仿人类语气却给出错误价格或回避问题时，会引发用户的威胁反应。然而，若机器人在开始时主动披露其人工智能身份，能有效降低因回答不准确带来的反感。研究发表在 International Journal of Hospitality Management 上。

#认知科学 #其他 #人机交互 #消费者心理学 #人工智能

阅读更多：

Akhtar, Naeem, et al. “Unveiling the Role of Chatbot Conversational Attributes of Hospitality Booking Platforms in Developing Users’ Creepiness and Paradoxical Behaviors.” International Journal of Hospitality Management, vol. 133, Feb. 2026, p. 104428. ScienceDirect, https://doi.org/10.1016/j.ijhm.2025.104428

大模型能预知科学未来吗？新基准CUSP揭示前沿模型预测局限

AI已深度融入科学发现，但其能否前瞻性地预测科学本身的未来走势仍是未知。Sean Wu、Pan Lu、Yupeng Chen、Jonathan Bragg、Yutaro Yamada、Peter Clark、David Clifton、Philip Torr、James Zou和Junchi Yu（牛津大学、斯坦福大学、艾伦人工智能研究所与Sakana AI）构建了CUSP评估框架，发现当前前沿大模型在预测科学突破的可行性与具体发生时间上存在明显的系统性局限。

该研究团队构建了名为截断条件未见科学进展（Cutoff-conditioned Unseen Scientific Progress，通过严格限制模型获取其截止日期后的信息来客观评估预测能力的测试框架）的评估基准，包含4760项科学里程碑和17429个多维度预测任务。研究人员测试了多款前沿大语言模型，结果显示，虽然模型在多项选择题中展现出较好的机制推理能力，GPT-5.4的准确率达到了0.819，但所有模型在预测科学声明是否能实现的二分类任务中表现惨淡，准确率在0.453至0.519之间，接近随机概率。此外，即使通过限制性检索提供截止前的历史知识，模型与拥有完整事后信息的条件之间仍存在显著的预测差距，且这一差距在面对高影响力的突破时更为突出。

#AI驱动科学 #预测模型构建 #跨学科整合 #大模型技术

阅读更多：

Wu, Sean, et al. “Forecasting Scientific Progress with Artificial Intelligence.” arXiv:2605.22681, arXiv, 21 May 2026. arXiv.org, https://doi.org/10.48550/arXiv.2605.22681

智能体技能优化器SkillOpt：像训练神经网络一样优化提示词

如何实现人工智能智能体技能的稳定演化一直是个难题。Yifan Yang、Ziyang Gong、Weiquan Huang、Qihao Yang、Ziwei Zhou、Zisu Huang、Yan Li、Xuemei Gao、Qi Dai、Bei Liu、Kai Qiu、Yuqing Yang、Dongdong Chen、Xue Yang、Chong Luo（微软、上海交通大学、同济大学、复旦大学）开发了名为 SkillOpt 的新型文本空间优化器，成功实现了智能体技能的自动可控演化与显著性能提升。

该方法将智能体技能视为外部文本状态，利用边界模型将运行轨迹转化为针对文档的结构化编辑。其核心在于引入文本学习率以控制更新幅度，并设计持留验证门控（held-out validation gate，即仅接受能提升验证集得分的修改准入机制）确保更新稳定性，同时将未通过的修改存入缓存作为负反馈。在 6 个涵盖问答、表格和数学的基准测试中，该方法在 7 个目标模型和 3 种框架下的 52 项评估中均取得最佳或并列第一的成绩。在 GPT-5.5 上，它在直接对话中将平均准确率提升了 23.5 个百分点，在智能体循环中提升了 24.8 个百分点，并在跨模型与跨框架迁移中表现出优异的泛化能力。

#大模型技术 #大模型技术 #智能体 #文本空间优化 #自演化技能

阅读更多：

Yang, Yifan, et al. “SkillOpt: Executive Strategy for Self-Evolving Agent Skills.” arXiv:2605.23904, arXiv, 25 May 2026. arXiv.org, https://doi.org/10.48550/arXiv.2605.23904

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问，我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。

研究院还建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、科普视频媒体「大圆镜」等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.