追问daily | 记忆是幻觉吗？新框架解析玻尔兹曼大脑悖论与熵的本质；并非所有记忆都生而平等|宇宙|分形|隔离|AI|多巴胺|创造力|心理学

分享至

█ 脑科学动态

Cell：神经元利用钙离子尖峰实现大脑向量运算与高效导航

Nature：100多个新基因区域证实精神分裂症跨种族生物学机制

区分同卵双胞胎准确率达97%，大脑形状受遗传高度调控

并非所有记忆都生而平等：动机“情绪”如何重塑大脑记忆模式

优势者独处睡得香，从属者隔离易失眠

截短与磷酸化协同作用：科学家绘制路易体形成新路线

严格身材管理的正常体重少女面临更高心理风险

记忆是幻觉吗？新框架解析玻尔兹曼大脑悖论与熵的本质

█ AI行业动态

谷歌Gemini接入SAT全真模考，深化垂直领域布局

AAAI 2026大奖揭晓

█ AI驱动科学

人工智能在发散性创造力任务中超越人类平均水平

AI揭示情绪构建机制：多模态数据验证“情绪建构理论”

AI透明度需求取决于用户期望：一项在线约会实验研究

平均值掩盖真相：AI模型在新环境下的隐形失效风险

路标文字也能劫持机器人：具身AI的新型安全漏洞

AI利用新生儿足跟血预测早产儿健康轨迹，准确率超85%

百万级播客数据揭示：商业与体育圈层封闭，社会议题跨界传播

智能体推理：大语言模型向自主行动者的进化路线图

脑科学动态

Cell：神经元利用钙离子尖峰实现大脑向量运算与高效导航

动物如何将不断变化的感官输入转化为稳定的导航地图？Itzel G. Ishida、Sachin Sethi和Gaby Maimon团队（洛克菲勒大学）通过研究果蝇大脑揭示了一种惊人的高效策略：神经元利用非常规的电信号模式进行数学运算。研究发现，果蝇大脑中的特定神经元不仅在兴奋时传递信号，在受到抑制时也能通过钙离子尖峰进行编码，从而利用更少的神经细胞完成复杂的向量计算，这一发现挑战了神经元仅在兴奋时进行有效通讯的传统观点。

▷ 图示神经元群体如何利用双重信号传导能力反转以正弦波形式编码的向量。Credit: Maimon lab / Rockefeller University

研究团队构建了一个虚拟现实系统，监测果蝇在应对不同风向时的神经活动。他们聚焦于一种名为PFNa的神经元，发现这些细胞具有独特的“双重人格”：当接收到兴奋信号时，它们发射常规的快速钠离子尖峰；而当接收到抑制信号时，它们并不像普通神经元那样保持沉默，而是发射较慢的钙离子尖峰。这种机制使得同一群神经元能够同时编码一个向量及其反向向量，即用两组神经元就能替代传统模型中所需的四组神经元来表示所有风向。进一步研究证实，这种钙离子尖峰依赖于T型钙通道，这表明大脑利用分子层面的生物物理特性实现了高效的数学运算。这也暗示了通常被认为与睡眠相关的慢波信号，在清醒状态下同样对认知和导航至关重要。研究发表在 Cell 上。

#神经科学 #神经机制与脑功能解析 #钙离子通道 #向量计算 #果蝇

阅读更多：

Ishida, Itzel G., et al. “Neuronal Calcium Spikes Enable Vector Inversion in the Drosophila Brain.” Cell, vol. 0, no. 0, Dec. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.11.040

Nature：100多个新基因区域证实精神分裂症跨种族生物学机制

长期以来，精神分裂症的遗传学研究过度集中于欧洲血统人群，这种偏差限制了对该疾病全球普遍机制的理解。为了填补这一空白，西奈山伊坎医学院的Panos Roussos和Tim B. Bigdeli等人利用百万退伍军人计划的数据，针对非洲血统人群开展了迄今为止规模最大的全基因组关联研究，成功揭示了跨越种族的共同生物学基础。

▷ 精神分裂症中细胞类型特异性遗传模式和疾病调控。Credit: Nature (2026).

该研究团队分析了“百万退伍军人计划”（Million Veteran Program）中美国非洲血统退伍军人的电子健康记录与基因组数据。通过采用全基因组关联研究（GWAS）方法，并结合统计学精细映射与综合转录组学分析，研究人员深入剖析了精神分裂症的遗传架构。结果显示，研究人员在人类基因组中发现了超过100个此前未被明确识别的与精神分裂症相关的新区域，这些区域在非洲血统人群中更为常见。尽管特定基因位点的变异在不同族裔间存在差异，但研究证实这些变异最终扰乱的是相同的核心基因和大脑细胞类型。这一发现表明，精神分裂症在生物学层面上具有全球一致性，同时也强调了在遗传研究中纳入多样化样本对于开发公平、精准的医疗工具的重要性。研究发表在 Nature 上。

#疾病与健康 #个性化医疗 #精神分裂症 #全基因组关联研究 #遗传多样性

阅读更多：

Bigdeli, Tim B., et al. “Biological Insights into Schizophrenia from Ancestrally Diverse Populations.” Nature, Jan. 2026, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-10000-6

区分同卵双胞胎准确率达97%，大脑形状受遗传高度调控

传统观点常通过大脑体积增长来评估新生儿发育，但大脑几何形态的变化是否蕴含更多关键信息？Stephan Krohn和Carsten Finke等（柏林夏里特医学院）研究团队通过一项大规模研究发现，新生儿大脑形状的复杂性是反映其发育成熟度和遗传特征的更优指标。这一发现揭示了大脑形状的形成是早期发育的基本过程，为理解神经发育提供了全新的几何学视角。

▷ 大脑形状反映的是婴儿的成熟度，而不仅仅是大脑大小的差异。Credit: Nature Neuroscience (2025).

研究团队分析了来自正在开发的人类连接组计划中近800名新生儿的磁共振成像（MRI）数据，并引入了分形分析方法。通过计算分形维数，研究人员能够量化大脑皮层的折叠程度和结构复杂性。结果显示，随着婴儿的成熟，大脑皮层变得更加不规则，分形维数随之升高。相比于大脑体积、皮层厚度或脑回数量等传统指标，大脑形状在预测婴儿实际年龄方面表现出更高的准确性，平均误差仅为4天。此外，该指标还能捕捉到大脑体积数据无法反映的早产特征。在遗传学方面，大脑形状显示出极高的遗传相关性，研究人员仅凭大脑形状就能以约97%的准确率识别出同卵双胞胎。这项技术未来有望转化为临床工具，用于诊断特定的神经发育障碍和精神疾病。研究发表在 Nature Neuroscience 上。

#疾病与健康 #神经机制与脑功能解析 #新生儿发育 #分形分析 #脑科学

阅读更多：

Krohn, Stephan, et al. “Fractal Analysis of Brain Shape Formation Predicts Age and Genetic Similarity in Human Newborns.” Nature Neuroscience, vol. 29, no. 1, Jan. 2026, pp. 171–85. www.nature.com, https://doi.org/10.1038/s41593-025-02107-w

并非所有记忆都生而平等：动机“情绪”如何重塑大脑记忆模式

为什么好奇心驱使的学习与截止日期前的突击记忆截然不同？新加坡国立大学杨潞琳医学院的Poh Jia-Hou与杜克大学的R. Alison Adcock及其团队提出了一项新的神经科学框架，揭示了动机并非仅仅意味着付出更多努力，而是分为不同的“动机情绪”，它们会激活大脑中截然不同的系统，从而从根本上重塑记忆的内容和方式。

该研究整合了神经生物学、认知神经科学及心理学的广泛发现，构建了名为“神经背景”（Neural Context）的新模型。研究人员指出，神经调节系统就像开关一样调节整个大脑的学习模式。具体而言，模型区分了两种状态：一种是由多巴胺支持的“探究性情绪”，源于腹侧被盖区，它激活海马体和前额叶皮层，帮助大脑形成灵活的、整合性的记忆，适用于适应和探索；另一种是由去甲肾上腺素支持的“命令性情绪”，源于蓝斑核，它在面对危险或紧迫目标时激活杏仁核，使记忆高度聚焦于细节和即时行为，但往往牺牲了对广泛背景的理解。这一发现为教育环境的设计及针对抑郁症、多动症等动机障碍的临床治疗提供了新的科学依据。研究发表在 Annual Review of Psychology 上。

#认知科学 #记忆机制 #神经机制与脑功能解析 #多巴胺 #去甲肾上腺素

阅读更多：

Poh, Jia-Hou, and R. Alison Adcock. “Motivation as Neural Context for Adaptive Learning and Memory Formation.” Annual Review of Psychology, vol. 77, no. Volume 77, 2026, Jan. 2026, pp. 49–80. www.annualreviews.org, https://doi.org/10.1146/annurev-psych-032525-031744

优势者独处睡得香，从属者隔离易失眠

睡眠质量往往受复杂的社会因素影响，受人类“睡眠离婚”现象的启发，东京大学的林直子和林裕等人深入探究了社会等级与居住环境对个体睡眠的交互影响。研究团队利用小鼠模型发现，独处究竟能改善睡眠还是引发焦虑，很大程度上取决于个体在群体中的社会地位及其遗传背景。这一发现揭示了大脑在睡眠期间稳定内部节律的能力会受到社会环境断裂的干扰。

▷ 饲养方式的选择。(A) 确定每组小鼠的社会等级。(B) 在确定了最具优势和最弱势的小鼠后，将它们安置在相邻的饲养箱中，防止它们进行身体接触，但保持视觉和嗅觉上的社交联系。(C) 最后，将小鼠转移到完全隔离的饲养环境中。Credit: Scientific Reports (2026).

为了解开这一谜题，研究人员选取了两种具有不同社会等级强度的小鼠品系（B6和F1），并通过行为测试确定了它们在群体中的“优势”或“从属”地位。实验设计了两种环境：一种是允许视觉和嗅觉交流但无身体接触的“邻舍饲养”，另一种是完全隔绝的“单独饲养”。在邻舍饲养中，无论地位高低，小鼠的睡眠模式均无差异。然而，当转入完全隔离环境时，情况发生了逆转。对于B6品系，处于优势地位的小鼠在独处时睡眠质量显著提高，这可能意味着它们从守卫领地的压力中通过“退休”获得了释放；相反，处于从属地位的小鼠在独处时表现出快速眼动睡眠（REM sleep）增加但质量恶化的迹象，这暗示了失去同伴带来的孤独压力和安全感缺失。相比之下，遗传背景不同的F1小鼠受隔离影响较小。该研究表明，社会因素对生物节律的调节具有高度的个体差异性。研究发表在 Scientific Reports 上。

#神经科学 #心理健康与精神疾病 #社会等级 #睡眠 #隔离

阅读更多：

Hayashi, Naoko, et al. “Social Rank and Social Environment Combinedly Affect REM Sleep in Mice.” Scientific Reports, vol. 16, no. 1, Jan. 2026, p. 871. www.nature.com, https://doi.org/10.1038/s41598-025-32402-2

截短与磷酸化协同作用：科学家绘制路易体形成新路线

路易体是帕金森病患者大脑中典型的病理特征，但其形成的具体分子机制一直未被完全解开。Sneha Jos、Niharika Shivanandaswamy、Sivaraman Padavattan等研究人员发现，帕金森病特异性的蛋白变体表现出异常的结合特性，并据此提出了一种全新的“多因素随机紊乱模型”来解释这一致病过程。

▷ 路易体形成多因素随机无序模型。Credit: Commun Biol (2026).

该团队利用大肠杆菌合成了不同版本的α-突触核蛋白，重点比较了健康版本与疾病相关变体（包括C端截短和S129位点磷酸化的形式）。研究显示，正常状态下的α-突触核蛋白通过隐藏其粘性疏水核心而保持惰性与选择性。然而，疾病相关的化学变化会暴露这一核心，使蛋白质变得极具“混杂性”。实验证实，这些变体如同“分子诱饵”，能非选择性地与测试的22种细胞蛋白紧密结合。基于此发现，研究人员构建了“多因素随机紊乱模型”（Multifactorial Random Disorder Model）：高活性的截短蛋白首先通过捕获周围细胞成分形成路易体的致密核心，随后磷酸化的蛋白在周边堆积，推动其不断生长。这一模型为理解神经退行性疾病的病理演变提供了新的分子视角。研究发表在 Communications Biology 上。

#疾病与健康 #神经机制与脑功能解析 #帕金森病 #路易体 #α-突触核蛋白

阅读更多：

Jos, Sneha, et al. “Parkinson’s Disease-Specific α-Synuclein Variants Potentially Drive Lewy Body Formation by Engaging in Promiscuous and Non-Functional Interactions.” Communications Biology, Jan. 2026. www.nature.com, https://doi.org/10.1038/s42003-025-09395-9

严格身材管理的正常体重少女面临更高心理风险

看起来身材标准、生活自律的青少年真的健康吗？Dimitra Hartas（华威大学）的一项新研究揭示了令人担忧的现实：那些体重正常但通过严格饮食和运动管理身材的17岁女性，实际上是一个心理脆弱群体。研究发现，这类人群在20岁时面临更高的焦虑、抑郁和心理困扰风险，这挑战了“节食和规律运动总是健康标志”的传统观念。

▷ Credit: Current Psychology (2026).

该研究利用千禧年队列研究的数据，通过两步聚类分析将青少年分为四组，重点对比了同样是正常体重但采取不同管理策略的人群。研究人员特别关注了体重歧视和神经质特征对心理的影响。结果显示，那些致力于“健康饮食”和持续自我监测的“正常体重（节食/运动）”组，在17岁时就报告了高水平的自残和自杀意念。到了20岁，与那些对身材管理态度放松的同龄人相比，这组人群表现出显著更严重的焦虑和抑郁症状，以及更低的幸福感。这表明，在社交媒体和文化压力下，将体重视为自我价值的衡量标准，对年轻女性造成了深远的心理伤害。研究发表在 Current Psychology 上。

#疾病与健康 #心理健康与精神疾病 #身体意象 #饮食失调 #青少年发展

阅读更多：

Hartas, Dimitra. “A Cluster Analysis of Health Behaviours and Their Relationship to Weight Stigma, Neuroticism and Psychological Wellbeing in Adolescents and Young Adults: A Population-Based Study.” Current Psychology, vol. 45, no. 2, Jan. 2026, p. 163. Springer Link, https://doi.org/10.1007/s12144-025-08652-8

记忆是幻觉吗？物理学家建立新框架解析“玻尔兹曼大脑”悖论与熵的本质

我们的记忆是真实的记录，还是宇宙熵涨落产生的幻觉？为了解开这一物理学与哲学交织的难题，David Wolpert（圣塔菲研究所）、Carlo Rovelli（吕米尼理论物理中心）和Jordan Scharnhorst（加州大学圣克鲁兹分校）组成的国际研究团队，对长期存在的“玻尔兹曼大脑”假设进行了深入的数学与逻辑审查。他们通过构建新的形式化框架，揭示了统计物理学中关于时间、记忆与宇宙演化论证背后的深层结构。

这项研究聚焦于统计力学中的核心矛盾：时间对称的物理定律与时间不对称的热力学第二定律之间的张力。这种张力导致了“玻尔兹曼大脑”假说，即我们的记忆更可能源自熵的随机涨落，而非真实的过去。研究团队引入了“熵猜想”（entropy conjecture），将宇宙熵的演化视为时间对称、时间平移不变的马尔可夫过程。通过这一框架，他们发现许多反驳“玻尔兹曼大脑”的传统论据陷入了循环论证：这些论据往往预先假设了过去的低熵状态（过去假设），而这一假设本身又依赖于我们试图验证的记忆可靠性。研究结果表明，“玻尔兹曼大脑”假设与热力学第二定律在形式上是等价的，它们都依赖于在推断宇宙熵动力学时对特定时间点进行人为的“条件化”选择，而物理学本身并未规定这种选择的正确性。该研究发表在 Entropy 上。

#认知科学 #意识模拟 #玻尔兹曼大脑 #热力学第二定律 #逻辑推断

阅读更多：

Wolpert, David, et al. “Disentangling Boltzmann Brains, the Time-Asymmetry of Memory, and the Second Law.” Entropy, vol. 27, no. 12, Dec. 2025, p. 1227. www.mdpi.com, https://doi.org/10.3390/e27121227

AI 行业动态

谷歌Gemini接入SAT全真模考，深化垂直领域布局

谷歌 CEO Sundar Pichai 近日宣布，Google Gemini 已正式接入全真 SAT 模拟考试系统，这一举措被视为谷歌向教育垂直领域进军的重要一步。通过与老牌教育机构普林斯顿评论深度合作，Gemini 将验证过的全套模拟题纳入系统，用户只需在对话框输入指令，即可开启包含阅读、写作及数学的完整测试流程。该功能不仅高度还原真实的考试结构，还允许用户自定义倒计时、提示显示等配置，极大提升了备考的灵活性。尽管实测发现部分数学题目难度对中国学生而言相对较低，但 Gemini 的核心竞争优势在于其强大的“私教”能力——它能针对用户的错题，将解题思路拆解为详尽的步骤进行讲解，帮助考生精准定位薄弱环节。谷歌透露，未来还将支持更多标准化考试，试图通过引入专业数据，将 Gemini 打造成能解决具体问题的教育行家。

这一功能更新折射出谷歌清晰且宏大的商业化路径：一方面向垂直领域深度渗透，除了教育，还在健康领域通过 Fitbit 分析身体数据，在编程领域通过 Android Studio 提供代码辅助；另一方面则是将 AI 能力彻底融入用户的数字生活。最新发布的由 Gemini 3 模型驱动的“个人智能”功能，已打通 Gmail、相册、YouTube 等核心应用，能跨越应用边界串联用户的个人生活图谱。同时，Gemini 正逐步接管 Android 系统的底层入口，利用端侧模型（Gemini Nano，运行在移动设备本地的高效轻量级 AI 模型）实现屏幕感知能力，甚至已与苹果达成合作支持 iOS 系统。这种将个人数据与系统底层深度整合的策略，显示出谷歌意图通过构建无处不在的 AI 生态，在与 OpenAI 等对手的竞争中守住流量入口并拓展商业版图。

#GoogleGemini #SAT备考 #普林斯顿评论 #AI教育 #端侧模型

阅读更多：

https://blog.google/products-and-platforms/products/education/practice-sat-gemini/

AAAI 2026大奖揭晓：华人学者斩获三项杰出论文，图灵奖得主Bengio获经典论文奖

备受瞩目的 AAAI 2026（第40届AAAI人工智能年会）近日在新加坡正式开奖，公布了5篇杰出论文与2篇经典论文奖。其中，图灵奖得主 Yoshua Bengio 凭借其2011年参与的一项关于知识库结构化嵌入的研究，荣获经典论文奖。该研究通过将符号事实表示为连续向量，让神经网络能够访问结构化知识，被视为现代大语言模型及检索增强生成的奠基之作。另一篇经典论文奖则颁给了麻省理工学院团队，表彰其在机器人理解自然语言指令方面的开创性工作，该研究提出的广义接地图框架成功实现了机器人对复杂指令的动态解析与执行。

在今年的5篇杰出论文中，华人研究人员表现尤为亮眼，参与了其中3篇的创作，涵盖了具身智能、多模态大模型及图神经网络等前沿领域。香港科技大学（广州）等机构合作推出的 ReconVLA 模型，针对视觉-语言-动作模型（VLA，Vision-Language-Action Model，结合视觉感知和语言理解来控制机器人动作的模型）注意力分散的问题，提出了隐式锚定范式，显著提升了机器人的操作精度。同济大学与微软团队合作的 LLM2CLIP 通过微调大语言模型来提升 CLIP（Contrastive Language-Image Pre-training，一种连接文本和图像的跨模态预训练模型）的表征能力，大幅增强了跨模态检索性能。此外，还有研究人员提出了基于高频信息的超图神经网络框架，以及关于逻辑概念变更模型和动态系统因果结构学习的创新研究，共同展示了 AI 领域的最新突破。

#AAAI2026 #YoshuaBengio #华人学者 #杰出论文 #人工智能

阅读更多：

https://aaai.org/conference/aaai/aaai-26/award-talks/

AI 驱动科学

人工智能在发散性创造力任务中超越人类平均水平，但仍逊于顶尖创作者

生成式人工智能是否真的具有创造力？蒙特利尔大学心理学系教授 Karim Jerbi 领导的研究团队，包括AI先驱 Yoshua Bengio 等人，开展了迄今为止规模最大的人类与大型语言模型创造力对比研究。该研究结果表明，虽然AI已达到重要里程碑，但在顶尖创造力领域，人类依然占据主导地位。

为了量化比较两者的创造力，研究团队采用了发散联想任务（Divergent Association Task），这是一种要求参与者生成10个语义距离尽可能远的单词的心理学测试，用于衡量发散性思维。研究人员将GPT-4、Claude等多个大型语言模型的表现与10万名人类参与者的数据进行了对比。结果显示，部分AI模型在发散性任务和创意写作（如俳句、短篇小说）上的表现已超越人类平均水平。然而，最具创造力的一半人类参与者的表现优于所有AI模型，顶尖10%的人类创作者更是遥遥领先。此外，研究还发现，通过调整模型的“温度”或改变提示策略，可以调节并提升AI的创造力表现。这表明AI更多是服务于人类创造力的强大工具，而非取代者。研究发表在 Scientific Reports 上。

#认知科学 #大模型技术 #创造力 #人工智能

阅读更多：

Bellemare-Pepin, Antoine, et al. “Divergent Creativity in Humans and Large Language Models.” Scientific Reports, vol. 16, no. 1, Jan. 2026, p. 1279. www.nature.com, https://doi.org/10.1038/s41598-025-25157-3

AI揭示情绪构建机制：多模态数据验证“情绪建构理论”

情绪是区别人与机器的关键，但其形成机制一直未被完全量化。奈良先端科学技术大学院大学的Chie Hieida与大阪大学的Kazuki Miyazawa及Kazuki Tsurumaki合作，构建了一种计算模型来模拟人类情绪概念的形成。该研究利用多模态数据成功复现了大脑整合身体与感官信号的过程，为理解情绪本质提供了新视角。

▷ 研究人员使用多层多模态潜在狄利克雷分配模型，整合了来自人类参与者的身体信号、感觉信息和语言数据。通过从多模态数据中学习情绪概念，并评估其与人类情绪类别的一致性，该计算模型为人类情绪形成机制提供了宝贵的见解。Credit: Assistant Professor Chie Hieida / Nara Institute of Science and Technology, Japan

该研究基于情绪建构理论，即情绪是由大脑通过整合内部身体信号（内感受）和外部环境信息（外感受）即时构建的，而非与生俱来的反射。为了验证这一点，研究团队采用了多层多模态潜在狄利克雷分配模型（mMLDA），这是一种能够发现隐藏统计模式的概率生成模型。实验中，29名参与者观看了60张诱发情绪的图片，研究人员收集了他们的视觉输入、生理反应（如心率）以及对情绪的语言描述。在没有任何预设情感标签的情况下，该模型自主学习并分类了情绪模式。结果显示，模型生成的情绪概念与参与者自我报告的情绪评价一致率高达75%，显著高于随机概率。这表明模型成功模拟了人类体验情绪的方式。这一发现不仅验证了情绪建构理论的计算可行性，也为开发具备更强共情能力的交互式机器人和能够辅助心理健康监测的AI系统奠定了基础。研究发表在 IEEE Transactions on Affective Computing 上。

#AI 驱动科学 #计算模型与人工智能模拟 #情感计算 #情绪建构理论 #心理学

阅读更多：

Tsurumaki, Kazuki, et al. “Study of Emotion Concept Formation by Integrating Vision, Physiology, and Word Information Using Multilayered Multimodal Latent Dirichlet Allocation.” IEEE Transactions on Affective Computing, vol. 16, no. 4, Oct. 2025, pp. 2975–87. IEEE Xplore, https://doi.org/10.1109/TAFFC.2025.3585882

AI透明度需求取决于用户期望：一项在线约会实验研究

AI通常被视为神秘的“黑箱”，但用户真的想知道它如何运作吗？Yuan Sun、S. Shyam Sundar和 Joseph B. Walther等研究人员组成团队发现，这种需求取决于系统是否满足了用户的期望。研究表明，当算法结果符合预期时，用户并不关心背后的逻辑；但当结果出乎意料时，解释变得至关重要。这一发现挑战了“透明度总是越好”的传统观点，揭示了用户信任与期望匹配度之间的动态关系。

▷ 研究人员设计了一个人工智能驱动的约会网站，其结果可能超出或低于用户的预期。他们发现，用户预期与实际体验的匹配程度（或不匹配程度）与用户是否希望更深入了解人工智能系统的工作原理密切相关。Credit: Pennsylvania State University

为了验证这一假设，研究团队构建了一个虚构的约会网站 smartmatch.com，并招募了227名单身参与者进行测试。参与者被告知系统通常会推荐5个最佳匹配对象。实验中，系统分别向用户展示了5个（符合预期）、10个（超出预期）或2个（低于预期）匹配结果。结果显示，当获得承诺的5个匹配时，用户无需解释即可信任系统；当获得10个匹配时，一个简单的解释就能巩固信任；然而，当结果仅为2个时，用户则需要详细的解释才能维持对系统的信任。S. Shyam Sundar 指出，现有的标准化免责声明式解释往往效果不佳，企业应根据系统表现与用户预期的差距，提供以用户为中心的差异化解释。研究发表在 Computers in Human Behavior 上。

#认知科学 #其他 #人机交互 #算法透明度 #信任机制

阅读更多：

Sun, Yuan, et al. “Does Transparency Matter When an AI System Meets Performance Expectations? An Experiment with an Online Dating Site.” Computers in Human Behavior, vol. 177, Apr. 2026, p. 108875. ScienceDirect, https://doi.org/10.1016/j.chb.2025.108875

平均值掩盖真相：AI模型在新环境下的隐形失效风险

为什么在一家医院表现完美的AI医生，换到另一家医院却可能频频误诊？麻省理工学院（MIT）的Olawale Salaudeen和Marzyeh Ghassemi团队研究发现，机器学习领域长期信奉的“好学生在任何考场都是好学生”的假设存在巨大漏洞。他们证实，那些在训练数据上平均得分最高的模型，在面对新环境中的特定人群或情况时，反而可能是表现最差的，这种隐蔽的风险在过度聚合的评估指标下被掩盖了。

▷ 比较直线上的准确率 (AoTL) 和逆直线上的准确率 (AoTIL)。Credit: arXiv (2025).

该研究团队针对机器学习中的分布外（out-of-distribution）泛化问题进行了深入分析。通常，研究人员认为只要提高模型在已知数据上的表现，就能自然消除虚假相关性，即模型错误地将背景或无关标记与结果联系起来（例如把草地背景作为识别奶牛的依据）。为了验证这一点，团队开发了一种名为 OODSelect 的算法，通过训练数千个模型并对比其在不同数据分布下的表现，寻找那些违背常规规律的子集。结果发现了令人担忧的逆在线准确率现象：在胸部X光片诊断中，一些总体准确率最高的模型，在面对患有胸膜疾病或心脏扩大的患者时，诊断能力反而垫底。这意味着模型可能利用了与疾病无关的特征（如特定医院的设备标记）进行作弊。研究人员指出，如果不将这些特定子集分离出来单独评估，仅看平均分会给医疗决策带来严重的安全隐患。这项工作为未来构建更鲁棒的AI模型提供了新的评估工具和数据集。

#疾病与健康 #预测模型构建 #AI安全 #医疗诊断 #算法偏差

阅读更多：

Salaudeen, Olawale, et al. “Aggregation Hides Out-of-Distribution Generalization Failures from Spurious Correlations.” arXiv:2510.24884, arXiv, 28 Oct. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2510.24884

路标文字也能劫持机器人：具身AI的新型安全漏洞

路边的广告牌或路标上的文字是否可能成为黑客控制自动驾驶汽车的武器？针对这一安全隐患，Luis Burbano, Alvaro Cardenas, Cihang Xie（加州大学圣克鲁兹分校）以及Yinzhi Cao（约翰·霍普金斯大学）等人组成的团队进行了首个系统性研究，揭示了物理环境中的误导性文本可以成功劫持具身人工智能系统的决策，不仅在模拟环境中有效，在现实世界中同样构成威胁。

▷ 该团队在巴斯金工程2号楼内，使用一辆小型具身人工智能机器人汽车测试了他们的攻击流程。Credit: University of California - Santa Cruz

该研究针对依赖大型视觉语言模型的具身人工智能（Embodied AI）系统，开发了一种名为CHAI的攻击框架。这种攻击被称为环境间接提示注入攻击，其原理类似于诱导聊天机器人违规的语言陷阱，但发生在物理世界中。研究团队通过两步优化过程实施攻击：首先利用生成式AI设计最可能被机器执行的文字指令，其次调整这些文字在环境中的颜色、大小和位置。在测试中，研究人员将打印的攻击性图像放置在小型机器人汽车的行驶路径上，成功导致其导航失效。数据显示，该攻击在空中物体追踪任务中的成功率高达95.5%，在无人驾驶汽车场景中达到81.8%。此外，这种攻击在不同光照条件及包括中文、英语、西班牙语在内的多种语言环境下均表现出有效性。该研究强调了在物理AI系统部署前开发防御措施的紧迫性。

#大模型技术 #机器人及其进展 #网络安全 #具身人工智能 #提示注入攻击

阅读更多：

Burbano, Luis, et al. “CHAI: Command Hijacking against Embodied AI.” arXiv:2510.00181, arXiv, 30 Sept. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2510.00181

AI利用新生儿足跟血预测早产儿健康轨迹，准确率超85%

早产并不是单一的健康问题，而是一系列复杂的潜在疾病集合。为了精准预测早产儿面临的具体风险，斯坦福大学医学院的Alan L. Chang、Jonathan D. Reiss和Nima Aghaeepour等人领导的团队开发了一种基于人工智能的新工具。该工具利用出生后不久采集的血液样本，不仅能预测个体的医疗轨迹，还试图通过生物学测量结果重新定义早产分类，从而实现针对每位患儿的个性化治疗和并发症预防。

这项研究的核心在于挖掘常规新生儿筛查中采集的干血斑（dried blood spots）数据。研究团队分析了超过13,000名加州早产儿的代谢物谱，关注氨基酸和脂肪代谢分子等指标。通过结合深度学习算法与基本临床数据，他们建立了一个“代谢健康指数”。该指数能以超过85%的准确率预测四种主要早产并发症：坏死性小肠结肠炎（necrotizing enterocolitis，一种严重的肠道疾病）、早产儿视网膜病变（retinopathy of prematurity，可能导致失明的眼病）、支气管肺发育不良（bronchopulmonary dysplasia，一种慢性肺部疾病）以及脑室内出血（intraventricular hemorrhage）。该模型随后在近3,300名加拿大早产儿的数据中得到了验证，证明了其广泛的适用性。研究发表在 Science Translational Medicine 上。

#疾病与健康 #预测模型构建 #早产儿 #精准医疗 #代谢组学

阅读更多：

Chang, Alan L., et al. “Quantitative Assessment of Neonatal Health Using Dried Blood Spot Metabolite Profiles and Deep Learning.” Science Translational Medicine, vol. 18, no. 833, Jan. 2026, p. eadv4942. science.org (Atypon), https://doi.org/10.1126/scitranslmed.adv4942

百万级播客数据揭示：商业与体育圈层封闭，社会议题跨界传播

尽管播客已成为公众获取信息和娱乐的重要渠道，但由于缺乏大规模数据，学术界对其生态系统的理解仍十分有限。Benjamin Litterer、David Jurgens 和 Dallas Card利用人工智能技术构建了首个大规模开放播客数据集，并对播客的内容版图、社区结构及社会响应机制进行了深入分析，揭示了这一媒介独特的传播特征。

该研究构建了名为 SPoRC 的语料库，涵盖了2020年5月至6月期间发布的超过110万集英语播客。研究团队利用自动语音识别（ASR）工具 Whisper 将音频转化为文本，并结合 pyannote 进行说话人分离，同时提取了韵律特征。基于这些数据，团队构建了一个通过共同嘉宾连接的播客社交网络。研究发现，商业和体育类别的播客形成了高度封闭的内部网络，经常共享嘉宾；相比之下，宗教和社会类播客的连接则较为松散。在针对乔治·弗洛伊德事件的案例分析中，数据显示播客生态系统的反应速度与新闻媒体相似，但在话题消退上更为缓慢。值得注意的是，该事件引发了跨类别的广泛讨论，在高峰期有21%的节目提及了相关人名，且新闻类播客更侧重于法律与警务层面的讨论，显示了不同社区视角的差异。

#AI驱动科学 #大模型技术 #计算社会科学 #播客生态系统

阅读更多：

Litterer, Benjamin, et al. “Mapping the Podcast Ecosystem with the Structured Podcast Research Corpus.” Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025, pp. 25132–54. arXiv.org, https://doi.org/10.18653/v1/2025.acl-long.1222

智能体推理：大语言模型向自主行动者的进化路线图

推理是智能的核心，但在不断变化的开放世界中，传统的大语言模型往往难以像人类一样灵活应对。为了解决这一难题，来自伊利诺伊大学厄巴纳-香槟分校、Meta、Amazon以及Google Deepmind的研究人员Tianxin Wei、Heng Ji、Hanghang Tong和Jingrui He等人组成的团队，提出了一项关于“智能体推理”（Agentic Reasoning）的全面研究。他们将大语言模型从被动的序列生成器重构为主动的自主智能体，这些智能体不仅能进行思考，还能通过规划、行动以及与环境的持续交互来解决问题，标志着人工智能从静态推理向动态自主行动的范式转变。

该研究通过构建一个包含三个层面的系统路线图，详细阐述了智能体推理的实现路径。首先是“基础智能体推理”，它赋予单智能体在稳定环境中规划任务、使用工具和搜索信息的核心能力；其次是“自我进化智能体推理”，智能体通过反馈机制和记忆模块，在动态环境中不断修正错误并更新策略，实现能力的自我迭代；最后是“集体多智能体推理”，通过多个智能体的角色分工与协作，处理复杂的共同目标。

为了优化这些能力，研究团队区分了两种关键模式：“上下文内推理”侧重于在推理阶段通过结构化的提示工程和工作流编排来激发模型潜力，无需修改模型参数；而“后训练推理”则通过强化学习和微调，将成功的推理策略内化到模型的权重中。该综述不仅为科学发现、机器人技术和自动化研究等领域的应用提供了行动指南，还指出了未来在个性化服务和世界模型构建等方面面临的挑战。

#大模型技术 #计算模型与人工智能模拟 #智能体推理 #自我进化 #多智能体协作

阅读更多：

Wei, Tianxin, et al. “Agentic Reasoning for Large Language Models.” arXiv:2601.12538, arXiv, 18 Jan. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2601.12538

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问，我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

研究院在华山医院、上海市精神卫生中心分别设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工陈天桥雒芊芊神经科学研究院。

研究院还建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、、科普视频媒体「大圆镜」等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.