网易首页 > 网易号 > 正文 申请入驻

追问daily | 为何有时你会感到步履轻盈;反复卧床对老人伤害更大?深度思考优于长篇大论

0
分享至


脑科学动态

Science:衰老并非各自为战:全身器官同步衰老的秘密

为何反复卧床对老人伤害更大?研究揭示肌肉的“有害记忆”

步履轻快源于多巴胺:奖励预测误差能瞬间提升运动活力

大脑白质发育遵循两大轴向:由深到浅,由简到繁

氯胺酮有望成为青少年大脑对抗社会压力的“保护盾”

为什么吃饱了还能吃下零食?

调节小脑神经元放电逆转运动衰老

AI行业动态

60秒“记忆搬家”!Claude新功能撬动ChatGPT护城河

里程碑还是豪赌?日本将全球首款iPSC干细胞疗法“有条件上市”

美军被曝动用Claude,军用版或已领先民用两代

活体神经元芯片学会玩《毁灭战士》:学习效率碾压传统AI

AI驱动科学

Nature:AI遭遇滑铁卢:人类最后考试揭示大模型短板

Nature:AI智能体系统DeepRare在罕见病诊断中超越临床专家

AI越来越聪明但缺乏智慧?科学家提出构建“智慧机器”路线图

专为材料研发打造的 LLaMat 模型:揭示大模型“适应性刚性”现象

智能体记忆新基准AMA-Bench发布:填补长时程任务评估空白

一切皆上下文:基于文件系统抽象的智能体上下文工程

深度思考优于长篇大论:利用深度思考Token量化大模型推理投入

“吞下外科医生”:3D打印磁控软体胶囊机器人

新一代肽基水凝胶实现定制化软组织修复

脑科学动态

Science:衰老并非各自为战:全身器官同步衰老的秘密

衰老是多种重大疾病的根源,但其背后复杂的全身性变化机制仍是未解之谜。洛克菲勒大学的曹俊越团队与周伟团队合作(Ziyu Lu为论文第一作者),以前所未有的规模和精度,绘制了哺乳动物衰老过程的全景细胞图谱,揭示了衰老是一个由系统性信号协调的、存在性别差异的全身同步过程。

研究团队采用优化的组合索引单细胞染色质可及性测序技术(EasySci-ATAC),对来自三个年龄段、两种性别小鼠的21种不同器官、超过1000万个细胞核进行了分析,构建了庞大的单细胞表观遗传图谱。分析结果颠覆了过去对衰老“各自为战”的认知:研究发现,约四分之一的细胞类型会随年龄发生显著变化,并且许多不同器官中的同种细胞表现出惊人的一致性,同步扩张或减少,这强烈表明存在系统性信号在全身范围内协调衰老进程。研究进一步识别了驱动这些变化的分子开关,包括特定的染色质区域和转录因子。此外,研究还揭示了衰老过程中的显著性别二态性,约40%的细胞动态变化具有性别依赖性。这一里程碑式的图谱不仅为理解衰老的分子逻辑提供了框架,也为开发旨在延缓衰老的精准干预疗法指明了新的靶点。研究发表在 Science 上。

#疾病与健康 #健康管理与寿命延长 #表观遗传学 #单细胞图谱

阅读更多:

Lu, Ziyu, et al. “Organism-Wide Cellular Dynamics and Epigenomic Remodeling in Mammalian Aging.” Science, vol. 391, no. 6788, Feb. 2026, p. eadw6273. science.org (Atypon), https://doi.org/10.1126/science.adw6273

为何反复卧床对老人伤害更大?研究揭示肌肉的“有害记忆”

为何同样是因病卧床,年轻人恢复较快,而老年人肌肉流失却更严重且难以恢复?由挪威体育科学学院的Adam P. Sharples与Daniel C Turner等人进行的一项研究揭示,骨骼肌能够“记住”反复缺乏运动的经历,但这种“分子记忆”对年轻和年老肌肉的影响截然相反:前者是保护性的,后者则是有害的。

该研究通过整合年轻成年人的下肢固定实验和老年大鼠模型,并运用多组学分析方法,系统比较了不同年龄段肌肉对反复废用的反应。研究发现,在年轻人中,第二次肌肉废用引起的分子扰动(尤其是氧化和线粒体通路)明显小于第一次,显示出一种保护性的转录弹性。然而,在年老肌肉中,这种记忆却加剧了损伤,导致更严重的肌肉萎缩、有氧代谢基因的持续抑制和DNA损伤通路的激活。与能够恢复肌肉质量的年轻大鼠不同,年老大鼠在经历废用后恢复能力显著下降。研究人员进一步发现,这种记忆效应与DNA甲基化等表观遗传改变有关,它调控了多个代谢和线粒体相关基因网络的表达。这项发现为理解年龄相关的肌肉衰退提供了新视角,并提示针对性地调控肌肉分子记忆可能成为未来预防和治疗肌肉萎缩的新策略。研究发表在 Advanced Science 上。

#疾病与健康 #健康管理与寿命延长 #分子记忆 #肌肉萎缩 #衰老

阅读更多:

Turner, Daniel C., et al. “Repeated Disuse Atrophy Imprints a Molecular Memory in Skeletal Muscle: Transcriptional Resilience in Young Adults and Susceptibility in Aged Muscle.” Advanced Science [Weinheim, Baden-Wurttemberg, Germany], Feb. 2026, p. e22726. PubMed, https://doi.org/10.1002/advs.202522726

步履轻快源于多巴胺:奖励预测误差能瞬间提升运动活力

人们在期待奖励时为何会“步履轻快”?为探究这一现象背后的神经机制,科罗拉多大学博尔德分校的Alaa Ahmed和Colin C. Korbisch进行了一项研究。他们发现,运动活力能实时反映大脑中与多巴胺相关的奖赏信号,特别是当实际奖励与预期不符时(奖励预测误差),动作速度会瞬间发生改变,这揭示了动机如何直接转化为动作。


受试者伸手去够电脑屏幕上的目标,而阿拉·艾哈迈德和科林·科比什则在一旁观察数据。Credit: Jesse Morgan Petersen/CU Boulder College of Engineering and Applied Science

研究团队设计了一个伸手触碰任务,参与者使用操纵杆触碰屏幕上不同目标,这些目标以不同概率(0%到100%)提供奖励。结果证实,参与者在朝向高概率奖励目标移动时,速度更快。核心发现是,运动活力能实时反映奖励预测误差,即实际与期望奖励的差异。当参与者意外获得奖励时,他们的伸手动作会在收到反馈后的短短220毫秒内瞬间加速。这种爆发式活力被认为反映了大脑中编码意外惊喜的多巴胺能神经元的瞬时活动。而当奖励完全可预期时,则不会观察到这种额外的速度提升。此外,近期的奖励历史也会影响整体运动活力,连续成功会使人动作更快,反之则变慢。这一系列发现为“高兴时步履轻快”提供了神经层面的解释,并将运动本身作为观察大脑动机计算的窗口。研究发表在 Science Advances 上。

#疾病与健康 #神经机制与脑功能解析 #多巴胺 #运动控制

阅读更多:

“Rapid Dopaminergic Signatures in Movement: Reach Vigor Reflects Reward Prediction Error and Learned Expectation.” Science Advances. www.science.org, https://www.science.org/doi/10.1126/sciadv.adz9361. Accessed 2 Mar. 2026

大脑白质发育遵循两大轴向:由深到浅,由简到繁

青少年大脑中的信息高速公路——白质束,是如何铺设和完善的?过去的研究常假设其均匀成熟,但具体模式仍是未知。Audrey C. Luo, Theodore D. Satterthwaite及其合作团队利用大规模神经影像数据,对这一基本问题提出了全新见解。他们发现大脑白质的发育并非均质,而是遵循“由深到浅”和“由简到繁”两个清晰的空间轴,这一发现挑战了该领域的传统认知。

该研究整合了三个大型数据集,分析了2716名5至23岁青少年的弥散磁共振成像数据。与以往将整条白质束平均分析的方法不同,团队精确测量了纤维束沿线不同位置的发育变化。结果揭示了两大规律:首先是“由深到浅”轴,即白质束靠近大脑皮层的浅层部分比其深层部分随年龄增长发生的变化更显著,发育更晚。其次,浅层部分的发育遵循“感觉运动-联合轴”,这是一个与大脑皮层功能层级对应的模式。具体来说,连接基础感知和运动功能的脑区(如视觉、听觉皮层)的白质束末端会先于连接高级认知功能(如规划、决策)的联合皮层的白质束末端成熟。这一“由简到繁”的发育顺序,可能有助于优化青少年时期大脑内部的神经信号传输速度与同步性。研究发表在 Nature Communications 上。

#神经科学 #神经机制与脑功能解析 #大脑发育 #白质

阅读更多:

Luo, Audrey C., et al. “Two Axes of White Matter Development.” Nature Communications, vol. 17, no. 1, Jan. 2026, p. 1957. www.nature.com, https://doi.org/10.1038/s41467-026-68714-8

氯胺酮有望成为青少年大脑对抗社会压力的“保护盾”

青春期遭遇的社会压力(如霸凌)不仅会造成短期的心理创伤,还可能增加成年后患精神疾病和药物成瘾的风险。为了探索如何阻断这一恶性循环,M.A. Martínez-Caballero及其同事(西班牙的研究团队)进行了一项针对性研究。他们发现,麻醉剂兼抗抑郁药氯胺酮可能起到“大脑保护盾”的作用,能有效减轻经历社会挫败的青少年小鼠的焦虑症状,并降低其日后对毒品的易感性。


一堆盐酸可卡因。Credit: DEA Drug Enforcement Agency, public domain

这项研究利用间歇性社会挫败(ISD)模型模拟青少年时期的社会压力,将实验小鼠多次暴露于具有攻击性的同类环境中。随后,研究人员使用了高架十字迷宫(EPM)和条件性位置偏好(CPP)等实验范式来分别评估小鼠的焦虑水平和对可卡因的奖赏记忆。研究结果显示,未接受治疗的应激小鼠在成年后表现出明显的社交退缩,并且对可卡因表现出更强的偏好,这预示着更高的成瘾风险。然而,在应激事件发生前接受高剂量氯胺酮治疗的小鼠,成功避免了焦虑样行为的产生,其社交互动能力得以保留,且并未像未治疗组那样对可卡因表现出过度的敏感性。这表明氯胺酮通过阻断NMDA受体,可能干扰了压力导致大脑病理改变的过程,尽管它并未能缓解所有类型的压力反应(如悬尾实验中的抑郁指标),但其在预防社交回避和成瘾易感性方面的潜力引人注目。研究发表在 Physiology & Behavior 上。

#疾病与健康 #心理健康与精神疾病 #神经机制与脑功能解析 #成瘾机制 #预防医学

阅读更多:

Martínez-Caballero, M. A., et al. “Ketamine Attenuates the Effects of Intermittent Social Defeat on Anxiety, Social Interaction and Cocaine-Induced Conditioned Place Preference in Male Mice.” Physiology & Behavior, vol. 305, Mar. 2026, p. 115189. ScienceDirect, https://doi.org/10.1016/j.physbeh.2025.115189

为什么吃饱了还能吃下零食?大脑扫描揭示对食物线索的“贬值不敏感性”

在零食广告和诱惑无处不在的现代社会,为何人们常常在吃饱后仍无法拒绝甜食?针对这一肥胖危机背后的神经机制,东英吉利大学的Thomas D. Sambrook等人与普利茅斯大学的研究人员合作进行了一项研究。他们发现,肥胖不仅仅是意志力的问题,更是因为大脑对食物线索存在一种自动化的反应机制,这种机制在身体不再需要能量时依然活跃。


Credit: Appetite (2026).

研究团队招募了76名志愿者,利用脑电图(EEG)技术监测他们在进行食物奖励游戏时的脑部活动。实验采用了饱腹感特异性选择性贬值的方法:参与者在中途被要求尽情食用如巧克力或薯片等特定零食,直到产生饱腹感并拒绝再吃。

结果显示,参与者在进食后明确表示不想再吃该食物,且行为数据显示该食物对他们不再具有价值。脑电图数据显示,尽管参与者已经饱腹,但其大脑奖励区域对食物图像的神经反应(ERP)并未减弱,表现出“贬值不敏感性”(devaluation insensitivity)。即使意识上不想吃,大脑仍会自动发出强烈的“奖励”信号。这表明对食物线索的反应可能是一种根深蒂固的习惯性机制,独立于当前的饥饿感或意愿,这也是导致过度进食的重要原因。研究发表在Appetite 上。

#神经科学 #神经机制与脑功能解析 #行为进化 #发声交流 #冷泉港实验室

阅读更多:

Sambrook, Thomas D., et al. “Devaluation Insensitivity of Event Related Potentials Associated with Food Cues.” Appetite, vol. 218, Mar. 2026, p. 108390. ScienceDirect, https://doi.org/10.1016/j.appet.2025.108390

调节小脑神经元放电逆转运动衰老

随着全球人口老龄化,跌倒已成为威胁老年人健康和独立生活的主要风险因素。麦吉尔大学的Eviatar Fields和Alanna Watt等人组成的研究团队,深入探索了大脑衰老与运动能力下降之间的联系。他们发现,小脑中一种特定神经元的活动减弱是导致老年人步态不稳和平衡能力变差的关键原因,并通过实验成功逆转了这一过程。


18 个月时,浦肯野细胞数量未减少,但分子和结构却发生了变化。Credit: Proceedings of the National Academy of Sciences (2026).

该研究聚焦于小脑皮层的关键输出细胞——浦肯野细胞,这种细胞负责整合感觉信号并微调运动指令。研究人员发现,与年轻小鼠相比,老年小鼠的浦肯野细胞自发放电频率显著降低。为了验证这一生理变化与行为之间的因果关系,团队使用了化学遗传学工具,即设计受体(DREADD)来精准控制神经元活动。实验结果显示,当人为降低年轻小鼠浦肯野细胞的放电频率时,它们在转棒测试中的表现迅速恶化,呈现出类似衰老的运动障碍;相反,当研究人员提高老年小鼠该细胞的放电频率时,这些老年小鼠的运动协调能力得到了显著改善,在复杂任务中的错误率大幅下降。这项研究证实了维持神经元放电率对保持运动机能至关重要,为预防老年人跌倒提供了新的治疗思路。研究发表在 PNAS 上。

#疾病与健康 #神经机制与脑功能解析 #衰老 #神经调控 #小脑

阅读更多:

Fields, Eviatar, et al. “Cerebellar Purkinje Cell Firing Reduction Contributes to Aging-Related Declining Motor Coordination in Mice.” Proceedings of the National Academy of Sciences, vol. 123, no. 2, Jan. 2026, p. e2525795122. www.pnas.org, https://doi.org/10.1073/pnas.2525795122

AI 行业动态

60秒“记忆搬家”!Claude新功能撬动ChatGPT护城河,70万用户用脚投票

Anthropic公司近日为旗下AI助手Claude推出了一项名为“导入记忆”的新功能,允许用户将自己在其他AI平台积累的全部对话上下文和个性化记忆,通过简单的“复制-粘贴”操作,在不到一分钟内完整迁移至Claude。这一功能直接击穿了用户更换AI助手的核心障碍——切换成本。长期以来,用户在ChatGPT中通过长期互动形成的个人偏好、工作风格等“数字灵魂”是其最深的用户粘性来源。Claude此举相当于为用户提供了一把可以随身携带的“数字人格钥匙”,使其能无缝衔接新平台,首场对话即可获得深度个性化体验。

该功能的推出恰逢OpenAI因与国防部合作而遭遇大规模用户抵制,形成巨大合力。社交网络上#QuitGPT话题迅速发酵,据称已有超过70万用户宣布取消ChatGPT订阅并转投Claude,后者也随即登顶应用商店榜首。这一事件引发的震荡远超产品竞争本身,它触及了AI时代“数据主权”的核心问题:当AI助手深度理解并记忆用户的私密信息时,这些数据资产究竟归谁所有?Claude通过功能创新,将用户数据自由流动的主动权交还给用户,迫使行业重新审视以数据锁定为核心的商业模式。未来,AI竞争的战场或将由“谁更懂你”转向“谁更值得你托付”,甚至催生类似“号码携带”的AI记忆数据迁移标准和法规。

#Claude #记忆迁移 #AI数据主权 #ChatGPT #用户抵制

阅读更多:

https://claude.com/import-memory

里程碑还是豪赌?日本将全球首款iPSC干细胞疗法“有条件上市”

日本厚生省近日建议“有条件批准”两种全球首创的诱导多能干细胞(iPSC)疗法,用于治疗帕金森病和严重心力衰竭。这两种疗法分别名为Amchepry和ReHeart,其核心均基于2012年诺贝尔奖得主山中伸弥教授开发的iPSC技术。该技术能将成体细胞重编程为类似胚胎干细胞的状态,再分化为特定功能细胞。Amchepry通过移植由志愿者血细胞分化而来的多巴胺神经元前体细胞,以替代帕金森病患者脑内丢失的细胞;ReHeart则将iPSC来源的心肌细胞制成“补片”,移植到严重心衰患者心脏上促进修复。这一决定若最终落地,将是再生医学领域的里程碑事件,但同时也因其基于仅7人和8人的小型探索性临床试验数据而引发巨大争议。

日本独特的监管路径允许再生医学产品在仅完成探索性试验后即可获得“有条件、有时间限制”的批准,药企可在7年内向有限患者销售并继续收集真实世界数据。支持者认为这能加速突破性疗法惠及患者,但众多研究人员表达了深切担忧。加州大学戴维斯分校的Paul Knoepfler将其称为“冒险的监管实验”,指出临床数据薄弱、缺乏对照组无法确证疗效,且iPSC疗法存在细胞癌变风险、移植手术侵入性及需长期使用免疫抑制剂等问题。批评者如斯克里普斯研究所的Jeanne Loring更警告,过低门槛可能鼓励“粗制滥造”,一旦出现严重副作用,将给整个再生医学领域带来“寒蝉效应”。在全球已有超100项干细胞疗法临床试验的激烈竞争下,日本的激进步伐究竟是开启新窗口,还是一次鲁莽实验,有待时间和更严谨的数据验证。

#iPSC疗法 #再生医学 #帕金森病 #有条件批准 #伦理争议

阅读更多:

https://www.nature.com/articles/d41586-026-00585-x

美军被曝动用Claude,军用版或已领先民用两代

一场围绕人工智能的戏剧性冲突日前上演。就在美国前总统特朗普签署命令、试图全面封禁AI公司Anthropic的聊天机器人Claude后数小时,美军却被曝出利用该技术对伊朗发动了大规模空袭。据《华尔街日报》披露,美国中央司令部在情报分析、目标识别及战斗模拟等环节深度集成了Claude。更令人震惊的是,Anthropic首席执行官Dario Amodei在接受采访时证实,公司确实为美国军方打造了一款运行于“机密云”的定制版模型。业界据此推测,得益于不受限制的算力供给和专属数据训练,这款军用Claude的性能可能已领先公众可用的Opus版本一到两代,或已达到“Opus 5.5”的级别,其计算量据称每四个月便翻一番。

这场风波揭开了硅谷技术理想主义与军事应用之间日益尖锐的矛盾。尽管Anthropic因担忧技术被用于开发“自主武器”(autonomous weapons,即无需人类最终确认即可自主锁定并攻击目标的系统)或大规模分析民众隐私数据,而拒绝了五角大楼的部分合作条款,但其技术已深度嵌入军方体系。报道指出,由于Claude已与Palantir等公司的数据挖掘架构紧密整合,要将其从复杂的军事系统中完全剥离,预计至少需要六个月。这一事件不仅凸显了AI在脑力劳动自动化之外的颠覆性力量——正成为重塑现代战争形态和国家间博弈的关键变量,更引发了全球范围内对AI伦理、技术管制与国家安全之间复杂关系的深刻反思。

#Claude军用版 #AI战争 #自主武器 #Anthropic #技术伦理

阅读更多:

https://www.wsj.com/livecoverage/iran-strikes-2026/card/u-s-strikes-in-middle-east-use-anthropic-hours-after-trump-ban-ozNO0iClZpfpL7K7ElJ2?mod=mhp

活体神经元芯片学会玩《毁灭战士》:学习效率碾压传统AI

继五年前让培养皿中的脑细胞学会打乒乓球后,生物计算领域再获突破。独立开发者Sean Cole利用Cortical Labs公司开放的云平台API,在不到一周时间内,成功让承载约20万个人类诱导多能干细胞(hiPSC)分化神经元的高密度多电极阵列(HD-MEA)芯片学会了玩3D经典游戏《毁灭战士》(Doom)。通过将游戏画面编码为电刺激信号,并实时解读神经元的放电模式来映射为游戏指令,这些活体神经元展现出自主探索环境、寻找敌人、射击及弹药管理的能力。尽管当前表现尚显初级,但这一成果标志着合成生物智能(SBI)系统处理复杂任务的能力迈出关键一步。

真正引发学界关注的是该系统所展现出的惊人样本效率。在匹配有限训练局数的对比实验中,无论是源自人类还是小鼠的皮层细胞培养物,其在简化版乒乓球游戏中的表现均全面超越了主流的深度强化学习算法(DQN、A2C和PPO)。研究通过降维分析和功能连接网络构建发现,处于游戏状态下的神经网络,其连接模式会发生显著的功能性重组,模块化程度下降,跨区域协同增强,显示出动态的网络可塑性。相比之下,静息状态下则无此变化。这有力地证明了,在真实时间尺度和信息输入极为稀疏的条件下,简单的生物神经网络通过自身动态重构,其学习效率远高于依赖大规模数据和算力堆砌的当前AI系统,为发展全新一代的高效、低功耗计算模型开辟了全新的路径。

#合成生物智能 #样本效率 #活体神经元 #脑机接口 #DishBrain

阅读更多:

https://github.com/SeanCole02/doom-neuron

AI 驱动科学

Nature:AI遭遇滑铁卢:“人类最后考试”揭示大模型短板

现有AI基准测试已无法满足对顶尖大模型的评估需求。为此,由人工智能安全中心、Scale AI及HLE贡献者联盟召集的全球近1000名跨学科研究人员(其中包括德克萨斯农工大学的Tung Nguyen),共同开发了一项名为“人类的最后考试”(Humanity’s Last Exam,简称HLE)的新型评估系统。这一大规模合作项目旨在通过专家级难题,系统性地揭示人工智能目前的能力边界与局限。


HLE 数据集创建流程。Credit: Nature (2026).

HLE包含2500道涵盖数学、人文及自然科学等领域的封闭式问题,所有题目均由各领域专家编写与审核,并经过特殊筛选:任何能被当前AI系统解答的题目均被剔除。测试结果显示,即便是最强的大语言模型也在此遭遇滑铁卢。GPT-4o的准确率仅为2.7%,OpenAI的o1模型仅达到8%,而目前最先进的Gemini 3.1 Pro和Claude Opus 4.6的准确率也仅在40%到50%之间。此外,研究发现模型普遍存在严重的校准误差。这一研究成果不仅确立了衡量未来AI进步的长期基准,也证实了在深度理解与专业知识方面,人类专家仍占据显著优势。研究发表在 Nature 上。

#大模型技术 #跨学科整合 #人工智能评估 #基准测试 #深度学习

阅读更多:

Phan, Long, et al. “A Benchmark of Expert-Level Academic Questions to Assess AI Capabilities.” Nature, vol. 649, no. 8099, Jan. 2026, pp. 1139–46. www.nature.com, https://doi.org/10.1038/s41586-025-09962-4

Nature:AI智能体系统DeepRare在罕见病诊断中超越临床专家

罕见病往往面临长达数年的诊断周期与极易误诊的难题。上海交通大学人工智能学院、上海人工智能实验室及上海交通大学医学院附属新华医院的Weike Zhao、Chaoyi Wu、Yongguo Yu、Kun Sun、Weidi Xie等,开发了罕见病鉴别诊断多智能体系统DeepRare,在准确性上成功超越了资深临床专家。

研究团队构建了基于大语言模型的多智能体系统DeepRare。该系统采用三层架构,能够处理自由文本、结构化的人类表型本体(human phenotype ontology)术语及全外显子组测序等异构多模态临床数据。系统内置四十余种专业分析工具并连接权威外部医学知识库,同时采用自反循环机制反复评估诊断假设以减少机器幻觉与过度诊断风险。研究团队在涵盖十四个医学专科的九个数据集中测试了六千余个真实病例,结果显示,在基于表型的任务中DeepRare的平均首位命中率(Recall@1)达百分之五十七点一八,比次优方法高出百分之二十三点七九。在多模态测试中其准确率达百分之六十九点一。十位临床专家盲评证实,该系统生成的推理链与医学证据一致性高达百分之九十五点四,兼具卓越的临床有效性与证据可追溯性。研究发表在 Nature 上。

#疾病与健康 #大模型技术 #罕见病诊断 #多智能体系统 #全外显子组测序

阅读更多:

Zhao, Weike, et al. “An Agentic System for Rare Disease Diagnosis with Traceable Reasoning.” Nature, Feb. 2026, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-10097-9

AI越来越聪明但缺乏智慧?科学家提出构建“智慧机器”路线图

人工智能正变得日益强大,但其应对复杂现实的智慧却未能同步提升。来自滑铁卢大学、蒙特利尔大学、谷歌DeepMind等机构的 Samuel G.B. Johnson 和 Igor Grossmann 等跨学科专家团队,首次提出了一项旨在将人类智慧融入人工智能系统的具体路线图。

当前的 AI 系统虽在明确任务中表现优异,但在面对模糊或混乱的现实问题时往往束手无策。研究团队认为,核心症结在于 AI 缺乏元认知,即对自身思维过程进行思考的能力。为此,论文提出将抽象的智慧拆解为可计算的策略,主要包括理智谦逊(intellectual humility)、寻求视角(perspective-seeking)和情境适应(context adaptation)。研究建议通过建立新的评估基准和训练方法,使大型语言模型学会识别自身知识的局限、权衡多方观点并灵活适应环境,而非仅仅进行计算。这种具备元认知的“智慧机器”将能更安全地与人类目标对齐,并在处理新颖环境时展现出更强的稳健性和可解释性。研究发表在 Trends in Cognitive Sciences 上。

#大模型技术 #计算模型与人工智能模拟 #认知科学 #AI安全 #跨学科整合

阅读更多:

Johnson, Samuel G. B., et al. “Imagining and Building Wise Machines: The Centrality of AI Metacognition.” Trends in Cognitive Sciences, vol. 0, no. 0, Feb. 2026. www.cell.com, https://doi.org/10.1016/j.tics.2026.01.002

专为材料研发打造的 LLaMat 模型:揭示大模型“适应性刚性”现象

面对材料科学文献爆炸式增长带来的挑战,来自印度理工学院德里分校、Cerebras Systems 和英特尔实验室的 Vaibhav Mishra 、 N. M. Anoop Krishnan 、 Mausam 等研究人员,开发了一套专用于材料科学的基础大语言模型 LLaMat。该研究不仅提升了材料领域的自动化科研能力,还意外发现了基础模型在领域适应过程中的一项重要特性。

研究团队基于 LLaMA-2 和 LLaMA-3 架构,利用包含超过 300 亿个标记的材料科学专用语料库 R2CID 进行了持续预训练,随后进行了指令微调和任务特定微调。结果显示,LLaMat 模型在材料特定的自然语言处理和结构化信息提取任务中,性能优于 GPT-4o 和 Claude 等商业模型。特别值得注意的是,专门开发的 LLaMat-CIF 变体在晶体结构生成方面表现卓越,能预测出热力学稳定的新晶体。研究的一个核心发现是适应性刚性现象:尽管 LLaMA-3 基础能力更强,但在经过相同的领域适应训练后,基于 LLaMA-2 的版本在生成晶体结构和从表格提取复杂信息等特定任务上,表现反而优于基于 LLaMA-3 的版本。这表明经过大量预训练的模型可能更难适应高度专业化的领域。

#AI驱动科学 #大模型技术 #材料科学 #适应性刚性 #晶体结构生成

阅读更多:

Ahlawat, Dhruv, et al. “A Family of Large Language Models for Materials Research with Insights into Model Adaptability in Continued Pretraining.” Nature Machine Intelligence, Feb. 2026, pp. 1–14. www.nature.com, https://doi.org/10.1038/s42256-026-01199-8

智能体记忆新基准AMA-Bench发布:填补长时程任务评估空白

随着大型语言模型逐渐演变为能够执行复杂任务的自主智能体,如何赋予其高效的长时程记忆成为关键挑战。针对现有基准测试过于侧重对话而忽视机器生成环境交互的问题,Yujie Zhao、Boqin Yuan、Yuandong Tian及Jishen Zhao等研究人员开发了全新的评估体系。该团队通过分析智能体在代码编辑、网页搜索等真实场景中的行为,揭示了当前记忆系统在处理具有因果约束和符号化数据的局限性,并提出了创新的解决方案。

为了解决评估缺失的问题,研究团队推出了AMA-Bench(任意长度智能体记忆基准测试)。该基准包含两部分:涵盖Web、软件工程及具身人工智能等六大领域的真实世界轨迹子集,以及可无限扩展交互长度的合成子集。研究发现,传统的基于相似性的检索在处理机器生成的客观数据时存在严重损耗,且往往丢失了关键的因果联系。为此,团队提出了AMA-Agent框架,引入了因果图(Causality Graph,用于显式保存动作与状态间因果依赖的结构)和工具增强检索(Tool-Augmented Retrieval,结合图搜索与关键词搜索的混合机制)。实验结果显示,AMA-Agent在基准测试中达到了57.22%的平均准确率,相比现有最强基线提升了11.16%,有效证明了保留因果结构和精确检索对提升智能体长时程记忆的重要性。

#大模型技术 #机器人及其进展 #智能体记忆 #长时程评估

阅读更多:

Zhao, Yujie, et al. “AMA-Bench: Evaluating Long-Horizon Memory for Agentic Applications.” arXiv:2602.22769, arXiv, 26 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2602.22769

一切皆上下文:基于文件系统抽象的智能体上下文工程

随着生成式人工智能重塑软件架构,如何有效管理“上下文”成为关键挑战。Xiwei Xu、Xuewu Gu、Liming Zhu等研究人员指出,现有的提示工程和检索增强生成技术往往产生难以追溯的临时数据,限制了系统的可靠性。为此,该团队受Unix哲学启发,提出了一种全新的文件系统抽象架构,旨在为智能体系统提供一个统一、持久且可治理的上下文管理基础。

该研究的核心在于将“一切皆文件”的理念应用于上下文工程。研究团队开发了一种架构,将异构的上下文资源(如长期记忆、外部工具、人类输入)统一挂载为“文件”,并通过标准的读写操作进行管理。这种设计包含了一个完整的上下文工程流水线,由构造器、更新器和评估器组成,能够根据大模型的令牌窗口限制,智能地选择、压缩和流式传输信息。

在具体实现上,该架构将存储分为不可变的“历史”、结构化的“记忆”和临时的“草稿本”,确保了数据从产生到推理的全生命周期可追溯。通过在开源框架AIGNE中的部署,以及在具有记忆功能的智能体和GitHub助手中的应用,研究证明了该方法能有效解决模型无状态和上下文漂移的问题,支持人类作为验证者参与决策,为构建可信赖的工业级GenAI系统提供了新路径。

#AI驱动科学 #大模型技术 #上下文工程 #软件架构 #人机交互

阅读更多:

Xu, Xiwei, et al. “Everything Is Context: Agentic File System Abstraction for Context Engineering.” arXiv:2512.05470, arXiv, 5 Dec. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2512.05470

深度思考优于长篇大论:利用深度思考Token量化大模型推理投入

大语言模型通常通过生成更长的思维链来解决复杂问题,但“话多”并不总是代表“想得深”,有时反而意味着模型陷入了“过度思考”的死胡同。来自弗吉尼亚大学的 Wei-Lin Chen 和 Yu Meng 等研究人员提出了一种新的视角,旨在通过量化模型内部的计算行为来衡量真实的推理投入。他们发现,单纯依赖生成的文本长度或模型自信度并不能可靠地预测回答的质量,因此开发了一种名为“深度思考比率”(Deep-Thinking Ratio, DTR)的衡量标准。

这项研究的核心在于区分“深度思考Token”与普通Token。研究团队利用詹森-香农散度(JSD)分析模型内部各层的预测分布,发现那些在浅层网络中预测就已稳定的Token往往只需较少的计算投入,而那些直到深层网络仍在不断修正预测的Token则代表了更高的“思考投入”。实验结果显示,DTR与模型在复杂数学和科学任务上的准确率呈现强正相关,表现显著优于传统的长度基线。基于此,团队提出了一种名为 Think@n 的推理策略,该策略能通过识别并优先保留高DTR的生成结果,在减少约50%推理成本的同时,达到甚至超越传统一致性算法的性能。

#大模型技术 #计算模型与人工智能模拟 #思维链 #推理能力 #深度思考

阅读更多:

Chen, Wei-Lin, et al. “Think Deep, Not Just Long: Measuring LLM Reasoning Effort via Deep-Thinking Tokens.” arXiv:2602.13517, arXiv, 13 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2602.13517

“吞下外科医生”:德州大学奥斯汀分校研发3D打印磁控软体胶囊机器人

如何让患者像吞药片一样轻松完成胃肠道检查?德克萨斯大学奥斯汀分校的MINIMAX实验室主任夏方舟(Fangzhou Xia)及其团队,受其个人术后经历启发,研发出一种新型3D打印磁控胶囊机器人。该研究成果旨在解决传统内镜检查侵入性强、患者痛苦大的问题,同时克服了现有胶囊机器人内部空间被磁铁占据的缺陷,为未来的微创诊断和靶向给药提供了新的解决方案。


(a)采用 180 克硅胶 + 100 克钕铁硼复合材料的制造装置;(b)可编程极性的软磁棒;(c)用于滚动和定向旋转的胶囊软磁涂层;(d)具有多种测试平台的实验装置。Credit: Zhou et al.

传统的磁性胶囊机器人通常在内部嵌入笨重的永磁体,严重挤占了用于搭载摄像头或药物的空间。该团队采用了一种创新方法:利用3D打印技术,将磁性钕铁硼颗粒混合到软硅胶中,制造出一种包裹胶囊的功能性软磁涂层。通过在打印过程中精确编程磁化方向,研究人员赋予了外壳特定的磁各向异性,即材料在不同方向上表现出不同的磁性特征,从而产生清晰的净磁矩。这种设计不仅释放了胶囊内部的全部空间用于集成医疗模块,还利用哈尔巴赫阵列(Halbach array)原理优化了外部磁场控制,使机器人无需复杂的反馈算法即可实现稳定的双向滚动和全方位转向。实验显示,该机器人在低至0.3 mT的磁场下即可驱动,并能轻松翻越5毫米障碍及攀爬斜坡。

#疾病与健康 #机器人及其进展 #磁控技术 #微创医疗 #3D打印

阅读更多:

Zhou, Jin, et al. “3D-Printed Anisotropic Soft Magnetic Coating for Directional Rolling of a Magnetically Actuated Capsule Robot.” arXiv:2602.10688, arXiv, 11 Feb. 2026. arXiv.org, https://doi.org/10.48550/arXiv.2602.10688

新一代肽基水凝胶实现定制化软组织修复

软组织修复材料长期面临天然来源不稳定与合成材料难降解的矛盾。来自渥太华大学和渥太华大学心脏研究所的 Alex Ross、Daniel Nguyen、Emilio I. Alarcon、Erik J. Suuronen 以及 Marc Ruel 等人组成的跨学科团队,成功研发出一种完全由合成肽构成的仿生水凝胶,为手术切口缝合和创伤修复提供了全新的解决方案。


Pep 10 水凝胶与人皮肤成纤维细胞的三维细胞相容性。Credit: Advanced Functional Materials (2025).

该研究通过理性的化学设计,利用固相合成技术制造出胶原蛋白样肽(CLPs,一种模仿天然胶原蛋白结构和功能的短链氨基酸序列)。研究人员利用超分子自组装(分子在非共价键作用下自发形成有序结构的过程)使这些肽链形成水凝胶的基础骨架,随后引入光触发的硫醇-烯交联(一种在光照下高效发生反应形成稳定化学键的点击化学技术)。这种光活化机制不仅赋予了材料精确的时空控制能力,还使其能从液态迅速转化为坚固且柔韧的凝胶。实验结果显示,该水凝胶的机械性能高度可调,通过改变肽浓度或分子结构即可实现定制化。其组织粘合强度与市售的 LiquiBand 相当,且具备优异的细胞相容性和生物可降解性,这意味着材料在完成修复使命后可被体内酶解代谢,无需二次手术移除,极大降低了引发免疫反应或毒性的风险。研究发表在 Advanced Functional Materials 上。

#疾病与健康 #跨学科整合 #生物材料 #组织工程

阅读更多:

Ross, Alex, et al. Mechanically Stable and Tunable Photoactivated Peptide‐Based Hydrogels for Soft Tissue Adhesion. advanced.onlinelibrary.wiley.com, https://doi.org/10.1002/adfm.202529084. Accessed 2 Mar. 2026

整理|ChatGPT

编辑|丹雀、存源





关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、、科普视频媒体「大圆镜」等。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国撤侨,要求台湾人出示台胞证可接收,台当局表示“不可接受”

中国撤侨,要求台湾人出示台胞证可接收,台当局表示“不可接受”

我心纵横天地间
2026-03-03 16:46:42
汪小菲将辞退月嫂,小杨阿姨仍未复工曝处境,老公跑滴滴还房贷!

汪小菲将辞退月嫂,小杨阿姨仍未复工曝处境,老公跑滴滴还房贷!

古希腊掌管月桂的神
2026-03-03 11:30:22
“老婆,谢谢你当年没去赚那种快钱”:一对底层夫妻在东莞的20年

“老婆,谢谢你当年没去赚那种快钱”:一对底层夫妻在东莞的20年

贤东故事会
2026-02-28 20:00:03
伊朗外长:领袖虽遇难 但伊朗不会倒下

伊朗外长:领袖虽遇难 但伊朗不会倒下

极目新闻
2026-03-03 17:11:46
突发!又一内地男被禁止离港!

突发!又一内地男被禁止离港!

港港地
2026-03-03 10:02:24
一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

狸猫之一的动物圈
2026-02-24 09:00:11
所有AI全军覆没!学者出2500道题,GPT-5得分25.3%,GPT-4o 2.7%

所有AI全军覆没!学者出2500道题,GPT-5得分25.3%,GPT-4o 2.7%

DeepTech深科技
2026-03-01 17:25:27
A股前所未见一幕,“三桶油”连续2天涨停,仅A股市值骤增近5200亿元,相当于在两天内再造一个中国电信!各路资金疯狂而至,“三桶油”成交额均破百亿大关

A股前所未见一幕,“三桶油”连续2天涨停,仅A股市值骤增近5200亿元,相当于在两天内再造一个中国电信!各路资金疯狂而至,“三桶油”成交额均破百亿大关

金融界
2026-03-03 15:57:43
吉尔吉斯斯坦总统直言:我们身上流着的是李陵的血,跟中国是手足

吉尔吉斯斯坦总统直言:我们身上流着的是李陵的血,跟中国是手足

文史微鉴
2025-12-04 22:02:53
弗里克清洗计划启动,卡萨多、坎塞洛、巴尔德吉成离队热门

弗里克清洗计划启动,卡萨多、坎塞洛、巴尔德吉成离队热门

格斗联盟
2026-03-03 17:38:26
李莉没有说过“伊朗半小时灭以色列”,

李莉没有说过“伊朗半小时灭以色列”,

雪中风车
2026-03-01 08:11:49
伊朗反抗阵营今何在?大部分“抵抗之弧”成员已参战:也门胡塞武装率先支援,黎巴嫩真主党高精度火箭弹还击,伊拉克武装袭击28次

伊朗反抗阵营今何在?大部分“抵抗之弧”成员已参战:也门胡塞武装率先支援,黎巴嫩真主党高精度火箭弹还击,伊拉克武装袭击28次

极目新闻
2026-03-03 11:51:45
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
陕西63岁男子来武汉成功植入阴茎假体,得到60岁老伴支持

陕西63岁男子来武汉成功植入阴茎假体,得到60岁老伴支持

观威海
2026-03-03 11:23:03
真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

人民日报健康客户端
2026-02-25 07:34:27
霍尔木兹海峡一声炮响,这个化工品价格迎来狂飙!

霍尔木兹海峡一声炮响,这个化工品价格迎来狂飙!

财经早餐
2026-03-03 14:27:44
若不出意外,2026年上半年开始,一半家庭都可能面临“四大难题”

若不出意外,2026年上半年开始,一半家庭都可能面临“四大难题”

猫叔东山再起
2026-03-01 12:40:03
又有两国下场,英法德也要防御性参战?关键时刻,普京对中喊话

又有两国下场,英法德也要防御性参战?关键时刻,普京对中喊话

知鉴明史
2026-03-02 17:29:36
终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

终于有人管管美国了!美国遇到大麻烦,美国:中美两国需要携手

福建平子
2026-01-28 10:52:25
尴尬!扣12分,春节最冤种司机出现!一粤s车牌两次驶入应急车道

尴尬!扣12分,春节最冤种司机出现!一粤s车牌两次驶入应急车道

火山詩话
2026-03-02 10:11:01
2026-03-03 18:16:49
追问Nextquestion incentive-icons
追问Nextquestion
科研就是不断探索问题的边界
675文章数 34关注度
往期回顾 全部

科技要闻

拥抱AI的"牛马":边提效边自嘲"自费"上班

头条要闻

袭击伊朗后 特朗普首次发表白宫讲话:将不惜一切代价

头条要闻

袭击伊朗后 特朗普首次发表白宫讲话:将不惜一切代价

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

特朗普“不惜一切”!全球股债齐崩

汽车要闻

第一梯队辅助驾驶加持 iCAR V27定档3月13日上市

态度原创

艺术
亲子
手机
本地
公开课

艺术要闻

Nihad Aghazada:当代阿塞拜疆画家

亲子要闻

萌娃竟想当爸爸?童言童语惹爸爸妈妈爆笑

手机要闻

OPPO Find X9 Ultra官宣首登全球市场!预定「全球影像机皇」?

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版