█脑科学动态
Science:多巴胺神经元“奖励机制”削弱减肥药效果
Science:首次捕获线粒体呼吸链超复合体天然结构
脑细胞的可塑性比以前认为的更强
关节置换金属可侵入脑脊液,长期神经毒性引关注
怀旧音乐激活双重脑网络,或成记忆障碍干预新工具
多巴胺是运动技能学习的“开关”,阻断后学习能力归零
主动感知+语言:人类高效比较物体的两大“外挂”
短时任务处理速率达42比特/秒,长时任务遵循幂律衰减
大脑多任务“卡顿”之谜破解:额顶叶网络是“单线程”瓶颈
看电影也能画脑图,MIT团队绘制最全大脑皮层功能网络图谱
█AI行业动态
狗狗也能听懂AI?文字转狗吠黑科技来了
Google Research提出评估LLMs跨语言知识迁移能力的新测试
Anthropic公司推出专为高等教育机构设计的人工智能助手
█AI驱动科学
大语言模型通过图灵测试,GPT-4.5伪装人类成功率超七成
Meta团队突破注意力机制瓶颈,多词注意力让大模型更“聪明”
AI定制膝关节置换术为“罗圈腿”患者带来福音
机器人学会"皱眉思考",人类更愿信任它
大语言模型“聪明”是假象,依赖模板复述而非真实推理
AI也会“压力山大”?大语言模型表现竟与人类惊人相似
神经网络自组织奥秘揭晓:MIT团队发现表征对齐统一理论
脑科学动态
Science:多巴胺神经元“奖励机制”削弱减肥药效果
为何减肥药对暴饮暴食者效果有限?加州大学圣地亚哥分校和霍华德休斯医学研究所的Zhu等团队发现,腹侧被盖区多巴胺神经元(VTADA)被美味食物激活后会延长进食时间,并抵抗减肥药索马鲁肽的抑制作用。
▷腹侧被盖区多巴胺释放神经元在进食过程中控制食欲。Credit: Science (2025).
研究通过光遗传学和闭环神经调控技术,揭示小鼠大脑中“蓝斑周围→腹侧被盖区(VTA)”神经回路的作用:VTADA神经元仅在进食时响应美味信号,其活动强度决定进食时长。索马鲁肽(GLP-1R激动剂类减肥药)通过抑制VTADA神经元减少进食,但长期用药后神经元活动逐渐恢复,导致药效下降。人工激活VTADA神经元可完全抵消药物作用,而靶向抑制则能恢复药效。研究还发现periLCVGLUT2神经元通过抑制VTA中的GABA神经元间接“解除”对VTADA神经元的抑制,形成正反馈循环。这一机制解释了为何享乐性饮食难以通过药物干预完全控制。研究发表在 Science 上。
#疾病与健康 #神经调控 #个性化医疗 #肥胖机制 #多巴胺神经元
阅读更多:
Zhu, Zhenggang, et al. “Hedonic Eating Is Controlled by Dopamine Neurons That Oppose GLP-1R Satiety.” Science, vol. 387, no. 6741, Mar. 2025, p. eadt0773. science.org (Atypon), https://doi.org/10.1126/science.adt0773
Science:首次捕获线粒体呼吸链超复合体天然结构
线粒体呼吸链如何原位组装,来自巴塞尔大学的研究团队以莱茵衣藻为模型,通过冷冻电子断层扫描(cryo-ET)技术,首次解析了 5 Å 分辨率的呼吸体(respirasome)天然结构,揭示了细胞色素 c 的结合位点及复合物间的相互作用界面。
研究采用冷冻聚焦离子束减薄(cryo-FIB)技术制备 100-200 nm 厚度的冷冻细胞切片,通过冷冻电子断层扫描(cryo-ET)获得线粒体嵴膜的高分辨率图像。结果显示,ATP 合酶(ATP synthase)与呼吸链复合物(I、III、IV)分别富集于嵴膜的弯曲和平坦区域。呼吸体由复合物 I、III、IV 组成,其原位结构(5 Å)与体外纯化样本(2.4 Å SPA cryo-EM)对比显示,天然环境中复合物间存在独特的构象变化和结合界面。此外,研究首次观察到电子载体细胞色素 c(cyt. c)在呼吸体上的结合位点,证实其在电子传递中的动态穿梭机制。这一成果为理解线粒体能量生产机制提供了直接证据。研究发表在 Science 上。
#神经科学 #神经机制与脑功能解析 #跨学科整合 #计算模型与人工智能模拟
阅读更多:
Waltz, Florent, et al. “In-Cell Architecture of the Mitochondrial Respiratory Chain.” Science, Mar. 2025. world, www.science.org, https://doi.org/10.1126/science.ads8738
脑细胞的可塑性比以前认为的更强
神经元亚型是否一成不变?加州大学圣克鲁斯分校的Mohammed Mostajo-Radji团队与Braingeneers合作,通过3D脑类器官模型发现,抑制性神经元身份可受环境调控,甚至实现亚型间转换。
▷计算机渲染的 parvalbumin 阳性神经元,研究人员首次能够在体外模型中大量生产这种神经元。Credit: iScience (2025).
研究首次在体外大量生成parvalbumin阳性神经元(PV神经元,调控大脑可塑性的关键细胞),并证实3D结构是成功关键。团队将小鼠MGE前体细胞移植到脑类器官(cerebral organoids,模拟大脑的3D培养体系)中,观察到PV神经元高效分化,远超2D模型。更惊人的是,已分化的somatostatin神经元(SST神经元)在3D环境中会转变成PV神经元,表明神经元身份具有可塑性。单细胞RNA测序显示,这一过程伴随PV成熟标记上调、SST标记下调。研究还发现,人皮层环境比鼠皮层更易触发这种转变,暗示物种特异性信号的存在。该发现为研究神经发育疾病(如孤独症、精神分裂症)提供了新工具,并提示大脑可能通过环境信号动态调整神经元功能。研究发表在 iScience 上。
#神经科学 #神经机制与脑功能解析 #跨学科整合 #类器官技术 #神经元可塑性
阅读更多:
Mostajo-Radji, Mohammed A., et al. Fate Plasticity of Interneuron Specification. bioRxiv, 3 Oct. 2024, p. 2024.10.02.614266. bioRxiv, https://doi.org/10.1101/2024.10.02.614266
关节置换金属可侵入脑脊液,长期神经毒性引关注
人工关节植入物释放的金属颗粒是否危害中枢神经系统,柏林夏里特医学院团队通过检测204名患者的脑脊液和血液,首次证实钴、钛等金属能穿透神经屏障并积累,相关结果或解释部分术后神经症状。
研究通过电感耦合等离子体质谱(ICP-MS,一种高精度金属检测技术)分析患者样本,发现植入组脑脊液钴中位数(0.03 μg/L)显著高于对照组(0.02 μg/L),且钴铬钼合金使用者脑脊液铬浓度更高(0.31 μg/L vs. 0.23 μg/L)。钛、铌、锆在血清升高时脑脊液水平同步增加,但血脑屏障功能(通过S-100B蛋白评估)未受损。疼痛症状与脑脊液钴浓度正相关,提示金属释放可能与局部磨损有关。研究强调需进一步探究这些金属是否导致认知障碍或神经退行性疾病。研究发表在 JAMA Network Open 上。
#疾病与健康 #个性化医疗 #金属毒性 #关节置换
阅读更多:
Rakow, Anastasia, et al. “Metal Concentrations in Blood and Cerebrospinal Fluid of Patients With Arthroplasty Implants.” JAMA Network Open, vol. 8, no. 3, Mar. 2025, p. e252281. Silverchair, https://doi.org/10.1001/jamanetworkopen.2025.2281
怀旧音乐激活双重脑网络,或成记忆障碍干预新工具
音乐如何通过神经机制增强记忆?南加州大学Assal Habibi团队发现,怀旧音乐能同步激活大脑记忆与奖赏系统,为阿尔茨海默病等患者提供非药物干预潜力。
▷fMRI 任务设计 (A) 和一次运行内歌曲三连音的示例混排 (B)。在面板 B 中,FC = 熟悉的控制歌曲块,UC = 不熟悉的控制歌曲块,N = 怀旧歌曲块,R = 休息时间。数字表示在三连音中的位置(即,FC1 是熟悉的控制歌曲,在音乐上与怀旧歌曲 1 (N1) 和不熟悉的控制歌曲 1 (UC1) 相匹配)。Credit: Human Brain Mapping (2025).
团队利用机器学习构建三类音乐(怀旧/熟悉非怀旧/陌生非怀旧),通过功能性磁共振成像(fMRI)分析57名参与者的脑区响应。结果显示:怀旧音乐独特激活默认模式网络(DMN,负责记忆整合)、奖赏网络及内侧颞叶(记忆关键区);自我参照区(后内侧皮层)与情感区(岛叶)功能连接增强;老年人相关脑区血氧水平依赖(BOLD)信号更强,且反应与情感体验直接相关,青年则关联认知能力。研究为音乐疗法临床转化奠定神经科学基础。研究发表于 Human Brain Mapping。
#疾病与健康 #神经机制与脑功能解析 #个性化医疗 #心理健康与精神疾病 #记忆机制
阅读更多:
Hennessy, Sarah, et al. “Music-Evoked Nostalgia Activates Default Mode and Reward Networks Across the Lifespan.” Human Brain Mapping, vol. 46, no. 4, 2025, p. e70181. Wiley Online Library, https://doi.org/10.1002/hbm.70181
多巴胺是运动技能学习的“开关”,阻断后学习能力归零
以色列理工学院Hadas Benisty、Jackie Schiller、Amir Ghanayim及Ronen Talmon团队发现,多巴胺在初级运动皮层(M1)的局部释放是神经网络重组的关键驱动力,缺乏它则学习完全停滞。
▷示意图突出显示了从 VTA 到 M1 的多巴胺能输入在运动学习中的重要作用。Credit: Nature Communications (2025).
研究通过钙成像(GCaMP6s标记神经元活动)和化学遗传学技术(DREADDs抑制多巴胺信号),观察小鼠学习前肢取食任务时的M1神经网络变化。结果显示,正常学习中,第2-3层神经元的功能连接逐渐形成“专家”配置,且感官信号转为任务结果反馈。但阻断VTA到M1的多巴胺输入后,神经网络冻结,小鼠无法进步;恢复多巴胺则学习继续。值得注意的是,多巴胺仅影响新技能获取,对已掌握技能无干扰。研究提出多巴胺通过强化学习机制重塑M1网络连接,为帕金森病等运动障碍的治疗提供靶点。研究发表在 Nature Communications 上。
#神经科学 #神经机制与脑功能解析 #神经调控 #运动学习 #多巴胺
阅读更多:
Ghanayim, Amir, et al. “VTA Projections to M1 Are Essential for Reorganization of Layer 2-3 Network Dynamics Underlying Motor Learning.” Nature Communications, vol. 16, no. 1, Jan. 2025, p. 200. www.nature.com, https://doi.org/10.1038/s41467-024-55317-4
主动感知+语言:人类高效比较物体的两大“外挂”
人类如何高效判断两物体是否相同?圣达菲研究所的Marina Dubova和Arseny Moskvichev团队发现,人们依赖“主动感知”和语言描述两种策略,显著降低记忆负担并提升准确性。
▷Credit: Attention, Perception, & Psychophysics (2025).
研究设计实验让参与者对比模糊且仅能局部观看的图像对,发现其普遍采用感知卸载(perceptual offloading,即频繁切换视线对比图像),尤其在图像难区分时。实验数据显示,允许自由切换时,参与者反应更快(速度提升约30%)、准确率更高(达85%以上);而强制单图观看时,准确率下降至70%,且需依赖语言描述细节(如“左图有红色斑点”),但仅对易语言化(verbalizable)的刺激有效。
进一步分析表明,当图像特征难以命名(如抽象图案)且感知受限时,参与者效率骤降(错误率增加50%)。研究提示,人类通过动态分配认知资源——优先“外包”任务给感知系统,其次调用语言系统——实现高效比较。研究发表在 Attention, Perception, & Psychophysics 上。
#认知科学 #神经机制与脑功能解析 #计算模型与人工智能模拟 #视觉感知
阅读更多:
Dubova, Marina, and Arseny Moskvichev. “The Role of Active Perception and Naming in Sameness Comparison.” Attention, Perception, & Psychophysics, Mar. 2025. Springer Link, https://doi.org/10.3758/s13414-025-03046-1
记忆竞赛揭示大脑极限:短时任务处理速率达42比特/秒,长时任务遵循幂律衰减
人脑信息处理速率是否被低估?慕尼黑大学(LMU Munich)的Bastian Wiederhold团队通过分析国际记忆竞赛数据发现,短时记忆任务中大脑实际处理速率可达42比特/秒,远超传统认知的10比特/秒,而长时任务中速率随记忆时间呈幂律下降。
研究整合了国际记忆协会(IAM)、Memory League(ML)和speed-memory.com的竞赛数据,涵盖1秒至1小时的记忆任务。通过计算最低必要信息速率(bit/s),团队发现:短时任务(如数字速记)中,选手的阅读速度成为瓶颈,但实际心理联想(mental association)形成更快;跨时间尺度上,处理速率与记忆时长呈幂律关系(power law),即速率=时间^α,α为负值;尽管记忆策略优化使竞赛成绩提升,任务间速率差异模式保持稳定,提示大脑处理机制存在普适性规律。研究为理解人脑信息处理极限提供了新视角,挑战了“大脑低速”的固有认知。
#认知科学 #记忆机制 #神经机制与脑功能解析 #计算模型与人工智能模拟
阅读更多:
Wiederhold, Bastian. The Speed of Information Processing at Memory Competitions: Limited by Reading in Short Tasks and Declining as a Power Law for Longer Times. bioRxiv, 1 Apr. 2025, p. 2025.03.31.646314. bioRxiv, https://doi.org/10.1101/2025.03.31.646314
大脑多任务“卡顿”之谜破解:额顶叶网络是“单线程”瓶颈
为什么人类无法高效同时处理两项复杂任务?范德堡大学的Qiuhai Yue、Allen T. Newton和René Marois团队通过超快速脑成像技术,首次发现额顶叶多需求网络(MD network)是导致多任务“串行排队”的关键脑区,为认知瓶颈提供了直接神经证据。
研究采用超快速功能磁共振成像(fMRI,199毫秒时间分辨率)和高场强(7T)设备,结合多变量分析(multivariate analyses,区分不同任务的大脑活动模式),实时追踪双任务下的大脑活动。实验设计避免感觉运动模态重叠,确保瓶颈仅源于认知阶段。
结果显示:视觉和听觉皮层同时处理两类任务;额顶叶MD网络(如背外侧前额叶和后顶叶)对第二任务的反应延迟300-500毫秒,形成“单线程”队列;MD网络与运动皮层(如辅助运动区)共同构成瓶颈,而反应执行仍可并行。这一发现解释了为何“边开车边打电话”非常危险,因为高级认知资源被迫排队。研究发表在 Nature Communications 上。
#认知科学 #神经机制与脑功能解析 #跨学科整合 #计算模型与人工智能模拟
阅读更多:
Yue, Qiuhai, et al. “Ultrafast fMRI Reveals Serial Queuing of Information Processing during Multitasking in the Human Brain.” Nature Communications, vol. 16, no. 1, Mar. 2025, p. 3057. www.nature.com, https://doi.org/10.1038/s41467-025-58228-0
看电影也能画脑图,MIT团队绘制最全大脑皮层功能网络图谱
大脑如何分工协作处理复杂信息?MIT的Robert Desimone、剑桥大学John Duncan及Reza Rajimehr团队通过电影刺激下的脑扫描,首次绘制包含24个功能网络的皮层图谱,揭示自然情境下的脑区动态协作机制。
▷Credit: Christine Daniloff, MIT; Shutterstock
研究依托人类连接组计划(Human Connectome Project),使用7特斯拉高分辨率fMRI记录176人观看电影时的脑活动。通过机器学习聚类分析,团队不仅确认了语言、视觉等经典网络,还发现前额叶存在对场景高度敏感的新网络(此前未被报道)。更关键的是,执行控制网络(executive control networks)与感觉/语言网络呈现“推拉”式互动——当处理特定信息(如人脸)时,控制网络静默;而电影情节转折时,控制网络活跃以协调全局。这种动态平衡解释了大脑如何高效分配资源。此外,社交处理网络内部分化为“人-物交互”和“人-人交互”子区,凸显功能精细化。研究为自然认知研究奠定框架,未来可深入探索网络亚区机制。研究发表在 Neuron 上。
#神经科学 #神经机制与脑功能解析 #跨学科整合 #计算模型与人工智能模拟 #自然认知
阅读更多:
Rajimehr, Reza, et al. “Functional Architecture of Cerebral Cortex during Naturalistic Movie Watching.” Neuron, vol. 112, no. 24, Dec. 2024, pp. 4130-4146.e3. www.cell.com, https://doi.org/10.1016/j.neuron.2024.10.005
AI 行业动态
狗狗也能听懂AI?文字转狗吠黑科技来了
ElevenLabs近日宣布推出全球首款专为狗狗设计的AI语音合成模型Text to Bark(文字转狗吠),用户只需输入文字并选择犬种,系统即可生成逼真的狗吠声。独立测试显示,95%的狗狗无法区分AI生成的吠声与真实吠声。
该技术基于开源犬类语言学研究(Canine Linguistic Research,即分析狗吠声的学术领域),由ElevenLabs团队开发。研究人员表示,这一突破不仅为宠物主人提供了趣味工具,还可能为动物行为学研究开辟新路径。企业用户还可通过Bark to Speech API接入服务,并享受包括双重爪纹认证(2FP,即2-Factor Pawthentication)在内的安全功能。
ElevenLabs此前以高拟真文字转语音(Text to Speech)和语音转文字(Scribe)技术闻名,此次创新进一步巩固了其在生成式AI领域的领先地位。团队戏称这是“人类的一小步,狗狗的一大步”,并计划未来拓展至其他动物语言模型。
#AI语音合成 #跨物种沟通 #宠物科技 #ElevenLabs #狗吠生成
阅读更多:
https://elevenlabs.io/blog/text-to-bark
Google Research提出评估LLMs跨语言知识迁移能力的新测试
Google Research近期推出了ECLeKTic,这是一个用于评估大型语言模型(LLMs)跨语言知识迁移能力的全新基准测试。该基准测试通过控制12种语言中维基百科文章的存在与否,精心设计了一系列知识问答任务,旨在检测模型在源语言中获取的知识能否有效地迁移并应用于目标语言。
团队首先筛选出在某些语言中存在,而在其他语言中缺失的维基百科文章。然后,在文章存在的语言中生成与该文章相关的问题,并将这些问题翻译成其他缺少该文章的语言。这样,模型在回答这些目标语言问题时,必须依赖于在源语言中学到的知识,从而评估其跨语言知识迁移的能力。实验结果显示,即使是当前最先进的LLMs,在跨语言知识迁移方面仍存在显著挑战。例如,模型在源语言中能够正确回答的问题,换成目标语言后,准确率明显下降。这表明,尽管模型在多语言环境下接受了训练,但在深层次的知识迁移和应用上仍有待提升。
#认知科学#跨语言知识迁移#大型语言模型#基准测试
阅读更多:
https://research.google/blog/eclektic-a-novel-benchmark-for-evaluating-cross-lingual-knowledge-transfer-in-llms/
Anthropic公司推出专为高等教育机构设计的人工智能助手
Anthropic公司推出专为高等教育机构设计的人工智能助手——Claude for Education。该版本旨在协助大学在教学、学习和行政管理中有效地应用人工智能技术,确保教育工作者和学生在塑造人工智能在社会中的角色方面发挥积极作用。
Claude for Education引入了“学习模式”(Learning mode),这一新功能旨在引导学生的推理过程,而非直接提供答案,从而培养他们的批判性思维能力。具体而言,Claude会通过提问“你会如何解决这个问题?”来鼓励学生自主思考,而不是直接给出解决方案。此外,Claude还采用苏格拉底式提问法(Socratic questioning),例如询问“有哪些证据支持你的结论?”,以帮助学生深入理解问题的本质。同时,Claude强调核心概念的理解,突出特定问题背后的基本原理,并提供研究论文、学习指南和大纲等结构化模板,辅助学生的学习过程。
通过Claude for Education,Anthropic致力于为教育机构提供安全、可靠的人工智能访问权限,支持学生撰写文献综述、解决复杂问题,并获得论文反馈;帮助教师创建符合特定学习目标的评分标准,提供个性化反馈;协助行政人员分析招生趋势、自动回复常见咨询,并将复杂的政策文件转换为易于理解的FAQ格式。
Claude for Education的推出,标志着Anthropic在推动人工智能与教育深度融合方面迈出了重要一步,为高等教育机构提供了强有力的支持,助力培养具备批判性思维和创新能力的人才。
#认知科学#人工智能#教育技术#高等教育
阅读更多:
https://www.anthropic.com/news/introducing-claude-for-education
AI 驱动科学
大语言模型通过图灵测试,GPT-4.5伪装人类成功率超七成
AI能否通过图灵测试引发长达75年的争论。加州大学圣地亚哥分校的Cameron R. Jones和Benjamin K. Bergen团队通过两项随机对照实验发现,GPT-4.5在拟人化提示下被73%的参与者误认为人类,成为首个通过标准三方图灵测试的AI系统。
研究采用经典三方图灵测试框架,284名参与者与AI(GPT-4.5、LLaMa-3.1、ELIZA)及真人进行5分钟对话。关键发现:模型表现:GPT-4.5在“拟人化提示”(PERSONA prompt,即模拟年轻网民性格)下通过率高达73%,显著高于人类对照组(p<0.01);LLaMa-3.1通过率56%,与人类无差异。基线对比:规则型AI ELIZA(1960年代技术)通过率仅23%,GPT-4o为21%,证实测试有效性。机制分析:拟人化提示使模型更擅长使用网络俚语和个性化表达(如“emoji滥用”),而基线提示(NO-PERSONA)仅提供基础指令,表现较差。
#大模型技术 #意图与决策 #跨学科整合 #自动化科研 #认知科学
阅读更多:
Jones, Cameron R., and Benjamin K. Bergen. Large Language Models Pass the Turing Test. arXiv:2503.23674, arXiv, 31 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.23674
Meta团队突破注意力机制瓶颈,多词注意力让大模型更“聪明”
传统注意力机制因依赖单一词向量相似性,难以精准定位复杂上下文信息。Meta的FAIR团队(Olga Golovneva、Tianlu Wang、Jason Weston、Sainbayar Sukhbaatar)提出多词注意力(MTA),通过卷积操作整合多词信息,显著提升模型性能。
研究团队设计的多词注意力(MTA)在传统注意力机制基础上,引入三维卷积(覆盖键、查询和注意力头),使模型能同时分析多个词向量的关联。例如,MTA可先分别定位“Alice”和“rabbit”,再结合两者注意力权重找到共现的句子。实验显示,MTA在玩具任务中轻松解决传统注意力无法处理的难题。在大规模语言建模任务中(880M参数,105B训练数据),MTA将验证困惑度(perplexity)降低,且参数量仅增加0.001%。长上下文任务如“大海捞针”(Needle-in-the-Haystack)和BabiLong中,MTA性能远超基线模型。这一成果为大模型的高效信息检索提供了新思路。
#大模型技术 #预测模型构建 #跨学科整合 #计算模型与人工智能模拟
阅读更多:
Golovneva, Olga, et al. Multi-Token Attention. arXiv:2504.00927, arXiv, 1 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.00927
AI定制膝关节置换术为“罗圈腿”患者带来福音
传统膝关节置换术对天生腿部弯曲患者效果不佳,奥克兰大学Simon Young团队开发AI辅助“功能对齐”技术,通过机器人分析个体解剖数据,优化假体定位。临床试验显示,该技术显著提升患者术后生活质量和满意度。
研究采用随机对照试验(n=244),对比传统机械对齐(MA)与功能对齐(FA)。FA组通过人工智能算法分析患者膝关节三维影像,从2万种虚拟方案中筛选最佳匹配,并动态调整软组织平衡(soft-tissue balance,即关节周围韧带张力协调)。结果发现,FA组自然弯曲腿患者的KOOS症状评分(86.6±12.9 vs 82.5±14.0)和生活质量评分(76.1±20.3 vs 70.7±22.7)显著更高,且94%患者愿意推荐该技术(MA组82%)。FA还减少65%的软组织松解需求。研究发表在 Journal of Arthroplasty 上。
#疾病与健康 #个性化医疗 #AI驱动科学 #骨科手术 #机器人辅助
阅读更多:
Young, Simon W., et al. “The John N. Insall Award: Functional Versus Mechanical Alignment in Total Knee Arthroplasty: A Randomized Controlled Trial.” The Journal of Arthroplasty, vol. 0, no. 0, Feb. 2025. www.arthroplastyjournal.org, https://doi.org/10.1016/j.arth.2025.02.065
机器人学会"皱眉思考",人类更愿信任它
如何让机器人摆脱"恐怖谷"的冰冷感?广岛大学Shushi Namba团队联合RIKEN发现,赋予机器人"思考表情"是关键。通过模仿人类沉思时的皱眉动作,安卓机器人Nikola成功获得更高亲和力。
▷皱眉症患者眉毛下垂,眼睛眯起。Credit: Shushi Namba/Hiroshima University
研究分三阶段:首先用非负矩阵分解(NMF)解析人类思考时的5类面部模式(如眯眼、嘴角紧绷),从中选定"皱眉脸"(Component 4)作为最显著特征。随后,团队在机器人Nikola面部复现该表情,并通过240段视频测试发现,89%参与者认为皱眉机器人更"真实"且减少33%的诡异感。在模拟寿司店问答场景中,思考脸使机器人"人性化"评分提升40%,效果优于传统加载动画(dots)。但研究也指出,动态表情整合与文化差异是下一步重点。研究发表在 International Journal of Social Robotics 上。
#认知科学 #跨学科整合 #人机交互 #恐怖谷效应 #表情建模
阅读更多:
Namba, Shushi, et al. “How an Android Expresses ‘Now Loading…’: Examining the Properties of Thinking Faces.” International Journal of Social Robotics, vol. 16, no. 8, Aug. 2024, pp. 1861–77. Springer Link, https://doi.org/10.1007/s12369-024-01163-9
大语言模型“聪明”是假象,依赖模板复述而非真实推理
大语言模型的“推理能力”是真实理解还是数据复述?字节跳动研究团队设计 RoR-Bench 评测集,通过对比原题与微调变异题,发现GPT-4、Claude等模型在语义变化下准确率骤降超50%,揭示其“复述模板”的固有缺陷。
研究团队构建包含215对题目的 RoR-Bench(含文本与图像任务),每对包含原题和仅改动关键条件的变异题(如“相向而行”改为“相背而行”)。测试显示,所有模型在变异题上平均准确率从70-90%跌至20-30%,部分模型(如DeepSeek-R1)下降超60%。多模态模型同样中招,如GPT-4V在视觉错觉题中“背答案”。团队尝试强制纠正提示(Forced Correct Prompt)、少样本学习(Few-shot Learning)等方法,效果均有限。研究表明,LLMs的“推理”实为对训练模板的匹配,缺乏对语义细微差异的敏感度。
#大模型技术 #计算模型与人工智能模拟 #跨学科整合 #语义理解 #AI评测
阅读更多:
Yan, Kai, et al. Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? arXiv:2504.00509, arXiv, 1 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.00509
AI也会“压力山大”?大语言模型表现竟与人类惊人相似
压力如何影响AI?中国科学院自动化研究所的团队开发StressPrompt提示集,发现大语言模型在压力下的表现曲线与人类几乎一致:中等压力提升任务表现,极端压力导致性能下降。
研究基于压力与应对理论(Stress and Coping Theory)等心理学框架,设计100条压力提示,由人类评分分级后应用于Llama-3等模型。结果显示,在数学推理(MATH)任务中,Llama-3-8B-Instruct在中等压力(6分)时得分比低压力(1分)提升72倍(0.04→2.93分)。情绪智能(EQ-Bench)任务中,适度压力增强模型表现,但高压力会加剧偏见(ToxiGen数据集)。团队通过表征工程(Representation Engineering)开发的压力扫描仪发现,LLMs深层神经活动对压力敏感,类似人脑高级认知区。这一发现为AI在客服、急救等高压场景的优化提供新思路,例如通过动态调节“压力”提升表现。
#认知科学 #大模型技术 #跨学科整合 #计算模型与人工智能模拟
阅读更多:
Shen, Guobin, et al. StressPrompt: Does Stress Impact Large Language Models and Human Performance Similarly? arXiv:2409.17167, arXiv, 28 Jan. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2409.17167
神经网络自组织奥秘揭晓:MIT团队发现表征对齐统一理论
神经网络如何高效学习数据特征?麻省理工学院CSAIL的Tomaso Poggio与博士后Liu Ziyin团队提出突破性理论,揭示神经网络训练中表征、权重与梯度的自对齐机制,为解释深度学习「黑箱」提供了统一框架。
研究提出典型表征假设(CRH),证明神经网络每层的潜在表征(latent representations)、权重和神经元梯度(neuron gradients)会在训练中自动对齐,形成紧凑且任务无关的特征表达。当人为打破对齐时,三者转为多项式关系(PAH)。团队通过图像分类和自监督学习实验验证,发现这种机制能解释神经崩溃(neural collapse,即类别表征高度结构化)等现象。例如,在CIFAR-10任务中,对齐层的特征维度缩减了70%。研究还指出,通过梯度噪声注入可人工调控表征结构。
#AI驱动科学 #神经机制与脑功能解析 #计算模型与人工智能模拟 #跨学科整合
阅读更多:
Ziyin, Liu, et al. Formation of Representations in Neural Networks. arXiv:2410.03006, arXiv, 27 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2410.03006
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.