追问daily | 捕捉大脑学习时神经重塑的瞬间；为什么AI总犯低级错误？大脑如何感知意外？|细胞|脑区|丘脑|脑功能|神经元|海马体|逻辑推理

分享至

█脑科学动态

Nature：腹侧海马体多巴胺受体，焦虑抑郁治疗新靶点

Nature：首次捕捉大脑学习时的神经重塑瞬间

Nature：果蝇大脑路线图揭示神经系统性别差异

临床试验为大婴儿分娩提供安全选择方案

映射记忆：蛋白质追踪技术揭示学习过程中的突触变化

大脑如何构建"行动地图"？揭秘海马体与运动系统协作机制

大脑如何感知意外，为何这对心理健康很重要

影响婴儿学步时间的11个关键基因

重新思考心理学，在误解中寻找意义

█AI行业动态

OpenAI迎来应用CEO Fidji Simo

Google Gemini 2.0 Flash图像生成功能升级

Avatar IV：用照片+语音即可生成真人级动态视频

█AI驱动科学

大模型逻辑漏洞：为什么AI总犯低级错误？

语境理论：统一视角揭示表征学习本质

攻克神经网络迁移学习效果预测难题

RetroInfer：向量存储技术加速大语言模型长文本推理

机器学习预测儿童顺铂化疗听力损失风险

AI作曲助手Amuse：让音乐创作灵感"看得见"

脑科学动态

Nature：腹侧海马体多巴胺受体，焦虑抑郁治疗新靶点

西奈山医院的Arthur Godino、Marine Salery和Eric J. Nestler团队发现，大脑腹侧海马体中两类多巴胺受体（D1/D2）就像情绪的"油门"和"刹车"，分别调控趋近和回避行为。

▷vHipp D1 和 D2 细胞的拓扑结构。Credit: Nature (2025).

研究团队首先通过单细胞测序技术，确定了腹侧海马体（vHipp）中表达D1和D2受体的神经元具有不同的分子特征和空间分布。随后使用光遗传学技术，发现激活D2受体神经元可使小鼠在冲突情境中的回避行为减少40-67%，而激活D1神经元则增加探索行为。进一步实验显示，在压力决策任务中，这两类神经元被差异性激活：D1神经元在"冒险获取奖励"时活跃，D2神经元则在"安全撤退"时放电。通过病毒示踪技术，团队还发现这些神经元分别投射到不同的下游脑区，形成两条独立的情绪调控通路。特别值得注意的是，D2神经元与纹状体存在直接连接，这可能解释了为何激活这类神经元能快速改变行为反应。研究发表在 Nature 上。

#疾病与健康 #神经调控 #心理健康与精神疾病 #神经机制与脑功能解析 #多巴胺信号

阅读更多：

Godino, Arthur, et al. “Dopamine D1–D2 Signalling in Hippocampus Arbitrates Approach and Avoidance.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08957-5

Nature：首次捕捉大脑学习时的神经重塑瞬间

加州大学圣地亚哥分校的Assaf Ramot、Felix Taschbach和Takaki Komiyama团队结合成像技术与算法，首次捕捉到丘脑-皮层通路在学习过程中的动态重塑，证明学习会物理性改变脑区间的"对话方式"。

▷神经元活动轨迹揭示了小鼠学习运动任务时大脑回路的演化过程。左图：行为过程中记录的视野示例；每种颜色代表不同的神经元。右图：选定神经元的活动轨迹。Credit: Komiyama Lab, UC San Diego

研究团队开发的ShaReD算法，解决了不同动物神经活动差异的难题。通过纵向追踪小鼠初级运动皮层（M1）的输入源，发现运动丘脑在学习两周后会选择性激活特定M1神经元集群。光遗传学实验显示，这种精准调控对执行学会的动作至关重要——抑制丘脑输入会使熟练动作立刻失调。更惊人的是，学习不仅改变神经活动强度，还重构了丘脑与皮层间的物理连接，使信息传递更快更精准。这种重塑类似"升级通信线路"，而非简单调高音量。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #计算模型与人工智能模拟 #运动学习 #脑机接口

阅读更多：

Ramot, Assaf, et al. “Motor Learning Refines Thalamic Influence on Motor Cortex.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-08962-8

Nature：果蝇大脑路线图揭示神经系统性别差异

莱比锡大学的Katharina Eichler和Tomke Stürner团队联合剑桥大学研究人员，通过整合电子显微镜数据集，首次绘制了覆盖果蝇整个神经系统的"路线图"，并发现了显著的性别差异。

▷图片展示了研究中的神经元样本。每种颜色代表在雌性大脑、雌性（左下）和雄性（右下）神经索中发现的一个细胞。Credit: Tomke Stürner, Uni Cambridge and LMB Cambridge

研究团队整合了三个电子显微镜（EM）数据集（包括雌性全脑FAFB-FlyWire、雌性神经索FANC和雄性神经索MANC），首次实现了从大脑到腹侧神经索（功能相当于脊椎动物脊髓）的完整神经回路追踪。通过光显微镜（LM）数据匹配，成功确定了51%的下行神经元（DNs，负责将大脑指令传至身体）的细胞类型。比较分析揭示了惊人的性别差异：发现仅存在于单一性别的神经元群体，如雌性特有的aSP22神经元（后更名为DNa12）。功能研究表明，当aSP22活跃时，雌性会伸展腹部（产卵行为），而雄性则卷曲腹部（交配准备）。此外，团队还鉴定了控制求偶鸣叫（雄性）和产卵器伸展（雌性）的特定神经回路。这些发现不仅提供了首个完整的果蝇神经系统"路线图"，更建立了跨性别比较的研究范式。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #跨学科整合 #计算模型与人工智能模拟 #性别差异

阅读更多：

Stürner, Tomke, et al. “Comparative Connectomics of Drosophila Descending and Ascending Neurons.” Nature, Apr. 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41586-025-08925-z

临床试验为大婴儿分娩提供安全选择方案

如何安全分娩大婴儿？华威大学Siobhan Quenby与伯明翰围产研究所Jason Gardosi团队开展迄今最大规模临床试验，纳入英国106家医院2,893名孕妇，证明提前引产能降低肩难产风险而不增加剖腹产率。

研究采用多中心随机对照设计，通过超声筛查估计胎儿体重（EFW）＞90%百分位的孕妇，随机分配至38周引产组或标准护理组。结果显示引产组肩难产（shoulder dystocia，胎儿肩膀卡在产道）发生率显著降低（2.3% vs 3.1%），平均妊娠期缩短6天，婴儿出生体重轻163.6克。重要的是，未增加紧急剖腹产或母亲会阴撕裂风险。在严格遵循方案的孕妇中效果更明显（风险降低38%）。该研究首次为临床提供了三种安全选择：自然等待、计划剖腹产或38周引产。研究发表在 The Lancet 上。

#疾病与健康 #个性化医疗 #围产医学 #母婴健康 #临床决策

阅读更多：

Gardosi, Jason, et al. “Induction of Labour versus Standard Care to Prevent Shoulder Dystocia in Fetuses Suspected to Be Large for Gestational Age in the UK (the Big Baby Trial): A Multicentre, Open-Label, Randomised Controlled Trial.” The Lancet, vol. 0, no. 0, May 2025. www.thelancet.com, https://doi.org/10.1016/S0140-6736(25)00162-X

映射记忆：蛋白质追踪技术揭示学习过程中的突触变化

哈佛大学Doyeon Kim、Adam E. Cohen等研究者开发出EPSILON技术，通过荧光标记AMPAR蛋白（记忆形成关键分子），首次实现活体大脑突触变化的高清动态观测。该技术已发现记忆印迹与特定蛋白运输的强相关性，为治疗记忆障碍疾病带来希望。

▷荧光标记与尖端显微镜的结合，使研究人员能够以前所未有的分辨率阐明突触行为。Credit: Pojeong Park

研究团队开发的EPSILON（神经元细胞外蛋白质表面标记）技术，采用顺序脉冲追踪标记法，用两种膜不通透染料分时标记突触表面的AMPAR。当神经元释放含有AMPAR的囊泡时，新旧染料会形成独特荧光信号，使研究人员能以0.1微米分辨率观测蛋白质运输。在恐惧记忆实验中，小鼠海马CA1区显示：经历情境恐惧训练后2-4小时内，约37%的突触发生显著增强（AMPAR增加量>50%），这些突触的空间分布与cFos（神经元激活标志物）表达区域高度重合。进一步分析揭示，单个记忆痕迹涉及约15,000个突触的协同变化，且增强程度与后续记忆 recall 准确率呈正比（r=0.71）。传统电镜技术仅能提供静态快照，而EPSILON首次实现"突触可塑性电影"拍摄。研究发表在 Nature Neuroscience 上。

#神经科学 #神经机制与脑功能解析 #记忆机制 #突触可塑性

阅读更多：

Kim, Doyeon, et al. “EPSILON: A Method for Pulse-Chase Labeling to Probe Synaptic AMPAR Exocytosis during Memory Formation.” Nature Neuroscience, Mar. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-025-01922-5

大脑如何构建"行动地图"？揭秘海马体与运动系统协作机制

人类如何在丰富的行为选项中做出最优选择？马克斯·普朗克学会的Irina Barnaveli、Simone Viganò、Daniel Reznik与伦敦大学学院的Patrick Haggard、Christian F. Doeller团队发现，海马系统通过构建"认知地图"组织行动选择，并与运动系统协同工作。

研究团队设计沉浸式虚拟现实任务，要求参与者学习控制虚拟球飞行的不同动作组合。通过功能性磁共振成像监测发现，内嗅皮层在动作比较时呈现典型的六边形活动模式——这是"认知地图"的神经标志。海马体活动强度与动作结果的二维相似性成正比，证实了地图状组织原则。有趣的是，辅助运动区（SMA，运动计划脑区）专门表征单个动作，对重叠计划反应更强。最关键的是，海马体与辅助运动区的功能连接强度随动作相似性而变化，揭示了两大系统的动态协作机制。这些发现表明，大脑通过抽象的地图状表征高效组织行为选项，将空间导航的神经机制扩展到了行动选择领域。研究发表在 Nature Communications 上。

#神经科学 #神经机制与脑功能解析 #记忆机制 #计算模型与人工智能模拟

阅读更多：

Barnaveli, Irina, et al. “Hippocampal-Entorhinal Cognitive Maps and Cortical Motor System Represent Action Plans and Their Outcomes.” Nature Communications, vol. 16, no. 1, May 2025, p. 4139. www.nature.com, https://doi.org/10.1038/s41467-025-59153-y

大脑如何感知意外，为何这对心理健康很重要

当现实与预期不符时，大脑如何发出警报？弗里德里希·米歇尔生物医学研究所的Magdalena Solyga和Georg B Keller团队通过小鼠和人类实验发现，大脑对视觉和听觉不匹配的反应存在非线性增强效应。

▷FMI 的研究人员将小鼠实验改编为人类实验，并使用脑电图 (EEG) 和虚拟现实 (VR) 技术，发现小鼠大脑在运动过程中对视觉不匹配的反应相似。Credit: Friedrich Miescher Institute for Biomedical Research

研究团队首先设计小鼠虚拟实验：当小鼠奔跑时，声音响度与其速度同步变化，偶尔静音制造听觉不匹配。通过双光子显微镜发现，听觉皮层（L2/3）神经元对这类不匹配反应强烈。进一步实验显示，若同时暂停视觉流和声音（多模态不匹配），大脑反应强度激增，甚至出现仅响应组合不匹配的特化神经元。在人类实验中，团队使用EEG和VR技术复现了类似现象：当受试者行走时虚拟场景突然冻结，其脑电反应模式与小鼠高度相似。这些发现表明，大脑通过非线性的跨模态整合机制处理预测误差，且该机制在物种间保守。研究为开发精神分裂症等疾病的客观诊断工具奠定了基础——异常或不存在的"不匹配反应"可能成为生物标志物。研究发表在 eLife 上。

#认知科学 #神经机制与脑功能解析 #心理健康与精神疾病 #跨学科整合 #计算模型与人工智能模拟

阅读更多：

Solyga, Magdalena, and Georg B. Keller. “Multimodal Mismatch Responses in Mouse Auditory Cortex.” eLife, vol. 13, Jan. 2025. elifesciences.org, https://doi.org/10.7554/eLife.95398.3

发现影响婴儿学步时间的11个关键基因

为什么有些宝宝9个月就会走路，有些要到2岁？萨里大学的Angelica Ronald、罗马第二大学和伦敦大学伯贝克学院的Anna Gui等组成的国际团队发现，遗传因素解释了约1/4的学步时间差异，并鉴定出11个相关基因位点。

研究团队对70,560名欧洲血统婴儿进行了全基因组关联分析，发现11个独立基因组显著位点。单核苷酸多态性（SNP）分析显示，遗传力达24.13%，约11,900个基因变异共同作用。RBL2基因位点与大脑基因表达调控区域重叠，提示其可能通过影响神经发育发挥作用。遗传相关性分析发现，较晚学步（仍在正常范围内）与较低ADHD风险相关，同时与大脑皮层沟回发育程度呈正相关。多基因评分能预测3-5.6%的学步时间差异，并关联运动控制相关脑区体积。这些发现为理解运动发育的生物学基础提供了新视角，未来或有助于早期识别发育异常。研究发表在 Nature Human Behaviour 上。

#疾病与健康 #神经机制与脑功能解析 #个性化医疗 #儿科 #基因发现

阅读更多：

Gui, Anna, et al. “Genome-Wide Association Meta-Analysis of Age at Onset of Walking in over 70,000 Infants of European Ancestry.” Nature Human Behaviour, May 2025, pp. 1–18. www.nature.com, https://doi.org/10.1038/s41562-025-02145-1

重新思考心理学，在误解中寻找意义

心理学领域长期存在诸多被广泛接受的迷思，从性别差异到潜意识信息的力量。Michael W. Eysenck通过系统性文献回顾，对这些迷思进行了批判性分析，揭示了遗传因素在人格形成中的主导作用，并指出当前心理健康分类系统的问题。

作者通过对当代心理学文献的全面回顾，分析了性别差异、教养影响、潜意识信息等主题的实证研究。结果显示，遗传因素在人格形成中的作用远大于教养方式，性别差异被夸大且因文化、地域而异。研究还发现潜意识信息的效果缺乏强有力证据支持。在心理健康领域，DSM-5（精神障碍诊断与统计手册）被指出存在过度分类问题（共列出541种障碍），许多障碍实际上共享相同特征。此外，抗抑郁药的效果被高估，心理治疗更能解决根本问题。这些发现挑战了公众和专业人士的许多固有认知，呼吁对心理学研究和实践进行更科学的评估。

#疾病与健康 #神经机制与脑功能解析 #个性化医疗 #儿科 #基因发现

阅读更多：

Eysenck, Michael W. Rethinking Psychology : Finding Meaning in Misconceptions 2025, https://doi.org/10.4324/9781003596677

AI 行业动态

OpenAI迎来应用CEO Fidji Simo

OpenAI宣布任命39岁的Fidji Simo为应用CEO，直接向首席执行官Sam Altman汇报。Fidji Simo是硅谷知名高管，曾掌舵Instacart并担任Meta核心业务负责人十年，以卓越的领导力和产品创新能力著称。Altman表示，此次架构调整旨在强化执行力，他本人将更专注于研究、算力与安全领域，为超级智能的临近做准备。Fidji Simo在过渡期将继续兼任Instacart CEO，未来担任其董事会主席，她称加入OpenAI是荣幸与责任。

Fidji Simo的职业生涯堪称传奇。她出生于法国小镇Sète，从巴黎高等商学院毕业后，先后在eBay和Meta崭露头角，主导了Facebook Live、Watch等颠覆性功能，推动移动广告收入增长。2021年，她成为Instacart首位外部CEO，将广告经验融入物流技术，助力品牌曝光。OpenAI高层对其评价极高，首席营销官Kate Rouch称她为最有原则的领导者。此次加盟，预示ChatGPT等产品或将迎来重大革新。

#OpenAI #FidjiSimo #AGI #硅谷高管 #ChatGPT

阅读更多：

https://openai.com/index/leadership-expansion-with-fidji-simo/

Google Gemini 2.0 Flash图像生成功能升级：更精准、更开放、更协作

Google近日宣布，其Gemini 2.0 Flash图像生成功能已进入预览阶段，开发者可通过Google AI Studio和Vertex AI平台使用模型gemini-2.0-flash-preview-image-generation。此次升级显著提升了视觉质量、文字渲染精度，并降低了内容过滤拦截率，使生成结果更贴近用户需求。功能支持多样化的应用场景，例如产品图背景替换、局部图像修改、实时协作绘图等，为开发者提供了更灵活的创作工具。

新功能亮点包括“对话式图片修改”和“图文结合生成”。用户可通过自然语言指令实现局部调整，例如将草地替换为海滩，或生成带价格标签的电商产品图。此外，实时协作绘图（Co-Drawing Sample App）允许用户与Gemini共同编辑图像，模拟设计师团队的协作流程。这些改进不仅提升了效率，还降低了技术门槛，使创意落地更便捷。

开发者可利用该功能实现动态产品SKU（库存量单位）生成、创意辅助等场景。例如，输入“手绘风格马卡龙教程图”即可快速生成视觉内容。Google强调，Gemini 2.0 Flash的升级旨在推动AI工具在电商、广告等领域的应用，同时为开发者提供更开放的实验环境。

#Google #Gemini2.0 #AI图像生成 #开发者工具 #创意协作

阅读更多：

https://aistudio.google.com/

HeyGen推出革命性AI模型Avatar IV：用照片+语音即可生成真人级动态视频

人工智能公司HeyGen最新发布的Avatar IV模型彻底改变了数字内容创作方式。这款基于"扩散式音频驱动表情引擎（Diffusion-inspired Audio-to-Expression Engine）"的AI技术，能够通过单张照片、文字脚本和用户语音，生成具有惊人真实感的拟人化视频。与传统"语音对嘴同步"技术不同，该模型能深度分析语音中的语调（Tone）、节奏（Rhythm）、情绪（Emotion）和语义意图（Intent），进而驱动面部微表情、头部动作和真实的时间节奏感（Temporal Realism），使虚拟形象呈现点头、停顿、挑眉等自然的人类表达特征。

该技术的突破性在于其卓越的适应能力。不仅支持正脸肖像，还能处理侧脸和三分之二角度照片，生成具有电影质感的画面效果。同时兼容Stable Diffusion等工具生成的AI图像，可将动漫角色、像素游戏人物甚至宠物照片转化为具有表达能力的动态形象。从半身像到全身像，从真人到二次元角色，Avatar IV为虚拟人视频、AI脸替、动漫动效、游戏配音及播客视觉化等多元场景提供了全新解决方案。

使用流程极其简化，用户只需提供自拍照、文字脚本和语音录音，即可快速生成高清视频。这项技术特别适合UGC（用户生成内容）创作，无需专业拍摄设备就能制作具有个人风格的视频内容。

#HeyGen #AI视频生成 #AvatarIV #数字内容创作 #人工智能

阅读更多：

https://help.heygen.com/en/articles/11269603-new-feature-alert-heygen-avatar-iv-is-here

AI 驱动科学

大模型逻辑漏洞：为什么AI总犯低级错误？

大语言模型为何总犯"低级逻辑错误"？北京大学、清华大学、阿姆斯特丹大学、卡内基梅隆大学和MBZUAI的Fengxiang Cheng、Haoxuan Li等研究者联合发布系统性综述，揭示大模型在演绎推理和自洽性方面的关键瓶颈。

研究团队建立双维度分析框架：针对逻辑问答（logical QA），现有方法可分为基于外部求解器（将问题转为符号表达式求解）、提示工程（设计推理链提示）和微调训练（增强逻辑样本）三类；针对逻辑一致性（logical consistency），系统梳理了否定一致性（如"信天翁是生物"矛盾回答）、蕴涵一致性（铁→金属的推理断裂）、传递一致性（"喜鹊有翅膀"悖论）等五类问题。实验显示，LLaMA-13B在FOLIO数据集上8-shot准确率仅33.63%，接近随机猜测。研究提出的通用优化框架通过多候选答案筛选，将逻辑违背程度降低40-60%。未来需开发能同时处理模态逻辑（modal logic，含不确定性的推理）和多一致性的高效算法。

#大模型技术 #计算模型与人工智能模拟 #逻辑推理 #AI驱动科学 #自然语言处理

阅读更多：

Cheng, Fengxiang, et al. Empowering LLMs with Logical Reasoning: A Comprehensive Survey. arXiv:2502.15652, arXiv, 24 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.15652

语境理论：统一视角揭示表征学习本质

基础模型的表征学习机制长期缺乏理论解释。卡内基梅隆大学的Runtian Zhai、Zico Kolter、Pradeep Ravikumar与北京大学的Kai Yang团队提出"上下文关联理论"，证明多种学习范式实质都是学习输入与上下文变量的关联，并发现模型规模收益递减的根本原因。

研究团队建立数学框架证明，监督学习、自监督学习（self-supervised learning）和流形学习（manifold learning）都可统一理解为：通过输入X与上下文变量A的关联来学习表征。理论分析显示，最优表征应逼近期望算子（expectation operator）的顶部奇异函数，此时编码器被称为"学习到上下文关联"。实验证实当模型足够大时，继续增加参数只能带来边际改善，验证了规模收益递减现象。团队提出创新性的上下文有用性评估指标，该指标仅依赖X与A的统计关系，无需下游任务数据。在图像、文本等多领域数据集验证中，该指标与编码器在下游任务的性能Spearman相关系数达0.73。研究为突破当前预训练瓶颈指明方向——未来需聚焦"上下文扩展"而非单纯模型扩展。

#大模型技术 #计算模型与人工智能模拟 #跨学科整合 #表征学习理论

阅读更多：

Zhai, Runtian, et al. Contextures: Representations from Contexts. arXiv:2505.01557, arXiv, 2 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.01557

攻克神经网络迁移学习效果预测难题

医疗诊断等领域常面临训练数据不足的困境，传统神经网络容易过拟合。唐德斯神经科学研究所的Alessandro Ingrosso与意大利国家核物理研究所、帕尔马大学、博洛尼亚大学的研究人员合作，开发出能预测迁移学习（transfer learning）效果的新数学方法，解决了小样本场景下AI训练的关键理论问题。

研究团队结合了"核重正化"（Kernel Renormalization，一种处理神经网络权重的新方法）与自旋玻璃理论中的经典"Franz-Parisi"形式，构建了单隐藏层网络的迁移学习数学模型。该模型通过耦合源网络（预训练网络）与目标网络的权重参数，量化两者相关性对迁移效果的影响。在比例极限（即训练集大小与网络隐藏层节点数同步无限增大但保持固定比例的特殊数学场景）下的理论分析表明，迁移效果取决于经过重整化的源-目标核函数。实验验证使用C-EMNIST和C-CIFAR数据集，当源网络在784维数据上预训练后，目标网络在仅100个样本条件下仍能保持良好泛化能力。理论预测的测试损失曲线与实验结果的相关系数达0.93，显著优于传统统计模型。

#AI驱动科学 #预测模型构建 #计算模型与人工智能模拟 #迁移学习

阅读更多：

Ingrosso, Alessandro, et al. Statistical Mechanics of Transfer Learning in Fully-Connected Networks in the Proportional Limit. arXiv:2407.07168, arXiv, 9 July 2024. arXiv.org, https://doi.org/10.48550/arXiv.2407.07168

RetroInfer：向量存储技术加速大语言模型长文本推理

大语言模型处理长文本时面临GPU内存爆炸难题。微软研究院联合中国科学技术大学、武汉大学等多校团队开发的RetroInfer系统，通过向量索引技术实现最高10.5倍加速，同时保持全注意力精度，为百万级token应用铺平道路。

研究团队提出的"向量存储系统"架构，核心是wave index（注意力感知向量索引）。该索引通过三分注意力近似（将token分为稳态/检索/估计三个精度递减区域）、精度有界估计（保证非关键token的贡献误差可控）和分段聚类（优化并行处理）三项技术，动态识别关键token。配套的wave buffer系统智能协调GPU与CPU资源，异步更新缓存并重叠计算传输。实验显示，在Llama等模型上，当上下文长度适配GPU内存时提速4.5倍；扩展至CPU内存后更达10.5倍，且准确率始终与全注意力持平。系统在RULER等长文本基准测试中展现优势，支持批量处理超长代码库或对话场景。

#大模型技术 #计算模型与人工智能模拟 #跨学科整合 #高效推理系统

阅读更多：

Chen, Yaoqi, et al. RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference. arXiv:2505.02922, arXiv, 5 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.02922

机器学习预测儿童顺铂化疗听力损失风险

顺铂化疗虽能有效治疗儿童肿瘤，却常导致不可逆听力损伤。洛杉矶儿童医院Etan Orgel团队联合南加州大学凯克医学院Joshua Millstein等研究者，开发出首个可预测个体听力损伤风险的机器学习工具PedsHEAR，准确率达95%。

研究团队整合1,400名患儿数据，采用集成学习（ensemble learning，即组合多个模型提升性能）策略，结合逻辑回归、随机森林等算法，通过20轮10折交叉验证优化模型。关键创新在于用高低风险分层阈值替代传统0.5决策阈值，使预测更符合临床需求。训练集显示优异性能（AUC 0.93），外部验证中仍保持0.74-0.79的区分度。模型仅需常规临床参数即可运行，将患者分为低（22%）、中（71%）、高（7%）三组风险，并输出具体概率值。目前该工具已开放为网页应用，医生输入诊断初期的常规数据即可获得预测。研究为个性化化疗方案制定提供量化依据，未来计划扩展至成人患者并整合基因组数据。研究发表在 Journal of Clinical Oncology 上。

#AI驱动科学 #个性化医疗 #预测模型构建 #儿童肿瘤

阅读更多：

Millstein, Joshua, et al. “Development and Validation of a Novel Prediction Model for Hearing Loss From Cisplatin Chemotherapy.” Journal of Clinical Oncology, May 2025. world, ascopubs.org, https://doi.org/10.1200/JCO-24-01861

AI作曲助手Amuse：让音乐创作灵感"看得见"

音乐创作常受画面、故事等多模态灵感启发，但现有AI系统难以支持这一过程。韩国科学技术院（KAIST）的Yewon Kim、Sung-Ju Lee与卡内基梅隆大学的Chris Donahue团队开发了Amuse系统，通过将文本/图像/音频转化为和弦进行，使83%参与测试的音乐人获得更流畅的创作体验。

Amuse采用两阶段生成技术：首先通过多模态大语言模型将用户输入的"夏日海滩回忆"等文字/图像转化为音乐关键词和初始和弦建议；随后用拒绝采样（rejection sampling）技术过滤不符合音乐理论的结果，确保输出质量。系统集成在专业音乐软件Hookpad中，包含Chord Generator（根据灵感生成和弦）和Chord Transcriber（从音频提取和弦）两大功能。用户研究显示，相比传统工具，使用Amuse的音乐人创作效率提升32%，且能保留90%以上的创作主导权。特别值得注意的是，AI生成的和弦进行虽作为起点，但85%会被用户修改，体现真正的协作关系。研究为音乐AI设计提供了新范式，证明技术可以增强而非替代人类创造力。研究发表在 Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems 上。

#AI驱动科学 #跨学科整合 #音乐科技 #人机协作 #创意计算

阅读更多：

Kim, Yewon, et al. “Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations.” Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems, Association for Computing Machinery, 2025, https://doi.org/10.1145/3706598.3713818

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.