█ 脑科学动态
Nature:肠道细胞如何“报警”?新研究揭示慢性疼痛的根源
氯胺酮通过调节大脑受体GluN1-2B-2D缓解抑郁症
Syngap1基因通过感觉运动整合支持认知能力
OPN3蛋白在下丘脑调节食物摄入的新机制
儿童双耳音高融合在6-14岁仍在发展
静态图像为何让你看到动态效果?
星形胶质细胞:大脑奖励学习的新钥匙
Nerinetide在急性缺血性中风患者中的潜在益处
█ AI行业动态
OpenAI大模型在编程竞赛中夺冠,通用能力完胜定制策略
每周一次赛美格鲁肽显著减少酒精使用障碍患者的饮酒渴求
OmniParser V2:让AI轻松操控图形界面
DeepSeek官方发布R1模型最佳设置指南
█ AI研发动态
国际首个“双环路”脑机接口系统
新型双域ACIM系统大幅提升神经网络能效
为什么上下文学习会“善变”?揭秘大型语言模型的瞬态行为
AI精准定位,房颤消融成功率大幅提高
大型语言模型显著提升学术会议组织效率
AI预测人格相关性超越人类,但专家和专门模型仍具优势
脑科学动态
Nature:肠道细胞如何“报警”?新研究揭示慢性疼痛的根源
肠道疼痛是肠易激综合征(IBS)和炎症性肠病(IBD)等疾病的常见症状,但其机制尚不明确。澳大利亚霍普伍德神经生物学中心内脏疼痛研究小组Stuart M. Brierley、加州大学旧金山分校(UCSF)David Julius,Kouki K. Touhara和北京大学的李毓龙研究团队通过实验揭示了肠道细胞如何通过释放神经递质触发持续疼痛。
研究团队开发了一种报告小鼠模型,用于定量测量活体肠道中肠嗜铬细胞(EC细胞)释放的血清素(serotonin)及其传播。研究发现,隐窝EC细胞(crypt EC cells)具有两种模式:一种是基础的低水平模式,通过激活上皮细胞的5-HT4受体调节基础离子分泌;另一种是刺激诱导的高水平模式,通过激活感觉神经纤维上的5-HT3受体传递疼痛信号。这两种模式都可以由刺激性受体TRPA1触发,而TRPA1仅存在于隐窝EC细胞中。当肠道保护性黏液层受损时,TRPA1对刺激性物质的反应会增强。
绒毛EC细胞(villus EC cells)则通过另一种机制传递损伤信号:氧化应激激活TRPM2通道,导致血清素和ATP的释放,进而激活感觉神经纤维。这种EC细胞功能的拓扑分离机制为肠道在不同生理条件下的监测、维护和保护提供了新的解释。研究发表在 Nature 上。
#神经科学 #肠道疼痛 #肠嗜铬细胞 #血清素 #TRPA1
阅读更多:
Touhara, Kouki K., et al. “Topological Segregation of Stress Sensors along the Gut Crypt–Villus Axis.” Nature, Feb. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-024-08581-9
氯胺酮通过调节大脑受体GluN1-2B-2D缓解抑郁症
氯胺酮曾被用作麻醉剂和娱乐性药物,近年来被用于治疗抑郁症和焦虑症,但其作用机制和安全性仍存在争议。冷泉港实验室的Hiro Furukawa和Hyunook Kang团队通过冷冻电镜技术(cryo-EM)研究了氯胺酮与大脑受体GluN1-2B-2D的相互作用,揭示了其潜在的治疗机制。
▷从理论上讲,氯胺酮可以通过阻断称为Glun1-2b-2d的脑受体来起作用。在这里可以看到该药物的化学分子(黄色)可以与脑受体的特定部分(灰色腹板)结合的众多方式之一。Credit: Furukawa lab/CSHL
研究团队使用冷冻电镜技术(cryo-EM,一种高分辨率成像技术)解析了三异源体GluN1-2B-2D NMDAR受体在五种不同状态下的结构。研究发现,GluN2B和GluN2D亚基的不对称运动调节了离子通道的开闭。此外,研究还发现了一种名为DQP-997-74的抑制剂,可以选择性地影响GluN2D亚基的功能,从而调节通道活动。研究还揭示了氯胺酮(S-(+)-ketamine)与GluN1-2B NMDAR受体的结合方式,表明其通过阻断离子通道发挥作用。这些发现为理解三异源体NMDAR受体的结构和功能提供了重要线索,并为开发针对抑郁症和焦虑症的新型药物奠定了基础。研究发表在 Neuron 上。
#大脑健康 #氯胺酮 #GluN1-2B-2D #冷冻电镜 #抑郁症
阅读更多:
Kang, Hyunook, et al. “Structural Basis for Channel Gating and Blockade in Tri-Heteromeric GluN1-2B-2D NMDA Receptor.” Neuron, vol. 0, no. 0, Feb. 2025. www.cell.com, https://doi.org/10.1016/j.neuron.2025.01.013
Syngap1基因通过感觉运动整合支持认知能力
Syngap1基因在突触和神经回路发展中起关键作用,其突变与智力障碍、孤独症谱系障碍(ASD)和癫痫等学习障碍相关。为了揭示Syngap1基因如何支持认知功能,Herbert Wertheim UF Scripps生物医学创新与技术研究所的Gavin Rumbaugh团队使用小鼠模型,结合高速摄影和触须跟踪技术,研究了Syngap1基因在皮质兴奋性神经元中的表达及其对感知和行为的影响。研究发现,Syngap1基因通过整合感觉和运动信息,促进认知能力。
▷Credit: Tom Vaissiere and Randall Golovin, Rumbaugh Lab.
研究团队通过小鼠模型,分析了Syngap1基因在皮质兴奋性神经元中的表达如何影响感知的形成。感知是一种通过感觉运动整合(SMI)实现的认知过程。研究发现,Syngap1基因的表达对形成促进SMI介导感知的体感运动网络至关重要。Syngap1基因调节触觉敏感性,维持触觉物体探索,并促进触觉学习。Syngap1表达不足的小鼠在皮质-丘脑网络(cortical-thalamic network)中表现出由探索性触摸诱导的神经动力学异常,这与长程突触连接异常有关。研究结果表明,Syngap1基因通过整合时间重叠的感觉和运动信号,促进感知和注意力,从而支持认知能力。研究发表在 Nature Communications 上。
#神经科学 #孤独症 #智力障碍 #Syngap1基因 #感觉运动整合
阅读更多:
Vaissiere, Thomas, et al. “Syngap1 Promotes Cognitive Function through Regulation of Cortical Sensorimotor Dynamics.” Nature Communications, vol. 16, no. 1, Jan. 2025, p. 812. www.nature.com, https://doi.org/10.1038/s41467-025-56125-0
OPN3蛋白在下丘脑调节食物摄入的新机制
下丘脑中的神经元表达Opsin 3(OPN3)蛋白,但其在大脑深处的功能尚不明确。布朗大学和辛辛那提儿童医院的研究团队通过基因工程手段,在小鼠的下丘脑室室核(PVN)中敲除OPN3,发现其在调节食物摄入中起重要作用。
▷在下丘脑的室室核中表达神经元(绿色)的OPN3。Credit: Jonathan Mercado-Reyes.
研究团队通过基因工程手段,在小鼠的下丘脑室室核中敲除OPN3,观察其对食物摄入和活动水平的影响。他们还通过分子生物学技术,研究了OPN3与黑素皮质素4受体(MC4R)和Kir7.1钾通道(Kir7.1 potassium channel)的相互作用。研究发现,OPN3与MC4R和Kir7.1钾通道共同作用,调节神经元信号和能量平衡。敲除OPN3的小鼠食物摄入减少,活动水平降低。此外,OPN3通过Gαi/o依赖性方式负调节MC4R介导的cAMP信号,增强Kir7.1通道的活性,从而促进食物摄入。研究发表在 PNAS 上。
#神经科学 #下丘脑 #OPN3 #食物摄入 #能量平衡
阅读更多:
Haddad, Hala K., et al. “Hypothalamic Opsin 3 Suppresses MC4R Signaling and Potentiates Kir7.1 to Promote Food Consumption.” Proceedings of the National Academy of Sciences, vol. 122, no. 8, Feb. 2025, p. e2403891122. pnas.org (Atypon), https://doi.org/10.1073/pnas.2403891122
儿童双耳音高融合在6-14岁仍在发展
双耳音高融合(binaural pitch fusion)是儿童在嘈杂环境中理解语音的关键能力。俄勒冈州健康与科学大学的Lina Reiss和Jennifer Fowler等人,通过对62名儿童进行长期跟踪研究,比较了听力正常儿童与使用不同听力设备儿童的双耳音高融合发展。研究发现,这一能力在6至14岁期间显著发展,为改善听力障碍儿童的语音感知提供了新的治疗方向。
研究团队对62名儿童(包括22名女性)进行了基线测量,分为听力正常组(n=25)、双侧助听器组(n=10)、双峰人工耳蜗组(n=9)和双侧人工耳蜗组(n=18)。通过长期跟踪,测量了儿童在6至10岁开始,经过3至6年的双耳音高融合(binaural pitch fusion)范围的变化。双耳音高融合范围是指在一只耳朵接收到的声学频率(electrodes)与另一只耳朵同时接收到的单一参考频率(electrodes)融合的感知范围。耳间音高辨别(interaural pitch discrimination)能力也被测量,以控制音高辨别作为融合的潜在限制因素。
结果显示,听力正常儿童和双侧助听器儿童的双耳音高融合范围随着年龄增长显著缩小1-3个八度,而双侧人工耳蜗儿童则无明显变化。耳间音高辨别能力在各组间存在差异,但不随年龄变化。这些结果表明,双耳音高融合在6至14岁期间显著发展,且听力设备的选择对听力损失儿童的双耳处理能力发展至关重要。研究发表在 Journal of the Association for Research in Otolaryngology 上。
#认知科学 #双耳音高融合 #听力设备 #儿童发展 #语音感知
阅读更多:
Reiss, Lina A. J., et al. “Binaural Fusion Sharpens on a Scale of Octaves During Pre-Adolescence in Children with Normal Hearing, Hearing Aids, and Bimodal Cochlear Implants, but Not Bilateral Cochlear Implants.” Journal of the Association for Research in Otolaryngology, Feb. 2025. Springer Link, https://doi.org/10.1007/s10162-025-00975-4
静态图像为何让你看到动态效果?
扩展的孔幻觉是一种静态图像让人产生动态扩展效果的视觉现象,但其背后的神经机制尚不明确。为了揭示这一机制,弗林德斯大学的Nasim Nematzadeh和David Powers等人开发了一种基于高斯差异的计算模型,模拟了人类视网膜的对比度和运动感知处理过程,并解释了这种幻觉的神经基础。
▷扩展的孔幻觉:这种静态模式产生了动态效果,给人的印象是该模式中中央区域的连续扩展。Credit: Flinders University
研究团队使用高斯差异(Difference of Gaussians, DoG)滤波和经典感受野(Classical Receptive Field, CRF)模型,模拟了早期视网膜处理机制。研究发现,扩展的孔幻觉源于视网膜处理对比度和运动感知与大脑之间的相互作用,特别是对比度依赖性侧抑制(lateral inhibition)在早期视觉处理中的作用。对比度梯度和多层空间处理共同导致了扩张的感知,这一结果与心理物理学的发现一致,并支持了视网膜神经节细胞在生成这种错觉运动信号中的关键作用。这一模型不仅解释了视觉错觉的神经机制,还为改进AI视觉系统提供了新方向,使其在低光环境或复杂背景中更加鲁棒。
#神经科学 #视觉错觉 #视网膜处理 #AI视觉系统 #高斯差异
阅读更多:
Nematzadeh, Nasim, and David M. W. Powers. A Bioplausible Model for the Expanding Hole Illusion: Insights into Retinal Processing and Illusory Motion. arXiv:2501.08625, arXiv, 15 Jan. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2501.08625
星形胶质细胞:大脑奖励学习的新钥匙
星形胶质细胞在大脑功能中扮演重要角色,但其在奖励学习中的具体作用尚不明确。Cajal研究所、马德里自治大学和卡洛斯三世健康研究所的研究团队使用新开发的AstroLight工具,揭示了星形胶质细胞在奖励驱动行为中的专门网络。
▷左:使用 AstroLight 对星形胶质细胞群体进行标记。借助该工具,作者获得了与条件刺激动机行为任务相关的伏隔核中星形胶质细胞群体的空间图谱。右:星形胶质细胞群体刺激。激活标记有 AstroLight 的星形胶质细胞引起了小鼠对两个可能的奖励位置之一的偏好改变。Credit: Serra et al.
研究团队使用AstroLight工具,将星形胶质细胞的钙信号转化为光依赖的基因表达,识别出在伏隔核(Nucleus Accumbens, NAc)中形成的星形胶质细胞合奏。这些合奏在奖励驱动的行为中活跃,并且直接光遗传学激活这些合奏足以驱动小鼠的奖励寻求行为。研究结果表明,星形胶质细胞并非均匀分布,而是形成特定的合奏,这些合奏在学习和记忆中扮演关键角色。研究发表在 Nature Neuroscience 上。
#神经科学 #星形胶质细胞 #奖励学习 #光遗传学 #伏隔核
阅读更多:
Serra, Irene, et al. “Astrocyte Ensembles Manipulated with AstroLight Tune Cue-Motivated Behavior.” Nature Neuroscience, Feb. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41593-025-01870-0
Nerinetide在急性缺血性中风患者中的潜在益处
Nerinetide是一种在急性缺血性中风发病后3小时内有效的神经保护剂,但其在临床中的应用效果尚不明确。加拿大安大略省和不列颠哥伦比亚省的七个中风中心的研究团队进行了一项多中心、随机、双盲、安慰剂对照的研究,评估了在疑似中风症状出现后3小时内,在到达医院前给予Nerinetide的可行性和安全性及其有效性。
这项研究的关键方法是多中心、随机、双盲、安慰剂对照试验,研究人员在疑似严重中风发病后3小时内,将40至95岁之间、之前能够独立生活并被送往加拿大安大略省或不列颠哥伦比亚省的七个中风中心之一的参与者纳入研究。参与者以1:1的比例随机分配接受静脉注射Nerinetide(2.6 mg/kg)或安慰剂。主要结果是在改良Rankin量表(modified Rankin Scale)上90天时的功能良好结果。研究结果显示,Nerinetide并未在所有疑似缺血性中风患者中改善神经功能结局,但在症状出现后3小时内接受再灌注治疗的急性缺血性中风患者中可能有益。研究发表在The Lancet Neurology上。
#大脑健康 #急性缺血性中风 #Nerinetide #多中心随机双盲安慰剂对照试验
阅读更多:
Christenson, Jim, et al. “Efficacy and Safety of Intravenous Nerinetide Initiated by Paramedics in the Field for Acute Cerebral Ischaemia within 3 h of Symptom Onset (FRONTIER): A Phase 2, Multicentre, Randomised, Double-Blind, Placebo-Controlled Study.” The Lancet, vol. 405, no. 10478, Feb. 2025, pp. 571–82. www.thelancet.com, https://doi.org/10.1016/S0140-6736(25)00193-X
AI 行业动态
OpenAI大模型在编程竞赛中夺冠,通用能力完胜定制策略
OpenAI的研究表明,强化学习应用于大语言模型显著提升了其在复杂编程和推理任务中的表现。研究团队对比了两种通用推理模型——OpenAI的o1和o3早期版本——与专为2024年国际信息学奥林匹克竞赛(IOI)设计的定制化系统o1-ioi。在IOI 2024现场竞赛中,o1-ioi凭借手工设计的测试策略位列第49百分位,而在放宽竞赛约束的条件下,o1-ioi获得了金牌。然而,后续评估发现,o3模型无需手工设计的领域特定策略或放宽约束,也能轻松斩获金牌。值得注意的是,o3在2024年IOI中夺得金牌,并在CodeForces平台上达到了与顶尖人类选手相当的评分。
研究结果表明,尽管定制化策略如o1-ioi能带来显著改进,但规模更大、通用性更强的o3模型无需依赖手工设计的推理启发式方法,便能超越这些成果。这一发现表明,扩展通用强化学习而非依赖领域特定技术,是推动推理领域(如编程竞赛)人工智能达到顶尖水平的可靠路径。
此外,研究还回顾了编程竞赛作为评估推理和编码能力的挑战性基准的重要性,以及OpenAI在大推理模型(LRMs)领域的进展。LRMs通过强化学习训练,能够“推理”和“思考”复杂的思维链,从而解决数学和编程等复杂任务。DeepSeek-R1和Kimi k1.5的研究也独立证明了思维链学习在提升数学和编程能力方面的有效性。
#OpenAI #大语言模型 #编程竞赛 #强化学习 #推理能力
阅读更多:
https://arxiv.org/pdf/2502.06807
每周一次赛美格鲁肽显著减少酒精使用障碍患者的饮酒渴求
一项发表在JAMA Psychiatry上的随机临床试验表明,GLP-1受体激动剂赛美格鲁肽(Semaglutide)可能对酒精使用障碍(AUD)患者有显著疗效。研究由来自美国学术医疗中心的研究人员团队领导,旨在评估每周一次皮下注射赛美格鲁肽对AUD患者饮酒量和渴求感的影响。试验共招募了48名非治疗寻求者且患有AUD的参与者,随机分为赛美格鲁肽组和安慰剂组。
结果显示,低剂量赛美格鲁肽显著减少了患者在治疗后实验室自给任务中的酒精摄入量,并降低了每周的酒精渴求感。此外,在吸烟的参与者中,赛美格鲁肽还显著减少了每日吸烟量。研究人员认为,这些结果为未来更大规模的临床试验提供了初步支持,表明GLP-1受体激动剂可能成为AUD治疗的新方向。
#赛美格鲁肽 #酒精使用障碍 #GLP-1受体激动剂 #临床试验 #饮酒渴求
阅读更多:
https://jamanetwork.com/journals/jamapsychiatry/fullarticle/2829811
OmniParser V2:让AI轻松操控图形界面
微软的研究人员开发了OmniParser V2,这是一款能够将大语言模型转变为高效图形用户界面(GUI)自动化代理的工具。GUI自动化需要代理能够理解并交互用户屏幕,但通用LLM模型在作为GUI代理时面临两大挑战:可靠识别用户界面中的可交互图标,以及准确理解屏幕截图中元素的语义并将其与相应区域关联。OmniParser通过将UI屏幕截图从像素空间“分词”为LLMs可解析的结构化元素,解决了这一问题,使得LLMs能够基于解析后的可交互元素进行下一步操作预测。
OmniParser V2在前代基础上进一步提升,实现了对更小可交互元素的更高检测准确率和更快的推理速度。它通过更大规模的交互元素检测数据和图标功能描述数据进行训练,并将图标描述模型的图像尺寸缩小,使延迟降低了60%。在最新发布的ScreenSpot Pro基准测试中,OmniParser+GPT-4o以39.6的平均准确率刷新了GPT-4o的原始得分0.8,展现了其在处理高分辨率屏幕和小型目标图标方面的卓越性能。
此外,研究人员还开发了OmniTool,这是一个容器化的Windows系统,集成了多种先进LLMs(如OpenAI、DeepSeek、Qwen和Anthropic),支持屏幕理解、grounding、动作规划和执行等步骤,以加速智能体设置的实验。为降低风险,OmniParser V2遵循微软AI原则和负责任AI实践,通过使用负责任AI数据训练图标描述模型,尽可能避免推断图标图像中个体的敏感属性。同时,研究人员建议用户仅在不包含有害内容的截图上使用OmniParser,并提供沙盒容器和安全指南以确保使用安全。
#OmniParser #GUI自动化 #LLM #ScreenSpot Pro #OmniTool
阅读更多:
https://www.microsoft.com/en-us/research/articles/omniparser-v2-turning-any-llm-into-a-computer-use-agent/
DeepSeek官方发布R1模型最佳设置指南
近日,DeepSeek官方通过其X账号发布了关于R1模型的推荐设置,引发了广泛关注。自春节以来,DeepSeek一直是人工智能(AI)领域的热门话题,其官方App更是创下了史上最快突破3000万日活的记录。此次更新旨在帮助用户更好地部署和使用DeepSeek-R1模型,并强调了官方版本与开源版本的一致性。
官方推荐设置包括四项关键内容:首先,建议用户不要使用系统提示词,这一建议已被许多开发者提出;其次,将温度参数设置为0.6,以防止模型输出无休止的重复或不连贯的内容;第三,分享了用于搜索和文件上传的官方提示词模板,用户可根据需求调整参数;第四,提供了一个指南,帮助缓解模型绕过思考的问题,建议强制模型以“\n”作为响应的开头,以确保其进行彻底推理。
尽管此次更新仅涉及DeepSeek-R1项目的README.md文件,但仍获得了大量好评。不过,也有部分用户对官方推荐的设置表示困惑,认为需要进一步解释。总体而言,此次更新为开发者提供了更清晰的指导,有望进一步提升模型的使用体验。
#DeepSeek #R1模型 #AI技术 #模型优化 #提示词设置
阅读更多:
https://x.com/deepseek_ai/status/1890324295181824107
AI 研发动态
国际首个“双环路”脑机接口系统
天津大学脑机海河实验室和清华大学集成电路学院联合,开发出一款基于忆阻器神经形态器件的“双环路”无创演进脑机接口系统。团队还首次揭示了大脑电信号与解码器在交互过程中如何进一步协同增强的奥秘,并成功实现了人脑对无人机的高效四自由度操控。
研究团队发现,脑电信号中的非平稳特性不仅来源于传统观点认为的背景脑电变异,而且与闭环脑机交互引导下的任务脑电演变密切相关。基于这一发现,团队首次提出了“双环路脑机协同演进框架”,并通过忆阻器神经形态器件构建了全新的脑机接口系统。在双环路框架下,“机学习”环路中的忆阻器解码器通过适应脑电信号波动完成解码参数更新,“脑学习”环路中的任务相关脑电特征在“决策-反馈”循环的引导下不断正向演化。相关算法基于128kb规模的忆阻器神经形态器件实现了硬件化部署,将脑电信号的多步计算过程优化为单步计算。
“相较于传统纯数字硬件方案,‘双环路’脑机接口系统精度更高、能耗更低、能处理更复杂任务。像效率提高2个数量级(百倍)以上,能耗降低3个数量级(千分之一)以下。”许敏鹏举例说,传统无创脑机接口技术通常只能控制无人机进行简单的二自由度飞行,研究团队开发的“双环路”脑机接口系统可高效支撑无人机完成上下、左右、前后、旋转四自由度任务目标。
在连续6小时的长时程脑机交互实验中,大脑和解码器的贡献比例呈现动态变化,初期以解码器自适应更新为主,随着时间推移,大脑贡献逐步增加,最终脑机接口性能不仅没有下降,准确率还提升了约20%。相关成果刊发在Nat Electron上。
#脑机接口 #脑机交互
阅读更多:
Liu, Z., Mei, J., Tang, J. et al. A memristor-based adaptive neuromorphic decoder for brain–computer interfaces. Nat Electron (2025). https://doi.org/10.1038/s41928-025-01340-2
新型双域ACIM系统大幅提升神经网络能效
随着机器学习模型的广泛应用,传统计算机架构的计算能力面临挑战。清华大学的研究团队,由Ze Wang等人组成,开发了一种新型双域模拟计算存储器(ACIM)系统,旨在提高神经网络运行的能效和性能。该团队通过结合高精度浮点(FP)兼容数字计算和模拟计算存储器,成功设计出一种混合架构,显著提升了神经网络在处理复杂回归任务时的效率和精度。
研究团队开发了一种低成本的双域浮点处理器,将模拟计算存储器阵列与数字核心合并,形成了一种新型的混合架构。这种架构在浮点神经网络推理中的能效比常见的FP-32乘法器高出39.2倍。此外,团队还创建了一个基于忆阻器(memristor)的计算系统原型,该系统在处理复杂回归任务(如YOLO对象检测)时,平均精度比纯ACIM系统提高了2.7倍。这一成果不仅展示了ACIM系统在处理复杂计算任务上的潜力,也为未来神经网络计算架构的设计提供了新的方向。研究发表在 Nature Electronics 上。
#神经技术 #神经网络 #能效 #模拟计算存储器 #浮点计算
阅读更多:
Wang, Ze, et al. “A Dual-Domain Compute-in-Memory System for General Neural Network Inference.” Nature Electronics, Jan. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s41928-024-01315-9
为什么上下文学习会“善变”?揭秘大型语言模型的瞬态行为
上下文学习(ICL)使大型语言模型能够通过输入的上下文适应新任务,但其机制尚未得到统一解释。为了填补这一空白,哈佛大学、NTT研究所和密歇根大学的研究团队提出了一种新的实验设置,通过训练Transformer模型模拟有限混合马尔可夫链生成的序列数据,系统性地研究了ICL的算法动态。研究揭示了四种算法之间的竞争关系,并解释了ICL的瞬态性质。
研究团队设计了一种合成序列建模任务,即通过训练Transformer模型模拟有限混合马尔可夫链(Markov chains)生成的序列数据。通过改变训练步骤、数据多样性(链的数量)和上下文大小,团队发现模型在ICL中表现出四种不同的算法阶段。这些算法结合了模糊检索与推理方法以及一元(unigram)或二元(bigram)统计。研究表明,这些算法在竞争动态中相互影响,具体的实验条件(如上下文大小或训练量)决定了哪种算法主导模型行为。例如,仅改变上下文大小或训练量就会导致模型行为的急剧转变,揭示了ICL的瞬态性质。此外,研究还发现,模型规模会影响算法阶段的边界,表明ICL应被视为不同算法的混合体,而非单一能力。这一发现为理解ICL的复杂机制提供了新的视角,并表明在不同实验条件下得出的ICL结论可能并不普遍适用。
#认知科学 #上下文学习 #Transformer #算法竞争 #马尔可夫链
阅读更多:
Park, Core Francisco, et al. Competition Dynamics Shape Algorithmic Phases of In-Context Learning. arXiv:2412.01003, arXiv, 28 Dec. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2412.01003
AI精准定位,房颤消融成功率大幅提高
房颤(AF)是成人中最常见的心律失常,但持续性及长期持续性AF的治疗仍具挑战性。TAILORED-AF研究团队,包括Isabel Deisenhofer、Jean-Paul Albenque等来自多个机构的专家,开展了一项多中心、随机、对照、双盲试验,评估AI引导的个性化消融手术是否优于标准PVI手术。
研究将药物难治性持续性AF患者随机分为两组:一组接受肺静脉隔离(PVI)加AI算法检测的时空散射区域消融(个性化组,n=187),另一组仅接受标准PVI手术(解剖组,n=183)。主要疗效终点为单次消融手术后12个月内无记录AF(无论是否使用抗心律失常药物)。结果显示,个性化组在主要疗效终点上显著优于解剖组(88% vs. 70%),但在无任何房性心律失常终点上无显著差异。两组在安全性终点上无差异,但个性化组的手术和消融时间更长。研究表明,AI引导的时空散射区域消融加PVI在1年随访中优于仅PVI手术,但长期维持窦性心律可能需要消融后续的有序房性心动过速。研究发表在 Nature Medicine 上。
#神经技术 #房颤 #AI引导消融 #肺静脉隔离 #时空散射
阅读更多:
Deisenhofer, Isabel, et al. “Artificial Intelligence for Individualized Treatment of Persistent Atrial Fibrillation: A Randomized Controlled Trial.” Nature Medicine, Feb. 2025, pp. 1–8. www.nature.com, https://doi.org/10.1038/s41591-025-03517-w
大型语言模型显著提升学术会议组织效率
组织学术会议面临日益复杂的挑战,尤其是在投稿数量和多样性增加的情况下。AMIA 2024信息学峰会科学计划委员会尝试使用生成式人工智能和大型语言模型来优化会议组织流程。研究团队由Yuan Luo、Yikuan Li、Omolola Ogunyemi、Eileen Koski和Blanca E. Himes组成,他们利用LLMs开发算法,自动化处理投稿与审稿人匹配、主题分组和生成一句话摘要等任务,显著提高了会议组织效率。
研究团队使用大型语言模型开发了审稿人分配算法、主题分组和生成一句话摘要的工具。LLMs通过提示工程(prompt engineering)生成Python代码,自动化处理投稿与审稿人匹配,仅需30分钟,而传统手动方法需要20小时以上。主题分组任务中,LLMs帮助生成会期名称和分组建议,尽管需要人类监督,但时间从2.5天缩短到2.5小时。生成一句话摘要的任务仅需15分钟,而手动完成150个摘要需要25小时。LLMs在提高效率的同时,保持了主题一致性和信息清晰度。研究发表在 npj Digital Medicine 上。
#认知科学 #大型语言模型 #学术会议 #人工智能 #效率提升
阅读更多:
Luo, Yuan, et al. “Leveraging Large Language Models for Academic Conference Organization.” Npj Digital Medicine, vol. 8, no. 1, Feb. 2025, pp. 1–5. www.nature.com, https://doi.org/10.1038/s41746-025-01492-7
AI预测人格相关性超越人类,但专家和专门模型仍具优势
现代AI系统能否准确理解人类个性?Philipp Schoenegger、Spencer Greenberg、Alexander Grishin、Joshua Lewis和Lucius Caviola团队对此展开研究,测试了通用大型语言模型和专门AI系统(如PersonalityMap)在预测人格问卷项目相关性方面的表现。结果显示,所有AI模型均优于大多数普通民众和学术专家,但基于中位数的预测显示,专门模型和专家仍具优势。
研究通过预先注册的分析,测试了两类前沿LLMs(GPT-4o和Claude 3 Opus)、一个专门模型(PersonalityMap)、普通民众和学术专家预测两个调查问题之间关系的能力。在未预先注册的分析中,还测试了另一个专门模型(SurveyBot3000)以及不同规格的GPT-4o。研究结果显示,所有AI模型在预测人格项目相关性方面均优于大多数普通民众和学术专家。然而,通过取每组的预测中位数,可以进一步提高预测准确性。基于中位数,PersonalityMap和学术专家在大多数指标上超越了LLMs和普通民众。这一结果表明,尽管先进的大型语言模型在预测方面优于大多数个体,但专门模型如PersonalityMap在特定领域任务中仍能匹配甚至超越专家群体表现。研究发表在 Communications Psychology 上。
#认知科学 #AI预测 #人格心理学 #大型语言模型 #专门模型
阅读更多:
Schoenegger, Philipp, et al. “AI Can Outperform Humans in Predicting Correlations between Personality Items.” Communications Psychology, vol. 3, no. 1, Feb. 2025, pp. 1–12. www.nature.com, https://doi.org/10.1038/s44271-025-00205-w
整理|ChatGPT
编辑|丹雀、存源
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、中文媒体追问等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.