█脑科学动态
Nature:新成像技术可在组织样本中实现详细的疾病标测
母亲年龄和基因影响后代性别,生男生女并非完全随机
仅声音压力即可加剧和延长小鼠的疼痛
四种主要神经退行性疾病共享一个五蛋白生物标志物特征
黄原胶实现人皮质类器官的可扩展生产
大脑苏醒如潮汐:从前脑到后脑的“唤醒波”
用神经发育量表更早识别1型神经纤维瘤病认知迹象
█AI行业动态
AI首夺数学奥赛金牌!OpenAI新模型碾压人类选手
█AI驱动科学
Nature:AI利用常规心电图筛查结构性心脏病
大语言模型初始时过分自信,面对反驳时又信心不足
机器学习优化饮食方案可降低痴呆风险
轻量级AI模型在情感分析中挑战大语言模型,实现成本与性能双赢
AI利用树状数学捷径追踪动态信息
新AI方法MCTD,高效解决复杂规划问题
可扩展Transformer加速器赋能大模型设备端高效执行
脑科学动态
Nature:新成像技术可在组织样本中实现详细的疾病标测
传统组织病理学分析一次仅能检测少数蛋白质,难以全面理解疾病的复杂机制。奥胡斯大学(Aarhus University)的Victor G. Puelles及其国际合作团队开发了一种名为PathoPlex的新技术,该技术结合多重成像和机器学习,可在单一样本中同时绘制上百种蛋白质图谱,实现对疾病前所未有的深入解析。
▷Credit: Nature (2025).
研究团队开发的PathoPlex是一个集成的开源框架,它首先通过迭代式免疫荧光技术,在同一份福尔马林固定石蜡包埋的组织样本上,对超过100种不同的蛋白质进行逐一标记和高分辨率成像。随后,利用团队专门开发的spatiomic机器学习软件,对海量图像数据进行分析,识别出不同蛋白质在细胞及亚细胞层面的空间分布和共表达模式,从而构建出详尽的疾病地图。在对糖尿病肾病(diabetic kidney disease)的研究中,PathoPlex不仅揭示了复杂的疾病网络,更在年轻患者出现临床症状前就探测到了早期的组织病理学变化。此外,该技术还被用于评估药物效果,结果显示,常用的SGLT2抑制剂(SGLT2 inhibitors,一种常见降糖药)只能修复部分肾脏损伤。为推动该技术的普及,研究团队公开了所有方案,甚至包括使用普通3D打印机实现自动化操作的低成本方案。研究发表在 Nature 上。
#AI驱动科学 #自动化科研 #个性化医疗 #疾病标测
阅读更多:
Kuehl, Malte, et al. “Pathology-Oriented Multiplexing Enables Integrative Disease Mapping.” Nature, Jul. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-025-09225-2
母亲年龄和基因影响后代性别,生男生女并非完全随机
生男生女真的是完全随机的事件吗?哈佛大学陈曾熙公共卫生学院的Siwen Wang、Bernard A. Rosner、Jorge E. Chavarro等人,通过对近60年的大规模生育数据和基因进行分析,发现母亲的年龄和特定基因会显著影响后代性别比例。
该研究分析了涵盖58,007名美国女性近60年的海量生育数据。研究人员发现,后代的性别分布并非遵循简单的随机概率,而是呈现出一种“同性扎堆”的趋势。数据显示,已生育一个男孩的女性,她第二个孩子还是男孩的概率升至57%;而已育一个女孩的女性,她第二个孩子仍是女孩的概率为53%。研究还揭示了母亲年龄的影响:与23岁前生育的女性相比,29岁及以后才生育第一个孩子的女性,其所有孩子性别相同的概率要高出13%。为了探究其生物学基础,团队进行了全基因组关联研究(GWAS),并成功定位到两个关键基因。位于10号染色体上的NSUN6基因变异与生育更多女孩有关,而18号染色体上靠近TSHZ1基因的变异则与生育更多男孩有关。这项研究表明,后代性别并非纯粹的运气,而是受到母体年龄和遗传因素共同影响的复杂生物学过程。研究发表在 Science Advances 上。
#疾病与健康 #其他 #遗传学 #性别决定
阅读更多:
Wang, Siwen, et al. “Is Sex at Birth a Biological Coin Toss? Insights from a Longitudinal and GWAS Analysis.” Science Advances, Jul. 2025. world, www.science.org, https://www.science.org/doi/10.1126/sciadv.adu7402
仅声音压力即可加剧和延长小鼠的疼痛
心理压力会加剧疼痛,但这种“共情疼痛”的具体传播途径是什么?东京理科大学的Satoka Kasai、Satoru Miyazaki、Akiyoshi Saitoh等人对此展开研究,他们首次证明,仅由疼痛小鼠发出的超声波就足以在健康的旁观小鼠中诱发真实的疼痛反应,并揭示了其背后的神经炎症机制。
▷疼痛反应是因身体损伤以及心理或情绪压力源而触发的。然而,人们对社会或情感疼痛传播的潜在机制知之甚少。东京理科大学研究人员的一项新研究探讨了小鼠声音压力暴露、疼痛感知和炎症之间的关联。Credit: Assistant Professor Satoka Kasai from Tokyo University of Science, Japan
研究团队首先记录了小鼠在遭受疼痛刺激时发出的超声波。随后,他们将这些“痛苦尖叫”的录音播放给健康小鼠听,整个过程排除了视觉、嗅觉等其他感官干扰。结果发现,仅听到这些声音的健康小鼠表现出了明显的痛觉过敏(hyperalgesia,即对通常不引起疼痛的刺激感到疼痛的现象),其爪子退缩的疼痛阈值显著降低。为了探究其背后的机制,研究人员对小鼠大脑中处理感觉信息的关键区域——丘脑进行了DNA微阵列分析(DNA microarray analysis,一种可同时检测成千上万个基因表达水平的技术)。分析表明,声音压力激活了大脑中的炎症通路,导致炎症相关基因(如前列腺素-内过氧化物酶合酶2)的表达显著上调。为了验证这一发现,研究人员给小鼠服用了抗炎药物,结果成功抑制了声音诱导的痛觉过敏。此外,研究还发现声音压力会延长既有炎症性疼痛的持续时间,并降低止痛药的效果。研究发表在 PLOS One 上。
#疾病与健康 #神经机制与脑功能解析 #知觉康复 #炎症
阅读更多:
Kasai, Satoka, et al. “Pain-Stimulated Ultrasound Vocalizations and Their Impact on Pain Response in Mice.” PLOS ONE, vol. 20, no. 7, Jul. 2025, p. e0324730. PLoS Journals, https://doi.org/10.1371/journal.pone.0324730
四种主要神经退行性疾病共享一个五蛋白生物标志物特征
全球神经退行性变蛋白质组学联盟(GNPC,The Global Neurodegeneration Proteomics Consortium),一个由Farhad Imam等人协调的公私合作项目,通过分析史上最大规模的蛋白质组数据集之一,发现了一个由五种蛋白质组成的标志物组合,它能准确预测跨越四种主要神经退行性疾病的高风险基因携带状态。
这项里程碑式的研究由全球神经退行性变蛋白质组学联盟(GNPC)主导,汇集了来自23个国际研究队列的18,645名参与者,分析了超过35,000份生物样本,产生了约2.5亿个独特的蛋白质测量数据。研究人员利用高通量蛋白质组学平台,在安全的云环境中对这些海量数据进行了整合分析。研究首先揭示了不同疾病独特的蛋白质“指纹”:阿尔茨海默病患者的血浆中存在葡萄糖代谢通路的紊乱,而帕金森病则与特定的细胞信号通路相关。
最重大的突破在于发现了一个跨疾病的通用信号。一个由五种特定蛋白质(SPC25、NEFL、S100A13、TBCA、LRRN1)组成的模型,能够极高精度地预测个体是否携带APOE ε4等位基因(APOE ε4 allele,一个已知的、会大幅增加晚发性阿尔茨海默病风险的遗传因子),其预测准确率(AUC达0.90-0.96)惊人。更关键的是,这一预测能力在阿尔茨海默病、帕金森病、额颞叶痴呆和肌萎缩侧索硬化症四种不同的疾病患者中同样稳健。这表明,这些看似不同的脑部疾病可能共享一个与APOE ε4相关的核心生物学通路。研究发表在 Nature Medicine 上。
#疾病与健康 #预测模型构建 #神经退行性疾病 #蛋白质组学 #生物标志物
阅读更多:
Imam, Farhad, et al. “The Global Neurodegeneration Proteomics Consortium: Biomarker and Drug Target Discovery for Common Neurodegenerative Diseases and Aging.” Nature Medicine, Jul. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41591-025-03834-0
黄原胶实现人皮质类器官的可扩展生产
为了解决大规模培养人类神经类器官时因相互粘附导致的产量和均一性问题,斯坦福大学的Sergiu Pasca、Sarah Heilshorn、Genta Narazaki和Yuki Miura等研究人员进行了一项研究。他们发现,一种常见的食品添加剂黄原胶能够有效防止类器官融合,成功开发出一个可扩展、低成本的培养平台。
研究团队测试了23种生物相容性聚合物,发现仅需在培养基中加入少量常见的食品添加剂黄原胶(xanthan gum),即可通过增加培养基粘度有效防止类器官粘连。重要的是,该方法对类器官的关键生物学特性,如区域分化、神经元形态和功能活动等均无不良影响。为展示该平台的强大功能,研究团队进行了一项大规模药物筛选。他们培养了超过2400个皮质类器官,并用其测试了298种已获美国食品药品监督管理局(FDA)批准的药物。结果显示,包括一种乳腺癌治疗药物在内的数种药物会显著阻碍类器官的生长,这表明它们可能对早期大脑发育存在潜在危害。研究发表在 Nature Biomedical Engineering 上。
#疾病与健康 #自动化科研 #类器官 #药物筛选
阅读更多:
Narazaki, Genta, et al. “Scalable Production of Human Cortical Organoids Using a Biocompatible Polymer.” Nature Biomedical Engineering, Jun. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41551-025-01427-3
大脑苏醒如潮汐:从前脑到后脑的“唤醒波”
大脑如何从睡眠中安全高效地苏醒?荷兰神经科学研究所和洛桑大学的Aurélie M. Stephan等研究人员,为了解答这一问题,分析了上千次觉醒事件的大脑活动,揭示了大脑苏醒时存在一个从前到后传播的“唤醒波”,并阐明了不同睡眠阶段唤醒模式的差异。
研究团队利用高密度脑电图(high-density EEG)记录并分析了超过1000次觉醒事件。结果发现,大脑并非瞬间“开机”,而是遵循一个固定的激活顺序。与清醒状态相关的高频活动首先出现在大脑额叶和中央区域,随后像波浪一样向后部的枕叶和颞叶区域扩散。这一从前到后的激活梯度在不同睡眠阶段中都存在。
研究还揭示了两种主要睡眠阶段的唤醒机制差异。当从非快速眼动睡眠(non-REM sleep,即深度睡眠)中醒来时,大脑会先短暂爆发出一种与睡眠相关的低频慢波(slow waves),然后才切换到高频的清醒模式。研究人员认为这与NREM睡眠期间神经元的双稳态(bistability)有关。相比之下,从快速眼动睡眠(REM sleep,即梦境阶段)中醒来则会跳过慢波阶段,直接激活高频活动。有趣的是,慢波并非总是导致困倦。某些在觉醒前出现的慢波反而扮演了“唤醒信号”的角色,预示着醒来后会更警觉;而那些持续到醒来后的慢波,才是导致我们早晨感到昏沉,即睡眠惰性(sleep inertia)的原因。研究发表在 Current Biology 上。
#意识与脑机接口 #神经机制与脑功能解析 #睡眠 #意识
阅读更多:
Stephan, Aurélie M., et al. “Cortical Activity upon Awakening from Sleep Reveals Consistent Spatio-Temporal Gradients across Sleep Stages in Human EEG.” Current Biology, vol. 0, no. 0, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.cub.2025.06.064
用神经发育量表更早识别1型神经纤维瘤病认知迹象
1型神经纤维瘤病(NF1)是一种影响儿童认知与运动的遗传病,但基础研究成果难以转化为临床应用。为应对此挑战,来自华盛顿大学医学院、冷泉港实验室等机构的David H. Gutmann, Linda Van Aelst及同事组建了CABIN(NF1中认知与行为)工作组,提出了一项旨在改善患者护理的未来研究框架。
▷CABIN 提出了一项研究,以“确定早期检测和缓解”1 型 NF 的时期。Credit: David Gutmann
该团队通过系统性回顾当前研究,提出了一个全新的研究框架。其核心是开发一种名为NF1神经发育量表(NF1 neurodevelopmental inventory, NF1-NDI)的评估工具。这并非传统意义上的实验,而是一项前瞻性的规划。NF1-NDI旨在创建一个标准化的认知特征目录,专门用于识别NF1患者独特的神经发育轨迹。通过这个工具,医生和教师能更早、更准确地发现认知问题的苗头,从而实现早期诊断和更具个性化的干预。该框架的目标是建立一个从基础科学发现、临床前模型评估到最终临床应用的无缝转化循环,不仅有望改善NF1患者的生活质量,也可能为理解其他神经发育障碍提供重要见解。研究发表在 Genes & Development 上。
#疾病与健康 #跨学科整合 #心理健康与精神疾病 #神经机制与脑功能解析
阅读更多:
Gutmann, David H., et al. “Cognition and Behavior in Neurofibromatosis Type 1: Report and Perspective from the Cognition and Behavior in NF1 (CABIN) Task Force.” Genes & Development, vol. 39, no. 9–10, Jan. 2025, pp. 541–54. genesdev.cshlp.org, https://doi.org/10.1101/gad.352629.125
AI 行业动态
AI首夺数学奥赛金牌!OpenAI新模型碾压人类选手
OpenAI最新研发的数学竞赛AI模型在国际数学奥林匹克竞赛(IMO)中取得突破性成绩,成功解决6道题中的5道,以35分(满分42分)超过今年金牌分数线。IMO是全球最具挑战性的数学竞赛,每年仅不到8%的参赛者能获金牌。OpenAI研究员Alexander Wei透露,该成果依赖通用强化学习技术,而非针对特定任务的优化,但模型短期内不会发布。此外,第三方代码中出现的“GPT-5-reasoning-alpha-2025-07-13”字样引发猜测,暗示GPT-5可能即将面世。
这一成绩引发广泛讨论,尤其是数学界顶尖学者陶哲轩的质疑。他在社交媒体指出,由于缺乏统一的测试标准,不同AI模型的成绩难以公平比较。他强调,AI的实际能力受资源、辅助工具和结果呈现方式等因素影响,差异可能极大。陶哲轩列举了多种可能影响测试公平性的因素,例如延长解题时间、改写题目或允许使用外部工具等。与此同时,数学竞赛评测平台MathArena的独立测试显示,现有公开模型(如Gemini 2.5 Pro)得分远低于铜牌线,进一步凸显了OpenAI成果的特殊性。
# OpenAI #IMO #陶哲轩 #GPT-5 #数学竞赛
阅读更多:
https://github.com/aw31/openai-imo-2025-proofs/
AI 驱动科学
Nature:AI利用常规心电图筛查结构性心脏病,准确率超越人类专家
如何对影响全球数千万人的结构性心脏病进行有效早期筛查?针对这一难题,来自哥伦比亚大学和纽约长老会医院的Pierre Elias, Timothy J. Poterucha等研究人员,开发了一款名为EchoNext的人工智能(AI)工具。该工具能通过分析常规心电图数据,准确识别出结构性心脏病患者,其表现甚至优于人类心脏病专家。
研究团队利用来自23万名患者的超过120万份心电图与超声心动图配对数据,训练了深度学习模型EchoNext。为了验证其在真实世界的效果,团队对近85000名正在接受心电图检查但此前未做过心脏超声的患者应用了该模型,成功将超过7500人(占9%)识别为未确诊结构性心脏病(SHD,一类影响心脏瓣膜、心室壁或心腔的疾病)的高风险个体。在后续一年的跟踪中,这些高风险者中接受超声检查的人,确诊率高达近75%,是未借助AI进行分诊人群的两倍。更引人注目的是,在与13位人类心脏病专家的直接比较中,EchoNext模型展现了绝对优势。对于同一批心电图,EchoNext的诊断准确率为77.3%,而心脏病专家在无AI辅助下的准确率为64.0%,即使有AI提示,也仅提升至69.2%,仍显著低于EchoNext。研究发表在 Nature 上。
#AI驱动科学 #预测模型构建 #结构性心脏病 #心电图
阅读更多:
Poterucha, Timothy J., et al. “Detecting Structural Heart Disease from Electrocardiograms Using AI.” Nature, Jul. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-09227-0
大语言模型存在信心悖论:初始时过分自信,面对反驳时又信心不足
大型语言模型为何时而固执己见,时而又因批评而动摇?为了探究这一信心悖论,来自谷歌 DeepMind 和伦敦大学学院的 Dharshan Kumaran, Stephen M. Fleming, Larisa Markeeva 等研究人员,设计了一项新颖的实验,系统性地揭示了LLM在决策和信心更新中存在的内在偏见。
研究团队开发了一种“2轮范式”(2 turn paradigm)来测试LLM的决策过程。实验中,一个LLM首先对一个二元选择题给出答案,随后会收到一个模拟的、带有明确准确率评级的建议(同意、反对或中立)。核心创新在于,研究人员可以控制LLM在做最终决定时能否看到自己的初始答案。结果显示,LLM存在显著的选择支持偏见(choice-supportive bias,即倾向于坚持并增强对自己已做出选择的信心),当初始答案可见时,它们会变得更加固执。然而,研究也发现LLM对批评异常敏感,它们对反对意见的权重远超支持意见,导致其在面对反驳时信心急剧下降并轻易改变主意。这种行为模式明显偏离了理性的贝叶斯更新(Bayesian updating,一种结合先验知识和新证据进行概率推理的理想模型)。这两个看似矛盾的机制共同作用,解释了LLM为何既表现出顽固的过度自信,又存在脆弱的信心不足。
#大模型技术 #计算模型与人工智能模拟 #意图与决策 #认知偏见
阅读更多:
Kumaran, Dharshan, et al. How Overconfidence in Initial Choices and Underconfidence Under Criticism Modulate Change of Mind in Large Language Models. arXiv:2507.03120, arXiv, 3 Jul. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2507.03120
机器学习优化饮食方案(MODERN)可降低痴呆风险
面对日益严峻的痴呆症防治挑战及现有饮食干预效果不佳的现状,来自复旦大学、浙江大学医学院等机构的研究人员利用机器学习技术,设计了一种名为MODERN的新型饮食方案,旨在更有效地降低痴呆症风险。
▷现代饮食和 ACD 之间的潜在途径将大脑结构、新陈代谢、炎症和蛋白质组学特征联系起来。Credit: Nature Human Behaviour (2025).
研究团队首先分析了英国生物样本库(UK Biobank)中超过18.5万名参与者的饮食与健康数据。他们采用一种名为LightGBM的机器学习算法,从众多食物类别中筛选并确定了与痴呆风险最相关的关键食物组,例如绿叶蔬菜和浆果等。基于这些发现,研究人员构建了一个名为MODERN(机器学习辅助优化饮食干预)的实用评分系统。为了验证其效果,团队在三个独立的外部队列中进行了测试。结果显示,MODERN饮食方案的保护效果优于广为人知的MIND饮食(地中海神经退行性延迟干预)。数据显示,遵循MODERN饮食得分最高的参与者,其患痴呆症的风险比得分最低的参与者显著降低了36%。进一步的机制分析揭示,这种饮食模式可能通过增强大脑结构完整性和减轻神经炎症来发挥其神经保护作用。研究发表在 Nature Human Behaviour 上。
#疾病与健康 #疾病预防 #机器学习 #饮食干预
阅读更多:
Chen, Si-Jia, et al. “Machine Learning-Assisted Optimization of Dietary Intervention against Dementia Risk.” Nature Human Behaviour, Jul. 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41562-025-02255-w
轻量级AI模型在情感分析中挑战大语言模型,实现成本与性能双赢
运行大型AI模型进行情感分析成本高昂,限制了其广泛应用。研究人员 Agni Siddhanta 和 Abhishek Kumar Bhagat 提出了一种创新的混合架构,证明了通过巧妙的工程设计,更小、更高效的模型不仅能大幅降低计算成本,还能在情感分析任务上达到甚至超越大型语言模型的性能。
▷我们的混合情感分析管道示意图:Transformer 编码器生成固定长度的嵌入,这些嵌入馈送到机器学习分类器中。Credit: Procedia Computer Science (2025).
研究团队设计了一种两阶段分析流程,首先采用RoBERTa-Large等句子Transformer将文本转化为富含信息的数字向量。通过多种监督损失函数进行微调,该方法能让代表相似情感的句子在数学空间中彼此靠近。随后,这些优化后的向量被送入成熟且计算高效的经典机器学习分类器,如极限梯度提升(XGBoost,一种通过组合多个弱预测模型来构建强预测模型的算法)或支持向量机(SVM)进行最终分类。这种将繁重的微调与快速的分类解耦的策略,极大地降低了资源需求。
在性能基准测试中,该混合模型表现出色。在Twitter航空公司情感数据集上,其准确率达到88.4%,比经过微调的巨型模型Meta-Llama-3-8B高出2.5个百分点,而训练速度快了11倍。在IMDb电影评论数据集上,该模型的准确率为95.9%,虽然略低于Llama-3-8B的97.1%,但其训练时间不到4小时,推理仅需数分钟,远胜于Llama-3-8B所需的7小时训练和近3小时推理。这些结果表明,高效的AI情感分析不再是大型模型的专属。研究发表在 Procedia Computer Science 上。
#AI驱动科学 #预测模型构建 #情感分析 #模型效率
阅读更多:
“Sentiment Showdown - Sentence Transformers Stand Their Ground against Language Models: Case of Sentiment Classification Using Sentence Embeddings.” Procedia Computer Science, vol. 257, Jan. 2025, pp. 1205–12. www.sciencedirect.com, https://doi.org/10.1016/j.procs.2025.03.161
AI利用树状数学捷径追踪动态信息
语言模型如何像人一样追踪不断变化的信息(例如故事进展或代码状态)?麻省理工学院计算机科学与人工智能实验室的Belinda Z. Li、Zifan Carl Guo和Jacob Andreas通过实验揭示,模型并非逐步模拟,而是使用两种基于树状结构的数学捷径来高效计算最终结果。
▷Credit: arXiv (2025).
研究团队设计了一个类似“三仙归洞”的数字排列任务,要求语言模型根据一系列交换指令预测数字的最终顺序。为探究模型的内部“思考”过程,他们使用了“探测”(probing,一种可视化模型内部信息流的技术)和“激活修补”(activation patching,一种通过干扰特定神经元活动来定位关键计算功能的方法)等可解释性工具。结果发现,模型并不会像人一样按部就班地模拟每一步变化,而是自发学习了两种高效的数学算法。第一种是关联算法(Associative Algorithm, AA),它将连续的计算步骤分层分组,像树状结构一样聚合信息,从而一次性算出最终结果。第二种是奇偶校验关联算法(Parity-Associative Algorithm, PAA),它先利用奇偶性这一简单的启发式规则排除部分答案,再进行关联计算。实验表明,关联算法学习更快且对长序列任务更具鲁棒性,而奇偶校验关联算法因依赖捷径而泛化能力较差。这一发现表明,提升大模型推理能力的关键可能在于顺应其固有的计算偏好,而非强迫其模仿人类思维。
#大模型技术 #计算模型与人工智能模拟 #神经机制与脑功能解析
阅读更多:
Li, Belinda Z., et al. (How) Do Language Models Track State? arXiv:2503.02854, arXiv, 11 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.02854
新AI方法MCTD结合蒙特卡洛树搜索与扩散模型,高效解决复杂规划问题
当前强大的扩散模型在处理复杂的推理和规划任务时,面临计算效率和性能扩展性的瓶颈。来自韩国科学技术院(KAIST)和蒙特利尔大学/Mila研究所的 Sungjin Ahn, Yoshua Bengio, Jaesik Yoon, Hyeonseo Cho 及 Doojin Baek 团队开发了蒙特卡洛树扩散(MCTD)框架,将两种AI技术优势结合,显著提升了AI在复杂规划任务中的效率和成功率。
▷三个规划器(Diffuser、Diffusion Force 和 Monte Carlo Tree Diffusion (MCTD))的生成计划和实际部署的比较。虽然 Diffuser 和 Diffusion Forcing 未能产生成功的轨迹计划,但 MCTD 通过适应性地改进其计划而取得成功。Credit: Monte Carlo Tree Diffusion
该研究旨在解决扩散模型在推理规划时难以通过增加计算来提升性能的局限性。团队提出了蒙特卡洛树扩散(Monte Carlo Tree Diffusion, MCTD)框架,它将经典的蒙特卡洛树搜索与扩散模型的生成过程深度融合。MCTD将去噪过程重塑为树状的探索和推演,允许模型在生成规划路径时,像MCTS一样自适应地评估、剪枝并优化不同的可能性分支,从而有效平衡探索与利用。实验结果证明了该方法的卓越性能:在现有模型完全无法成功的巨型迷宫求解任务中,MCTD实现了100%的成功率。此外,团队在后续研究中通过并行化和计算优化,将模型速度提升了高达100倍,展示了其在智能机器人和实时AI等领域的应用潜力。
#大模型技术 #意图与决策 #计算模型与人工智能模拟 #机器人及其进展
阅读更多:
Yoon, Jaesik, et al. Monte Carlo Tree Diffusion for System 2 Planning. arXiv:2502.07202, arXiv, 13 Jul. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.07202
可扩展Transformer加速器赋能大模型设备端高效执行
大型语言模型(LLM)的高计算需求限制了其在手机等终端设备上的应用。韩国世宗大学的Seok-Woo Chang与Dong-Sun Kim等研究人员开发了一款名为可扩展Transformer加速器单元(STAU)的新型硬件解决方案,旨在让大模型能够高效、灵活地在设备上本地运行。
▷使用和不使用硬件加速器的进程差异。Credit: Electronics (2024).
该研究的核心是一种名为可扩展Transformer加速器单元(Scalable Transformer Accelerator Unit, STAU)的硬件架构。其关键在于采用了可变脉动阵列(Variable Systolic Array, VSA)设计,这是一种能够根据输入序列长度动态扩展的矩阵运算核心,解决了语言模型句子长度多变的问题。通过逐行输入数据并并行加载权重,该系统显著减少了内存停顿,提升了处理效率。研究团队还对关键计算瓶颈进行了优化。他们重新设计了softmax函数,采用基于移位加法运算的轻量级方法,降低了硬件复杂度。同时,系统使用专为Transformer定制的16位浮点格式,巧妙地省去了层标准化这一耗时步骤,进一步简化了数据处理流程。在基准测试中,STAU在现场可编程门阵列(Field-Programmable Gate Array, FPGA)上实现,与纯CPU执行相比,速度提升了3.45倍,同时保持了超过97%的数值准确率。在处理长序列时,总计算时间减少超过68%。团队后续的内部测试更显示,优化后的系统速度提升可高达5.18倍,证明了该架构的强大扩展潜力。研究发表在 Electronics 上。
#大模型技术 #其他 #硬件加速器 #端侧AI
阅读更多:
Chang, Seok-Woo, and Dong-Sun Kim. “Scalable Transformer Accelerator with Variable Systolic Array for Multiple Models in Voice Assistant Applications.” Electronics, vol. 13, no. 23, 23, Jan. 2024, p. 4683. www.mdpi.com, https://doi.org/10.3390/electronics13234683
整理|ChatGPT
编辑|丹雀、存源
由天桥脑科学研究院主办的首届AI驱动科学年度研讨会(AIAS 2025)将于10月27–28日在美国旧金山举行。会议面向全球征集论文,聚焦能够在科学领域开辟全新研究模式、假设生成及实验方法的变革性人工智能创新。如果您希望与诺贝尔奖得主Jennifer Doudna,David Baker,知名学者Animashree Anankumar,Heather J. Kulik,以及业界领袖Tom Miller一同登台分享,请点击阅读原文提交您的论文:https://aias2025.org/call-for-papers/!征稿截止日期为8月1日。
关于追问nextquestion
天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。欢迎评论区留言,或后台留言“社群”即可加入社群与我们互动。您也可以在后台提问,我们将基于追问知识库为你做出智能回复哦~
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了加州理工天桥神经科学研究院。
Chen Institute建成了支持脑科学和人工智能领域研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括、、、科研型临床医生奖励计划、、等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.