追问daily | 不喜欢音乐的人也会跟着摇摆；32B革新AI数学推理能力；善意和恶意创造性观念生成的脑活动差异|苹果|脑科学|创造力|神经网络|阿里巴巴|数据分析|知名企业

分享至

█ 脑科学动态

Cell：DNA修复基因成亨廷顿病治疗新希望

新型“卵形细胞”揭示记忆形成的关键机制

善意与恶意创造力：脑活动模式的共性与差异

类脑神经网络模仿人类的关系学习能力

不喜欢音乐的人也会跟着摇摆

在线接触比面对面更有效？群体间偏见干预的新发现

学习进步驱动深度任务参与和认知控制

█ AI行业动态

苹果联手阿里，AI功能即将登陆中国iPhone

AI 可能在 2026-2027 年达到“超级天才国家”水平

仅 32B！ReasonFlux 以小博大，革新 AI 数学推理能力

█ AI研发动态

新算法提升 AI 独立学习和发现数据模式的能力

未经训练的佩戴假肢的患者可以通过触摸区分物体

发现人类和动物行为中的符号认知模型

OpenAI o3：大规模强化学习轻松斩获IOI金牌

3.5B参数模型用循环策略挑战50B性能

基于智能体超网络的MaAS框架实现高性能与低成本的多智能体系统

脑科学动态

Cell：DNA修复基因成亨廷顿病治疗新希望

亨廷顿病（Huntington's disease, HD）是一种遗传性神经退行性疾病，其病因与CAG重复序列的扩张有关。加州大学洛杉矶分校健康中心和Jane and Terry Semel神经科学与人类行为研究所的研究团队通过基因编辑技术，在亨廷顿病模型小鼠中研究了DNA错配修复基因的作用，发现Msh3和Pms1基因的缺失显著改善了小鼠的病理表型。

▷图形摘要。Credit: Cell (2025).

研究团队使用携带140个CAG重复序列的亨廷顿病模型小鼠（Q140模型），通过基因编辑技术敲除或修改了9个与DNA错配修复相关的基因。研究发现，敲除Msh3和Pms1基因可以显著减少突变亨廷顿蛋白（mutant Huntingtin, mHtt）的聚集，并纠正纹状体神经元中的基因表达失调。此外，Msh3基因的缺失还改善了小鼠的运动功能和突触蛋白水平，并减少了星形胶质细胞的过度反应。研究还发现，纹状体神经元中的CAG重复序列以每月8.8个重复的线性速率扩张，而Msh3和Pms1基因的缺失可以显著减缓或阻止这一扩张过程。这些结果表明，Msh3和Pms1基因在亨廷顿病的病理过程中起着关键作用，可能成为治疗该疾病的新靶点。研究发表在 Cell 上。

#大脑健康 #亨廷顿病 #DNA错配修复 #基因编辑 #神经元病理

阅读更多：

Wang, Nan, et al. “Distinct Mismatch-Repair Complex Genes Set Neuronal CAG-Repeat Expansion Rate to Drive Selective Pathogenesis in HD Mice.” Cell, vol. 0, no. 0, Feb. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.01.031

新型“卵形细胞”揭示记忆形成的关键机制

记忆如何形成是神经科学的核心问题之一。不列颠哥伦比亚大学医学院的Mark Cembrowski团队发现了一种新型脑细胞——“卵形细胞”（ovoid cells），这种细胞在记忆和物体识别中起关键作用。研究由博士生Adrienne Kinman主导，通过基因操纵和微型单光子显微镜技术，团队揭示了卵形细胞在小鼠记忆形成中的独特功能。

▷卵圆形细胞在小鼠海马体中活跃。Credit: Cembrowski Lab/UBC Faculty of Medicine

研究团队首先通过基因操纵使小鼠的卵形细胞在活跃时发光，随后使用微型单光子显微镜观察这些细胞在小鼠与环境互动时的活动。结果显示，当小鼠遇到新物体时，卵形细胞被强烈激活，但随着物体被记住，细胞活动逐渐停止。这种反应表明卵形细胞在记忆形成中起关键作用。此外，研究还发现，抑制卵形细胞会阻碍小鼠的非空间物体学习，但不影响空间学习；激活卵形细胞则会将小鼠对新物体的探索行为转变为对熟悉物体的探索。这一发现表明，卵形细胞在非空间记忆和行为偏好中具有特异性控制作用。

研究还探讨了卵形细胞在阿尔茨海默病和癫痫等疾病中的潜在作用。团队假设，卵形细胞的失调可能是这些疾病症状的驱动因素。例如，在阿尔茨海默病中，卵形细胞的功能障碍可能导致物体识别记忆的丧失；而在癫痫中，卵形细胞的过度兴奋可能参与癫痫发作的起始和传播。研究发表在 Nature Communications 上。

#大脑健康 #记忆形成 #卵形细胞 #阿尔茨海默病 #神经技术

阅读更多：

Kinman, Adrienne I., et al. “Atypical Hippocampal Excitatory Neurons Express and Govern Object Memory.” Nature Communications, vol. 16, no. 1, Feb. 2025, p. 1195. www.nature.com, https://doi.org/10.1038/s41467-025-56260-8

善意与恶意创造力：脑活动模式的共性与差异

创造力可以驱动社会发展，但其背后的神经活动尚不明确。华东师范大学心理与认知科学学院的郝宁团队使用功能磁共振成像技术，探索了善意和恶意创造性观念生成的脑活动差异。研究发现，两者既有共性，也存在显著不同。

研究团队使用功能磁共振成像技术收集了48名健康被试的脑活动数据，被试需完成善意创造性观念生成任务、恶意创造性观念生成任务及普通创造性情境任务。分析其行为数据，如观点的新颖性、善意性或恶意性。结果发现，善意和恶意创造性观念生成有共享的“创意引擎”，即两者均伴随着额中回（middle frontal gyrus）和额上回（superior frontal gyrus）的显著激活。恶意创造性观念生成伴随右侧中央岛盖（right rolandic operculum）、缘上回（supramarginal gyrus）和角回（angular gyrus）等脑区更强的激活，且功能连接强度更低。善意创造性观念生成则涉及更广泛的脑区协作和网络整合。研究发表在 Cerebral Cortex 上。

#认知科学 #创造力 #功能磁共振成像 #脑活动

阅读更多：

Gao, Zhenni, et al. “Neural Correlates Underlying Creative Ideation Associated with Malevolent or Benevolent Intentions.” Cerebral Cortex, vol. 35, no. 2, Feb. 2025, p. bhaf010. Silverchair, https://doi.org/10.1093/cercor/bhaf010

类脑神经网络模仿人类的关系学习能力

人类和动物具有学习物体或事件之间关系的能力，这种能力被称为“关系学习”，但其生物学基础尚不明确。旧金山 ML Collective 的 Thomas Miconi 和哥伦比亚大学的 Kenneth Kay 合作，使用具有突触可塑性的类脑人工神经网络，揭示了关系学习的神经机制。

▷塑性神经网络图。这些网络类似于传统神经网络，但包括可塑连接（红色），这些连接可以因网络自身产生的可塑性信号（循环中的红色箭头）而改变。Credit: Thomas Miconi and Kenneth Kay.

研究人员使用了一种具有突触可塑性（神经网络能够根据活动改变连接强度）的人工神经网络，并通过元学习方法训练网络。他们发现，这种网络能够模仿人类和动物在传递推理任务中的行为模式，并且能够进行知识重组。研究还揭示了两种不同的学习机制：一种较为简单，仅支持一般关系学习；另一种更为复杂，能够支持知识重组。这些发现为理解关系学习的神经机制提供了新的视角，并可能为未来的认知科学研究提供重要工具。研究发表在 Nature Neuroscience 上。

#认知科学 #关系学习 #神经网络 #突触可塑性 #元学习

阅读更多：

Miconi, Thomas, and Kenneth Kay. “Neural Mechanisms of Relational Learning and Fast Knowledge Reassembly in Plastic Neural Networks.” Nature Neuroscience, vol. 28, no. 2, Feb. 2025, pp. 406–14. www.nature.com, https://doi.org/10.1038/s41593-024-01852-8

不喜欢音乐的人也会跟着摇摆

音乐性快感缺失者通常无法从音乐中获得愉悦感，但他们是否会对音乐产生生理反应？康科迪亚大学的Isaac Romkey及其团队通过在线实验，使用节奏和和声复杂度不同的音乐刺激，测量了音乐性快感缺失者和对照组的groove反应。结果显示，两组在groove反应上没有显著差异，表明移动的冲动可能补偿了音乐性快感缺失者的愉悦感缺失。

研究团队使用了一系列节奏和和声复杂度不同的音乐刺激，通过在线实验测量了148名参与者（包括17名音乐性快感缺失者和17名对照组）的groove反应。参与者被要求评价每首曲子带来的愉悦感和想要移动的冲动。结果显示，两组在groove反应上没有显著差异。中介分析表明，对于音乐性快感缺失者，想要移动的冲动完全中介了节奏和和声复杂度对愉悦感的影响。这表明，移动的冲动可能补偿了音乐性快感缺失者的钝化愉悦感。研究发表在 PLOS One 上。

#认知科学 #音乐性快感缺失 #groove反应 #背侧纹状体 #腹侧纹状体

阅读更多：

Romkey, Isaac D., et al. “The Pleasurable Urge to Move to Music Is Unchanged in People with Musical Anhedonia.” PLOS ONE, vol. 20, no. 1, Jan. 2025, p. e0312030. PLoS Journals, https://doi.org/10.1371/journal.pone.0312030

在线接触比面对面更有效？群体间偏见干预的新发现

偏见和歧视是全球性挑战的核心问题，但现有干预措施的证据基础薄弱。为了减少发表偏倚（publication bias）和文件抽屉问题（file drawer problem），Matt Lowe对41项预先注册的群体间接触实验进行了元分析，发现群体间接触的平均效应较小，且在线干预效果优于面对面干预。

研究采用元分析方法，重点关注41项预先注册的群体间接触实验，仅分析预先指定的主要结果，以减少发表偏倚和结果切换的影响。研究发现，群体间接触对偏见和群体间关系的平均效应为0.08σ（标准差），而包含培训等综合干预措施的效应为0.13σ。令人意外的是，满足Allport（1954）提出的四个理想条件（共同目标、群体间合作、平等地位和权威支持）的面对面干预效果并不显著。此外，在线干预的效果比面对面干预高出0.25σ。研究还发现，群体间接触对特定外群体成员的态度和行为改变效果显著，但对整个外群体的泛化效果有限。作者建议未来研究应通过更精确的测量和考虑Allport条件之外的调节因素，来解决泛化问题。

#认知科学 #群体间接触 #偏见减少 #元分析 #在线干预

阅读更多：

https://mattjlowe.github.io/files/Lowe-2025-has-intergroup-contact-delivered.pdf

学习进步驱动深度任务参与和认知控制

深度参与活动是实现目标的关键，但如何在现实生活中保持这种状态？Hairong Lu、Dimitri Van der Linden和Arnold B. Bakker等研究人员通过实验探讨了学习进步（Learning Progress, LP）如何影响任务参与和认知控制。他们设计了一个游戏化任务，结合脑电图技术，揭示了学习进步与任务参与度及认知控制的关系。

研究人员设计了一个游戏化任务，参与者通过强化学习过程为小矮人提供果汁。通过计算每个任务阶段的学习进步，并结合脑电图（EEG）测量，研究人员发现学习进步与任务参与度（表现为心流体验和低分心度）显著相关。脑电图数据显示，学习进步与增强的主动准备（如减少的预刺激偶然负变，CNV）和改善的反馈处理（如增加的P3b振幅）相关。此外，顶叶α波去同步化（parietal alpha desynchronization）表明学习进步调节了认知控制，抑制了默认模式网络（DMN）的激活并增强了注意力功能。研究结果强调了学习进步在维持任务参与和认知控制中的关键作用。研究发表在 NeuroImage 上。

#认知科学 #学习进步 #心流状态 #脑电图 #认知控制

阅读更多：

“The Neuroscientific Basis of Flow: Learning Progress Guides Task Engagement and Cognitive Control.” NeuroImage, vol. 308, Mar. 2025, p. 121076. www.sciencedirect.com, https://doi.org/10.1016/j.neuroimage.2025.121076

AI 行业动态

苹果联手阿里，AI功能即将登陆中国iPhone

据报道，苹果正在与阿里巴巴手合作，为中国市场的 iPhone 注入先进的人工智能功能。近年来，苹果在中国的销量因缺乏足够的AI应用而出现下滑，此次跨界合作正是为了解决这一困境。

根据报道，苹果曾先后考察了百度、腾讯、字节跳动以及 DeepSeek 的方案，但最终因阿里巴巴拥有庞大且精准的消费者数据及成熟的AI技术优势而被选中。合作不仅有望加速新功能通过中国监管部门的审批，也将推动 Siri 和搜索等功能实现个性化、智能化升级，从而更好地迎合本地用户需求，并在激烈的市场竞争中对抗华为等品牌不断提升的AI实力。

#苹果 #阿里巴巴 #AI创新 #中国市场

阅读更多：

https://www.techradar.com/computing/artificial-intelligence/apple-is-reportedly-partnering-with-alibaba-in-china-for-ai-features-and-it-makes-sense-after-deepseek

Anthropic CEO 警告：AI 可能在 2026-2027 年达到“超级天才国家”水平

Anthropic 首席执行官 Dario Amodei 在巴黎 AI 行动峰会（Paris AI Action Summit）上发出警告，AI 可能在 2026-2027 年（最晚 2030 年）达到突破性水平，智能程度堪比“一个充满超级天才的国家”（a country of geniuses in a datacenter）。这一进步将深刻影响全球经济、社会结构和国家安全，但当前监管和治理的速度远远落后于 AI 发展。

Amodei 强调，AI 的快速发展可能带来以下重大挑战：全球竞争加剧：如果民主国家在 AI 领域落后，可能会失去经济和军事优势，甚至面临专制国家的技术垄断。安全威胁升级：AI 可能被用于大规模杀伤性武器（CBRN，即化学、生物、放射性和核武器）开发、网络攻击，甚至欺骗用户并执行不符合人类意图的任务。经济冲击：AI 可能取代大量传统工作，导致全球范围内的就业市场剧变，加剧社会不平等问题。

为了应对这些挑战，Amodei 呼吁各国政府采取更果断的措施，包括加强 AI 监管、确保民主国家在 AI 供应链中的主导地位、建立全球 AI 安全审查机构，并推行 AI 时代的再教育计划，以缓解失业风险。

#AI监管 #科技变革 #数据中心中的天才国度

阅读更多：

https://www.anthropic.com/news/paris-ai-summit

Cerebras 加速 Perplexity AI 搜索模型 Sonar，每秒 1,200 tokens 提供答案

Perplexity AI 推出了全新的 AI 搜索模型 Sonar，并借助 Cerebras Systems 提供的 AI 计算支持，实现了每秒 1,200 tokens 的推理速度。这一突破使得 Sonar 在回答质量、准确性和可读性方面均有显著提升，为用户带来了更加高效的搜索体验。

Sonar 基于 Llama 3.3 70B 进行深度训练，优化了信息检索的精准度，并能够以接近即时的速度提供答案。目前，该模型已开放给 Perplexity Pro 用户，并可在设置中启用 Sonar API。相较于传统搜索引擎，AI 搜索可直接给出经过 AI 处理的答案，省去用户筛选网页的繁琐过程。

Cerebras Systems 是一家专注于高性能 AI 计算的公司，致力于推动人工智能训练和推理的极限。其核心产品包括：CS-3 AI 计算系统 ——全球最快的 AI 训练设备，拥有 900,000 计算核心和 44GB 片上内存，可单机训练 1 万亿参数 AI 模型。Wafer-Scale Engine（WSE） ——当前全球最大、最快的 AI 处理器，性能超越传统 GPU 100 倍。

凭借这些先进技术，Cerebras 让 Sonar 的推理速度达到了惊人的 1,200 tokens/s，比 Gemini 2.0 Flash 快 10 倍，甚至超越了 GPT-4o 和 Claude 3.5 Sonnet。通过 A/B 测试，Sonar 在 IFEval（指令遵循性）和 MMLU（世界知识测试）等学术评测上表现优异，进一步提升了 AI 搜索的竞争力。

Perplexity AI 首席技术官 Denis Yarats 认为，Cerebras 先进的 AI 计算技术是 Sonar 高速推理能力的关键，未来双方将继续深化合作，推动 AI 搜索技术的发展。Cerebras CEO Andrew Feldman 也表示，希望通过这项合作，让全球用户享受到更快、更精准的信息获取体验。

#AI搜索 #Cerebras #PerplexityAI #Llama3.3 #高速推理

阅读更多：

https://www.perplexity.ai/hub/blog/meet-new-sonar

仅 32B！ReasonFlux 以小博大，革新 AI 数学推理能力

近日，普林斯顿大学与北京大学联合推出了一种全新的大语言模型推理框架——ReasonFlux。该框架基于层次化强化学习（Hierarchical Reinforcement Learning，HRL，一种将复杂任务拆解为多层次决策的优化策略），旨在提升 AI 解决复杂数学推理问题的能力。

当前的 LLM 推理方法，如 Best-of-N（多路径探索法）和蒙特卡洛树搜索（MCTS，一种通过随机模拟优化决策路径的搜索算法），通常依赖增加计算资源来提高推理能力，但计算成本高且可解释性较弱。ReasonFlux 通过结构化思维模板与层次化推理，大幅提升推理效率并增强可解释性。

核心技术包括：结构化思维模板库：由约 500 个高效模板组成，覆盖不等式求解、三角函数变换等数学问题，为 LLM 提供清晰的推理路径。层次化强化学习优化：采用高层导航（Navigator）选择最佳推理路径，减少计算冗余，提高泛化能力。高效推理系统：仅使用 32B 参数和 8 块 NVIDIA A100 GPU 进行训练，展现出媲美更大模型的推理能力。

在数学推理基准测试（MATH、AIME 2024、AMC 2023 等）中，ReasonFlux-32B 取得了 91.2% 的准确率，超越多款主流 AI 推理模型。这一突破表明，即便是较小规模的模型，通过优化推理框架，也能实现高效、精准的推理能力。

#ReasonFlux #层次化强化学习 #推理大模型 #数学推理 #AI推理优化

阅读更多：

https://arxiv.org/abs/2502.06772

AI 研发动态

新算法提升 AI 独立学习和发现数据模式的能力

悉尼科技大学的研究团队开发了一种名为扭矩聚类（Torque Clustering）的新AI算法，该算法比现有方法更接近自然智能，显著提高了AI系统独立学习和发现数据模式的能力。

扭矩聚类算法基于扭矩的物理概念，能够自主识别聚类并无缝适应不同类型的数据。该算法通过识别质量和距离的峰值，有效地检测并移除了错误的合并。经过在1000个不同数据集上的严格测试，实现了平均调整互信息（AMI）得分97.7%，优于其他最先进的方法。该算法完全无参数，能够自主识别各种聚类类型，确定最佳聚类数量，并识别噪声。研究发表在 IEEE Transactions on Pattern Analysis and Machine Intelligence 上。

#神经技术 #无监督学习 #扭矩聚类 #AI算法 #数据分析

阅读更多：

Yang, Jie, and Chin-Teng Lin. “Autonomous Clustering by Fast Find of Mass and Distance Peaks.” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2025, pp. 1–14. IEEE Xplore, https://doi.org/10.1109/TPAMI.2025.3535743

未经训练的佩戴假肢的患者可以通过触摸区分物体

肢体截肢会导致严重的后果，如运动和感觉功能丧失以及幻肢痛（PLP）。斯科尔科特赫研究所、假肢制造商 Motorica 和远东联邦大学的研究人员进行了这项研究，使用周围神经刺激（PNS）、脊髓刺激（SCS）和经皮电神经刺激（TENS）等方法，成功让假肢使用者通过触摸区分物体。

▷视频截图显示，一名蒙眼测试对象根据假肢手臂处理管子（灰色管道）的反馈来描述物体的大小。Credit: Gurgen Soghoyan et al./Frontiers in Neuroscience

研究团队与两位肘部以上截肢的患者合作。每位参与者都在脊髓附近和手臂的周围神经中植入电极。因此，这两个电极提供了两种不同类型的刺激，研究人员着手比较相关的感觉。利用假肢手以电脉冲形式提供的反馈，患者成功区分了各种尺寸的物品，以及通过触摸区分软硬物体。实验持续了一个月，使患者的学习和习惯化过程得以监控。除了参与者的主观报告外，团队还研究了他们的脑活动记录。该研究发表在 Frontiers in Neuroscience 上。

#神经技术 #假肢 #神经刺激 #触觉反馈

阅读更多：

Soghoyan, Gurgen, et al. “Restoration of Natural Somatic Sensations to the Amputees: Finding the Right Combination of Neurostimulation Methods.” Frontiers in Neuroscience, vol. 18, Nov. 2024. Frontiers, https://doi.org/10.3389/fnins.2024.1466684

发现人类和动物行为中的符号认知模型

符号认知模型在理解大脑如何产生行为方面至关重要，但传统方法依赖于研究人员的假设和创造力，可能无法找到最适合数据集的模型。为了解决这一问题，Romera-Paredes等研究人员改进了FunSearch工具，增加了额外的优化层次，称为CogFunSearch。该方法利用大型语言模型在进化算法中自动发现符号认知模型，应用于人类、老鼠和果蝇的数据集，执行经典的奖励引导决策任务。研究发现，CogFunSearch发现的程序在可靠性方面优于已知的最佳人工发现认知模型。

CogFunSearch方法的关键是利用大型语言模型在进化算法中自动发现符号认知模型。在外部优化循环中，FunSearch进化程序，而在内部循环中，模型参数被拟合到数据。研究团队将CogFunSearch应用于来自三种物种（人类、老鼠和果蝇）的数据集，执行经典的奖励引导决策任务。

研究发现，CogFunSearch发现的程序在可靠性方面优于已知的最佳人工发现认知模型。这些程序可以很容易地解释为关于人类和动物认知的假设，实例化了可解释的符号学习和决策算法。研究结果显示，CogFunSearch能够生成大量程序，这些程序在定量性能和程序复杂性之间显示出明显的权衡。尽管得分最高的程序比基线模型更复杂，但可以为每个数据集识别出性能更高且更简单的模型。这些结果广泛展示了使用LLM驱动的程序合成提出关于人类和动物认知机制的新科学假设的可行性。

#认知科学 #符号认知模型 #大型语言模型 #进化算法 #奖励引导决策

阅读更多：

Castro, Pablo Samuel, et al. Discovering Symbolic Cognitive Models from Human and Animal Behavior. bioRxiv, 6 Feb. 2025, p. 2025.02.05.636732. bioRxiv, https://doi.org/10.1101/2025.02.05.636732

OpenAI o3：大规模强化学习轻松斩获IOI金牌

OpenAI团队针对复杂编码与推理问题展开研究，采用强化学习与测试时策略相结合的方法，对比通用模型与领域特定模型，验证了大规模RL训练能显著提升模型成绩，取得了IOI金牌和Codeforces高分。

研究采用强化学习对大语言模型进行训练，首先利用RL生成思维链提升推理能力。通用模型o1在初步测试中表现不俗，而基于o1针对编码任务进行额外RL微调并结合人工设计测试时推理策略的o1-ioi，在IOI 2024中严格提交限制下获得213分（49th percentile），放宽限制后提升至362.14分；更重要的是，经过进一步大规模RL训练的o3，仅在严格限制下便取得395.64分（超越金牌线359.71分），在Codeforces中获得2724分（99.8th percentile），显示其成绩直逼顶尖人类选手。此外，模型在HackerRank Astra和SWE-bench等真实软件工程任务上也获得明显提升。

#认知科学 #强化学习 #大语言模型 #竞技编程

阅读更多：

OpenAI, et al. Competitive Programming with Large Reasoning Models. 1, arXiv:2502.06807, arXiv, 3 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.06807

3.5B参数模型用循环策略挑战50B性能

针对复杂推理任务计算效率低下的问题，马里兰大学研究团队采用循环隐式推理技术构建了概念验证模型。该团队利用全新架构，通过重复执行循环模块提升模型推理深度，在数学与编程等测试中取得了相当于50B参数模型的效果。

本研究提出的核心方法是循环隐式推理（latent space recurrent reasoning：通过在潜在空间中反复迭代实现隐式推理），在传统仅解码器结构中引入核心循环块，使模型能够在测试时根据任务复杂度自适应延展计算深度，而不依赖于专门设计的链式思维训练数据。概念验证模型参数规模为3.5B，训练使用了8000亿 token。实验结果显示，该模型在数学推理（如 GSM8k、MATH、MathQA）和编程测试（如 MBPP、HumanEval）中表现出色，复杂任务上性能可扩展至相当于50B参数模型，部分任务成绩提升高达5倍。模型架构基于 Transformer设计，并采用前奏、核心循环块与尾声三部分构成，同时具备自适应计算与 KV 缓存共享（KV Cache：用于存储键值对信息以加速推理）等优势，为大语言模型推理能力的提升提供了新的计算维度。

#认知科学 #循环隐式推理 #大语言模型 #Transformer

阅读更多：

Geiping, Jonas, et al. Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach. arXiv:2502.05171, arXiv, 7 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.05171

基于智能体超网络的MaAS框架实现了高性能与低成本的多智能体系统

该研究针对多智能体系统人工配置繁琐与资源浪费问题，由同济大学、新加坡国立大学、中国科学技术大学及上海人工智能实验室的研究人员提出，通过智能体超网络自动采样构建系统，经实验验证实现了性能提升与成本降低。

本研究提出的MaAS（Multi-agent Architecture Search）框架通过构建智能体超网络实现多智能体系统的自动化设计。该方法利用控制器网络对系统进行优化，并通过蒙特卡罗采样与文本梯度估计同步更新架构参数与各层操作。研究团队在代码生成、数学推理和工具使用等七项任务的基准测试中验证了该方法，结果显示，MaAS在性能上提升了0.54%至11.82%，在数学推理等任务中，其推理成本仅为传统系统的6%至45%，同时具备出色的跨数据集和跨LLM模型的迁移能力。该研究不仅降低了资源消耗，还实现了面向不同任务的定制化集体智能解决方案。

#认知科学 #多智能体 #自动化设计 #智能体超网络

阅读更多：

Zhang, Guibin, et al. Multi-Agent Architecture Search via Agentic Supernet. arXiv:2502.04180, arXiv, 6 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.04180

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或添加小助手微信questionlab，加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.