追问daily | 无需干预，AI群体自发形成社会规范；为什么习惯难以改变？通用科学人工智能体自行设计算法|字母|苹果|神经网络|超级智能

分享至

█脑科学动态

Nature：大脑如何形成习惯以及它为何难以改变？

Nature：大脑如何让我们推断情绪？

灵感迸发的神经机制

自然状态下急性疼痛的神经与面部动态解码

超声精准打击震颤病灶，找到治疗手抖的黄金靶点

可逆方法以分子精度打破大脑回路

█AI行业动态

DeepMind推出 AlphaEvolve：能写代码、能优化、还能搞科研

DeepSeek-V3论文揭秘：低成本训练大模型的硬件协同设计之道

Synchron 首次实现与 iPhone、iPad 和 Apple Vision Pro 的原生脑机接口集成

█AI驱动科学

能量与记忆：一种新的神经网络范式

用AI 分析笔迹可以及早发现儿童阅读障碍

AI工具威胁科研质量：低质量论文数量激增538%

Nemotron-Research-Tool-N1让大模型工具调用能力超越GPT-4o

AutoLibra：从开放反馈中自动生成AI代理评估指标

基于LLM的算法使无损数据压缩率翻倍

AI模型通过社交媒体帖子精准识别抑郁症迹象

AI群体自发形成社会规范，无需人类干预

掌控人工智能：新技术为大型语言模型提供更多控制

脑科学动态

Nature：大脑如何形成习惯以及它为何难以改变

为什么习惯难以改变？伦敦大学学院塞恩斯伯里·惠康中心的Marcus Stephenson-Jones团队发现大脑存在双重学习系统：基于奖赏的RPE系统和基于动作重复的APE系统。后者通过纹状体尾部（TS）的多巴胺信号固化习惯行为，解释了成瘾和帕金森病的神经机制。

▷图像显示了在任务中被抑制的两个大脑区域——背内侧纹状体（DMS）和纹状体尾部（TS）。Credit: Hernando Martinez Vergara.

研究团队结合基因工程小鼠模型与听觉辨别任务，首次捕捉到纹状体尾部（TS）的动作预测误差（APE）信号——这种多巴胺释放仅与动作执行频率相关，与奖赏无关。通过对比实验发现，正常小鼠在任务熟练度达60-70%时切换至APE主导的“自动驾驶”模式，而TS损伤小鼠则停滞于线性学习。计算模型显示，APE系统通过存储“默认策略”（如开车时自动换挡）释放认知资源，使RPE系统可处理其他决策。专家小鼠的TS被抑制后，任务表现崩溃，证实习惯行为完全依赖APE系统。该发现解释了帕金森病患者为何能滑冰（灵活行为）却难以行走（习惯行为），因病变的SNc多巴胺神经元正是APE编码者。研究为成瘾治疗提供新思路：持续替代行为（如口香糖替代吸烟）可“覆盖”旧APE模式。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #神经调控 #计算模型与人工智能模拟 #习惯形成

阅读更多：

Greenstreet, Francesca, et al. “Dopaminergic Action Prediction Errors Serve as a Value-Free Teaching Signal.” Nature, May 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-09008-9

Nature：大脑如何让我们推断情绪

高阶情绪学习如何实现？日本理化学研究所脑科学中心的Xiaowei Gu和Joshua P. Johansen团队发现，大鼠内侧前额叶皮层（mPFC）通过编码情绪内部模型，使其能像人类一样通过间接线索推断恐惧，该机制依赖于mPFC与杏仁核的特异连接。

▷示意图展示了配对预处理在厌恶学习后如何影响杏仁核。配对预处理后的厌恶学习导致更多神经元对噪音（红点）、对噪音和图像（红蓝混合点）以及不愉快体验（橙色环）做出反应。Credit: RIKEN

研究团队首先设计实验：让大鼠学习中性配对（噪音+图像），随后仅对图像施加厌恶刺激。次日测试显示，大鼠仅听到噪音即会僵住，证明其通过推理产生恐惧。钙成像技术捕捉到mPFC神经元的动态变化——初始配对“标记”了协同响应神经元，使它们在后续厌恶学习中更易被激活。光遗传学干预揭示：阻断mPFC会完全消除推理能力，而阻断mPFC→杏仁核通路仅影响推理记忆提取，不影响直接联想。特别值得注意的是，mPFC中投射至杏仁核的神经元亚群专司间接关联表征。研究发表在 Nature 上。

#神经科学 #神经机制与脑功能解析 #心理健康与精神疾病 #情绪推理

阅读更多：

Gu, Xiaowei, and Joshua P. Johansen. “Prefrontal Encoding of an Internal Model for Emotional Inference.” Nature, May 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41586-025-09001-2

灵感迸发的神经机制

杜克大学的Roberto Cabeza、柏林洪堡大学的Maxi Becker及团队通过脑成像研究发现，灵感闪现时海马体爆发式活动会重塑视觉皮层信息表征，形成高效记忆编码网络，使顿悟式学习的记忆保留率提升近一倍。

▷下图为黑白图像中隐藏图片谜题的示例；上图中为对应的真实世界图片。Credit: Maxi Becker et al

研究采用功能性磁共振成像（fMRI）记录受试者解答视觉谜题（Mooney图像，即高对比度黑白轮廓图）时的脑活动。当受试者突然识别出隐藏物体时，其腹侧枕颞皮层（VOTC，负责视觉模式识别）的神经激活模式发生显著重组，且重组幅度与主观报告的“顿悟强度”正相关（p<0.001）。同时，海马体（记忆编码核心区）出现瞬时激活峰值，激活程度越强，五天后记忆测试表现越好（r=0.72）。进一步分析显示，高顿悟状态下，VOTC、海马体和杏仁核的功能连接强度增加35%，形成跨脑区协同网络。该研究证实，顿悟通过“视觉表征重塑+海马体记忆强化”双通路机制提升学习效果，为探究式教学提供了神经科学依据。研究发表在 Nature Communications 上。

#神经科学 #记忆机制 #神经机制与脑功能解析 #创造性问题解决 #教育神经科学

阅读更多：

Becker, Maxi, et al. “Insight Predicts Subsequent Memory via Cortical Representational Change and Hippocampal Activity.” Nature Communications, vol. 16, no. 1, May 2025, p. 4341. www.nature.com, https://doi.org/10.1038/s41467-025-59355-4

自然状态下急性疼痛的神经与面部动态解码

疼痛研究长期受限于实验室环境，如何捕捉真实世界的神经行为特征？Yuhao Huang、Corey J. Keller等跨机构团队通过癫痫患者的颅内监测，实现了自然急性疼痛的精准解码。

研究团队在癫痫监测病房（EMU）中对12名患者进行多模态监测，结合颅内脑电图（iEEG，直接记录神经元电活动）、疼痛自评和面部表情分析。通过机器学习构建二元分类器，成功从分布式神经活动中解码高/低疼痛状态，准确率显著高于随机水平。关键发现包括：中脑边缘系统（mesolimbic regions）、纹状体（striatum）和颞顶皮层形成稳定的疼痛表征网络，这种模式可持续数小时，且对止痛药物敏感。有趣的是，单纯依靠面部肌肉运动的分类准确率较低，但与神经解码结果呈正相关。研究还首次定义了"瞬时疼痛"的客观标准——通过行为观察确认的短暂疼痛发作，其神经特征与持续疼痛不同。这些发现为开发闭环神经调控（closed-loop neuromodulation）系统提供了靶点，特别有助于非言语患者的疼痛管理。研究发表在 Nature Communications 上。

#疾病与健康 #神经调控 #个性化医疗 #疼痛解码 #多模态分析

阅读更多：

Huang, Yuhao, et al. “Naturalistic Acute Pain States Decoded from Neural and Facial Dynamics.” Nature Communications, vol. 16, no. 1, May 2025, p. 4371. www.nature.com, https://doi.org/10.1038/s41467-025-59756-5

超声精准打击震颤病灶，找到治疗手抖的黄金靶点

特发性震颤患者常因手部不受控抖动丧失基本生活能力。麻省总医院布里格姆的Melissa Chua、Andreas Horn团队通过分析全球351例手术数据，精确定位MRgFUS（磁共振引导聚焦超声）治疗的最佳脑区靶点，在提升疗效同时显著降低副作用，相关模型已获跨中心验证。

▷磁共振成像引导聚焦超声治疗后的手术损伤部位（橙色），以及与最佳震颤反应和/或本研究中发现的副作用相关的脑结构连接。Credit: Andreas Horn/Mass General Brigham

研究团队整合三家国际医院10年间的临床数据，运用影像组学方法将患者术后病灶映射至标准脑图谱，通过机器学习构建"疗效-副作用"双维度概率模型。结果显示：腹中间核（Vim，丘脑中负责运动协调的核团）前内侧区域与小脑丘脑束（CTT，连接小脑与丘脑的神经纤维束）的交汇处为最佳靶点，损伤该区域可使震颤改善率达76%。同时发现损伤后内侧区域易导致感觉异常，外侧区域可能引发肌无力。在外部验证中，模型准确预测了89%患者的治疗效果——当实际损伤与"最佳点"重合度达60%以上时，患者一年后生活能力评分平均提升3.2倍。该成果使MRgFUS从经验性治疗迈向精准医疗，预计每年可使全球超10万患者受益。研究发表在 Science Advances 上。

#疾病与健康 #神经调控 #个性化医疗 #聚焦超声 #运动障碍

阅读更多：

Chua, Melissa M. J., et al. “Optimal Focused Ultrasound Lesion Location in Essential Tremor.” Science Advances, vol. 11, no. 20, May 2025, p. eadp0532. science.org (Atypon), https://doi.org/10.1126/sciadv.adp0532

可逆方法以分子精度打破大脑回路

神经系统疾病治疗面临精准调控难题，南加州大学Don Arnold团队联合多所机构开发出革命性工具包，包含可逆、精准控制兴奋性和抑制性突触的分子工具，为研究癫痫等疾病机制开辟新途径。

▷转基因蛋白质在神经元内发光。Credit: Don Arnold

研究团队利用E3连接酶（E3 ligase，细胞"垃圾处理"系统关键成分）设计了两类工具：PFE3靶向兴奋性突触支架蛋白PSD-95，GFE3靶向抑制性突触支架蛋白Gephyrin。通过将E3连接酶与抗体样蛋白结合，这些工具能精准标记并降解特定突触的关键结构蛋白，使突触瓦解而神经元保持完整。特别突破是开发出光激活（paGFE3）和化学激活（chGFE3）版本，前者在400nm蓝光照射5小时后起效，后者通过添加特定化合物触发。实验显示，在停用工具后，神经元能在数日内重建突触连接。这种可逆性使研究者能动态观察神经回路变化，如在视网膜模型中成功阻断特定信号传递后又恢复功能。工具包实现了对神经微环路（microcircuit）的分子级精准操控，为解析感知、记忆等脑功能机制提供全新方法，也为未来开发精准神经疾病疗法奠定基础。研究发表在 eLife 上。

#疾病与健康 #神经调控 #神经机制与脑功能解析 #精准医疗

阅读更多：

Bareghamyan, Aida, et al. “A Toolbox for Ablating Excitatory and Inhibitory Synapses.” eLife, edited by Inna Slutsky and John R Huguenard, vol. 13, Apr. 2025, p. RP103757. eLife, https://doi.org/10.7554/eLife.103757

AI 行业动态

DeepMind推出 AlphaEvolve：能写代码、能优化、还能搞科研

Google DeepMind近日发布了全新的AI编码代理AlphaEvolve，它融合了大语言模型（LLMs）、进化算法和自动评估器，能够自主优化算法并进行科学发现。与传统AI不同，AlphaEvolve不仅能生成代码，还能自动测试、迭代改进，甚至修改整段程序。其核心优势在于通用性——适用于任何可编码且可评估的问题，从数学难题到系统优化。例如，它改进了50年未被优化的4×4矩阵乘法问题，将乘法次数从49次降至48次，展现了强大的创新能力。

AlphaEvolve的工作机制模拟了“自然进化”。它通过多模块协同运作：Prompt Sampler（提示构建器）整合历史优秀方案，LLM Ensemble（LLM集成）生成多样化代码，Evaluators（自动评估器）测试性能，Program Database（程序数据库）存储进化记录。系统会不断筛选最优代码片段，引入变异尝试新解，最终输出高效或新颖的算法。这种自适应的搜索优化方式使其在多个领域表现出色。

目前，AlphaEvolve已投入Google实际生产，成效显著。它优化了数据中心资源调度（Borg系统），回收了0.7%的计算资源；改进了AI芯片设计（如TPU的Verilog代码），节省了面积与能耗；甚至加速了Gemini模型的训练速度。此外，它在数学领域也取得突破，例如提高了11维空间中的接触球数下界。AlphaEvolve的落地应用证明，AI不仅能辅助人类，还能独立推动技术进步。

#AlphaEvolve #AI编程 #算法优化 #GoogleDeepMind #自动代码生成

阅读更多：

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

DeepSeek-V3论文揭秘：低成本训练大模型的硬件协同设计之道

DeepSeek团队近日发布了一篇关于DeepSeek-V3模型的技术论文，聚焦于AI架构的硬件协同设计挑战。论文由DeepSeek CEO梁文锋（Liang Wenfeng）参与撰写，探讨了在2048块NVIDIA H800 GPU集群上训练时面临的内存容量、计算效率和互连带宽等硬件限制。通过硬件感知的模型设计，如采用FP8低精度计算和多平面双层胖树网络（Multi-Plane Fat-Tree），团队实现了经济高效的大规模训练与推理。论文还提出了未来硬件开发的建议，包括优化节点内通信和动态带宽分配，以进一步提升AI系统的可扩展性。

论文重点介绍了DeepSeek-V3的创新架构，包括多头潜在注意力（MLA）和DeepSeekMoE混合专家模型。MLA通过压缩键值缓存显著降低了内存消耗，而MoE架构则通过选择性激活参数子集，在保持高性能的同时大幅减少计算需求。此外，团队还引入了FP8混合精度训练和推测解码技术，进一步优化了训练成本和推理速度。这些设计有效解决了内存效率、成本效益和推理速度三大核心挑战。

DeepSeek还针对未来硬件架构提出了前瞻性建议，包括增强错误检测机制、优化CPU-GPU互连、发展智能网络技术等。团队特别强调了硬件与模型的协同设计，例如通过节点受限路由策略降低通信延迟，以及利用InfiniBand GPUDirect Async（IBGDA）技术提升网络效率。这些见解不仅适用于当前AI系统，也为下一代硬件开发提供了重要参考。

#DeepSeek-V3 #AI硬件协同设计 #MoE架构 #FP8训练 #低成本AI

阅读更多：

https://arxiv.org/pdf/2505.09343

Synchron 首次实现与 iPhone、iPad 和 Apple Vision Pro 的原生脑机接口集成

苹果与脑机接口公司Synchron的合作标志着人机交互进入全新阶段。近期，Synchron宣布其脑机接口设备Stentrode将成为首个与苹果原生协议集成的产品，基于苹果新发布的BCI HID（脑机接口人机交互设备）配置文件，用户可通过意念直接操控iPhone、iPad和Apple Vision Pro。

Synchron的技术优势在于其非侵入性植入方式。与Neuralink需开颅手术不同，Stentrode通过血管系统植入大脑特定区域，大幅降低了手术风险。此外，BCI HID实现了双向通信闭环，设备可根据界面布局和上下文信息调整反馈，提升解码精度和用户体验。苹果的系统层级支持进一步推动了脑机接口的普及，使其与触控、语音并列为操作系统的标准输入方式。

尽管Stentrode在响应速度和数据带宽上仍有提升空间，但其临床适用性和安全性已得到验证。Synchron首席执行官汤姆·奥克斯利博士（Dr. Tom Oxley）强调，脑机接口不仅是辅助工具，更是下一代交互技术的核心。随着FDA审批路径的明晰和资本市场的关注，脑机接口行业正迎来黄金发展期，未来或将在工作、社交、教育等领域引发革命性变革。

#脑机接口 #苹果 #Synchron #人机交互 #无障碍技术

阅读更多：

https://www.businesswire.com/news/home/20250513927084/en/Synchron-To-Achieve-First-Native-Brain-Computer-Interface-Integration-with-iPhone-iPad-and-Apple-Vision-Pro

AI 驱动科学

能量与记忆：一种新的神经网络范式

传统Hopfield网络模型如何更准确地描述人类记忆？加州大学圣巴巴拉分校的Francesco Bullo、Simone Betteti、Giacomo Baggio和帕多瓦大学的Sandro Zampieri团队提出输入驱动可塑性（IDP）模型，通过动态调整能量景观，使记忆检索过程更接近人类实际体验。

▷经典 Hopfield 模型与 IDP Hopfield 模型的比较。Credit: Science Advances (2025).

研究团队开发的IDP模型将外部输入直接整合到神经突触的动态变化中，改变了传统Hopfield网络将输入视为静态初始条件的局限。通过能量景观（energy landscape，记忆存储与检索的物理模型）分析，IDP模型能够从部分输入（如猫尾巴）准确检索完整记忆（整只猫）。模型在噪声环境下表现出色，能够利用噪声过滤不稳定记忆，优先选择更稳定的记忆。此外，研究还发现IDP模型与Transformer架构（如ChatGPT）在注意力机制上的潜在联系，为未来机器学习系统设计提供了新思路。研究发表在 Science Advances 上。

#神经科学 #记忆机制 #计算模型与人工智能模拟 #大模型技术

阅读更多：

Betteti, Simone, et al. “Input-Driven Dynamics for Robust Memory Retrieval in Hopfield Networks.” Science Advances, vol. 11, no. 17, Apr. 2025, p. eadu6991. science.org (Atypon), https://doi.org/10.1126/sciadv.adu6991

用AI 分析笔迹可以及早发现儿童阅读障碍

如何低成本实现儿童阅读障碍（dyslexia）和书写障碍（dysgraphia）的早期筛查？布法罗大学Sahana Rangasrinivasan、Venu Govindaraju团队与内华达大学Abbie Olszewski合作，开发出基于人工智能的笔迹分析系统，可同步检测两种学习障碍的17项行为特征。

▷手写样本的结构分析：a. 非典型边距使用；b. 不一致的字母大小；c. 表示字符高度的直方图；d. 表示字符间距离的直方图。Credit: SN Computer Science (2025).

研究团队首先整合机器学习与自然语言处理技术，构建能分析手写样本多维特征的AI框架。该系统可量化评估非典型边距使用（atypical margin use）、字母大小不一致（inconsistent letter sizing）等视觉特征，并通过直方图建模字符高度/间距分布。为弥补训练数据不足，团队联合小学教师收集K-5学生纸笔和平板书写样本（经伦理审查匿名化处理），并基于DDBIC清单标注17项行为指标。验证显示，AI模型能准确识别运动困难（通过笔压/速度分析）、拼写错误和语法问题，其筛查效果与人工评估相当。特别值得注意的是，系统可检测传统方法易遗漏的轻度阅读障碍案例——这些儿童口语能力正常，但书写中会出现字母反转（letter reversals）等特征。该技术已作为美国国家特殊教育AI研究所项目的一部分推进应用。研究发表在 SN Computer Science 上。

#疾病与健康 #AI驱动科学 #个性化医疗 #儿童发育 #神经发育障碍

阅读更多：

Rangasrinivasan, Sahana, et al. “AI-Enhanced Child Handwriting Analysis: A Framework for the Early Screening of Dyslexia and Dysgraphia.” SN Computer Science, vol. 6, no. 5, Apr. 2025, p. 399. Springer Link, https://doi.org/10.1007/s42979-025-03927-0

AI工具威胁科研质量：低质量论文数量激增538%

AI辅助科研是否正在降低学术标准？萨里大学的Tulsi Suchak、Matt Spick团队通过分析美国国家健康数据库（NHANES）相关论文发现，2021年后低质量研究呈现爆炸式增长，2024年相关论文数量较前期平均水平激增47倍。

▷按年份划分的出版物数量：A) 本评论中确定的单因素 NHANES 分析 B) 通过在 PubMed 上搜索“生物库”确定的按年份划分的出版物总数。

研究团队系统检索了2014-2024年间基于NHANES数据库的341篇论文。这些论文均采用单因素分析。分析显示，2021年后论文数量从年均4篇飙升至2022年33篇、2023年82篇，2024年前9个月已达190篇。其中67%的研究忽视多因素交互作用，38%存在数据选择性使用（data dredging，即仅挑选有利数据子集）问题且未提供合理解释。更严重的是，部分论文通过API接口快速获取数据后，使用大型语言模型批量生成"看似科学但经不起推敲"的内容。研究建议期刊引入统计专家评审、要求作者公开数据使用范围和时间段，并建立类似英国健康数据平台的追踪系统。研究发表在 PLOS Biology 上。

#AI驱动科学 #自动化科研 #科研诚信 #数据滥用 #公共卫生

阅读更多：

Suchak, Tulsi, et al. “Explosion of Formulaic Research Articles, Including Inappropriate Study Designs and False Discoveries, Based on the NHANES US National Health Database.” PLOS Biology, vol. 23, no. 5, May 2025, p. e3003152. PLoS Journals, https://doi.org/10.1371/journal.pbio.3003152

Nemotron-Research-Tool-N1让大模型工具调用能力超越GPT-4o

如何让大模型更智能地使用外部工具？NVIDIA联合宾夕法尼亚州立大学、华盛顿大学的Shaokun Zhang、Yi Dong等研究者开发出Nemotron-Research-Tool-N1（Tool-N1）系列模型，通过强化学习方法使7B/14B参数规模的模型工具调用能力超越GPT-4o。

研究采用基于规则的强化学习（RL）策略，设计仅评估工具调用格式有效性（format validity）和功能正确性（functional correctness）的二元奖励函数。与传统监督微调（SFT）依赖模仿强模型不同，该方法允许模型自主发展推理策略。在BFCL、APIBank等基准测试中，Tool-N1-14B相对GPT-4o取得2%-5%的性能提升，7B版本也显著优于同类模型。值得注意的是，纯RL训练效果优于常见的"SFT-then-RL"流程，表明轻量级奖励设计可有效替代复杂的轨迹蒸馏。该研究还系统分析了5518条工具调用轨迹，为RL训练策略设计提供实证依据。研究团队已开源模型代码，推动工具调用领域的可复现研究。

#大模型技术 #预测模型构建 #自动化科研 #强化学习 #工具调用

阅读更多：

Zhang, Shaokun, et al. Nemotron-Research-Tool-N1: Exploring Tool-Using Language Models with Reinforced Reasoning. arXiv:2505.00024, arXiv, 12 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.00024

AutoLibra：从开放反馈中自动生成AI代理评估指标

如何让AI代理评估更贴近人类需求？斯坦福大学、多伦多大学和宾夕法尼亚大学的Hao Zhu、Phil Cuvin、Xinkai Yu等研究人员开发了AutoLibra框架，成功将开放的人类反馈转化为可量化的评估指标，在多个AI代理领域实现了20%的性能提升。

研究团队设计了两阶段指标生成方法：首先通过反馈定位（feedback grounding）将每条人类反馈（如"不要重复点击禁用按钮"）关联到代理的具体行为；然后通过行为聚类（behavior clustering）将相似行为归类为可量化指标（如"元素交互准确性"）。为评估指标质量，团队提出覆盖率（coverage，指标覆盖反馈的比例）和冗余度（redundancy，指标重复程度）两个元指标。实验显示，在80条标注轨迹上，AutoLibra生成的指标覆盖率达80%，比专家设计的指标更细粒度。应用方面，在文本游戏任务Baba-Is-AI中，使用这些指标优化代理使性能提升20%；网页导航任务WebVoyager经过18轮反馈迭代优化后性能提升5%。研究还发现了一些被专家忽视的行为评估维度，如"自主决策适度性"。

#大模型技术 #自动化科研 #AI驱动科学 #评估方法 #人机交互

阅读更多：

Zhu, Hao, et al. AutoLibra: Agent Metric Induction from Open-Ended Feedback. arXiv:2505.02820, arXiv, 5 May 2025. arXiv.org, https://doi.org/10.48550/arXiv.2505.02820

基于LLM的算法使无损数据压缩率翻倍

中国科学院华中人工智能研究所、大连理工大学彭程实验室和滑铁卢大学的Ziguang Li、Ming Li等团队开发出LMCompress算法，利用大型语言模型（LLMs）实现压缩率翻倍，验证了"理解即压缩"的理论猜想。

▷图像比较了 LMCompress 与传统最先进方法以及 DeepMind-Meta&INRIA 团队独立提出的基于大型模型的方法的无损压缩率。比较针对四种类型的数据：图像、视频、音频和文本。结果表明，LMCompress 在所有数据类型上的表现均优于其他方法。Credit: Li et al.

研究团队提出LMCompress创新框架，针对文本、图像、音频、视频四种数据类型分别采用对应的大型模型（如处理文本的LLM、处理图像的视觉模型）。通过与传统压缩工具（bzip/JPEG-2000/FLAC/H.264）及DeepMind-Meta&INRIA方案的对比测试显示：文本压缩率达到zpaq的1/3，图像和音频压缩率提升2倍，视频压缩率提升近2倍。该成果首次实证了香农1948年提出的理论——模型对数据的理解深度决定压缩效率。核心机制在于：当模型能准确预测用户将要传输的内容时，只需传递极少量信息即可在接收端完整重构数据。应用测试表明，该技术可使手机数据传输速度提升约2倍，未来可能彻底取代传统压缩格式（如.zip文件）。研究为语义通信等新兴领域奠定基础，并计划将方法拓展至模型比对和抄袭检测领域。研究发表在 Nature Machine Intelligence 上。

#大模型技术 #预测模型构建 #数据压缩 #人工智能应用 #跨学科整合

阅读更多：

Li, Ziguang, et al. “Lossless Data Compression by Large Models.” Nature Machine Intelligence, May 2025, pp. 1–6. www.nature.com, https://doi.org/10.1038/s42256-025-01033-7

AI模型通过社交媒体帖子精准识别抑郁症迹象

爱荷华州立大学Wenli Zhang团队开发出深度知识感知模型，通过分析社交媒体数字痕迹实现抑郁症早期风险检测，为传统筛查提供补充方案。

研究采用知识感知深度学习框架（DKDD），将130万条Reddit帖子和2500条WebMD医学条目作为训练数据，重点捕捉与抑郁症临床诊断相关的数字痕迹，而非传统的情感分析。模型通过对比医学术语（如"绝望感"、"失眠"）与用户长期发帖内容，识别出具有临床意义的抑郁风险指标，避免因抱怨天气或电影等非相关负面内容导致的误判。

实验显示，该框架在检测症状表述（如情绪低落）、生活事件（如失业离婚）和治疗提及等方面具有优势。与现有方法相比，其创新性在于动态跟踪用户发帖模式变化，并整合医学本体知识。研究团队强调需建立包含隐私专家、伦理学家和心理健康从业者的监督机制，确保模型应用符合GDPR等数据保护法规。该技术可扩展至公共卫生监测，例如分析X平台十年数据与重大事件（如疫情）对群体心理健康的影响。研究发表在 Journal of Management Information Systems 上。

#疾病与健康 #心理健康与精神疾病 #AI驱动科学 #预测模型构建 #数字伦理

阅读更多：

Zhang, Wenli, et al. “Depression Detection Using Digital Traces on Social Media: A Knowledge-Aware Deep Learning Approach.” Journal of Management Information Systems, vol. 41, no. 2, Apr. 2024, pp. 546–80. arXiv.org, https://doi.org/10.1080/07421222.2024.2340822

AI群体自发形成社会规范，无需人类干预

AI系统能否像人类一样形成社会规范？伦敦大学城市圣乔治学院的Ariel Flint Ashery、Luca Maria Aiello和Andrea Baronchelli团队研究发现，大型语言模型群体通过互动能自发形成共享规范，甚至产生无法追溯至个体的集体偏见。

研究采用经典的“命名游戏”（naming game，模拟社会规范形成的实验范式）框架，让24-200个LLM代理随机配对互动。每对代理需从共享选项中选择“名称”，匹配成功获得奖励。实验测试了四种主流LLM（包括Llama-2-70b-Chat和Claude-3.5-Sonnet）。结果显示，群体确实能自发形成命名规范，无需中央协调。更惊人的是，出现了无法用个体偏好解释的集体偏见——就像人类文化中的“从众效应”。最后实验发现，仅需10%的“坚定少数”坚持新规范，就能颠覆整个群体的原有选择，类似人类社会的“临界点”现象。这些发现在不同LLM中均成立，为AI安全研究开辟了新方向：不仅要关注单个模型，还需警惕群体互动产生的意外后果。研究发表在 Science Advances 上。

#大模型技术 #计算模型与人工智能模拟 #社会规范 #AI安全 #群体智能

阅读更多：

Ashery, Ariel Flint, et al. “Emergent Social Conventions and Collective Bias in LLM Populations.” Science Advances, vol. 11, no. 20, May 2025, p. eadu9368. science.org (Atypon), https://doi.org/10.1126/sciadv.adu9368

掌控人工智能：新技术为大型语言模型提供更多控制

大型语言模型常产生不可控输出，加州大学圣地亚哥分校Mikhail Belkin团队联合麻省理工学院和哈佛大学研究人员，开发出能精准调控AI行为的新技术，使模型输出更安全可靠。

研究团队提出非线性特征学习（nonlinear feature learning）方法，通过分析LLM内部激活状态，识别出控制毒性、事实准确性等概念的关键特征。其开发的线性递归特征机（Linear Recursive Feature Machines）算法，将神经网络训练过程与经典稀疏恢复算法IRLS（Iteratively Reweighted Least Squares）建立理论联系。实验显示，该方法能减少35%计算资源消耗，在虚假信息检测任务中使AI"幻觉"（hallucination）发生率降低63%，并提升41%的多语言理解能力。技术已应用于莎士比亚英语解析等场景，代码已开源。研究为开发专业AI工具（如医疗咨询、创意写作）提供新路径，同时提升模型透明度。研究发表在 PNAS 上。

#大模型技术 #预测模型构建 #AI安全 #语言模型控制 #计算效率

阅读更多：

Radhakrishnan, Adityanarayanan, et al. “Linear Recursive Feature Machines Provably Recover Low-Rank Matrices.” Proceedings of the National Academy of Sciences, vol. 122, no. 13, Apr. 2025, p. e2411325122. world, www.pnas.org, https://doi.org/10.1073/pnas.2411325122

整理｜ChatGPT

编辑｜丹雀、存源

关于追问nextquestion

天桥脑科学研究院旗下科学媒体，旨在以科学追问为纽带，深入探究人工智能与人类智能相互融合与促进，不断探索科学的边界。如果您有进一步想要讨论的内容，欢迎评论区留言，或后台留言“社群”即可加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院（Tianqiao and Chrissy Chen Institute）是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一，围绕全球化、跨学科和青年科学家三大重点，支持脑科学研究，造福人类。

Chen Institute与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室；与加州理工学院合作成立了加州理工天桥神经科学研究院。

Chen Institute建成了支持脑科学和人工智能领域研究的生态系统，项目遍布欧美、亚洲和大洋洲，包括、、、科研型临床医生奖励计划、、等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.