网易首页 > 网易号 > 正文 申请入驻

前沿分享丨大模型长脑子了?研究发现LLM中层会自发模拟人脑进化

0
分享至

转自 机器之心

生物智能与人工智能的演化路径截然不同,但它们是否遵循某些共同的计算原理?

最近,来自帝国理工学院、华为诺亚方舟实验室等机构的研究人员发表了一篇新论文。该研究指出,大型语言模型(LLM)在学习过程中会自发演化出一种核心(Synergistic Core)结构,有些类似于生物的大脑。


  • 论文标题:A Brain-like Synergistic Core in LLMs Drives Behaviour and Learning

  • 论文地址:https://arxiv.org/abs/2601.06851


研究团队利用部分信息分解(Partial Information Decomposition, PID)框架,对 Gemma、Llama、Qwen 和 DeepSeek 等模型进行了深度剖析。

他们发现,这些模型的中层表现出极强的协同处理能力,而底层和顶层则更偏向于冗余处理。

协同与冗余:LLM 的内部架构

研究团队将大型语言模型视为分布式信息处理系统,其核心实验设计旨在量化模型内部组件之间交互的本质。为了实现这一目标,研究者选取了 Gemma 3、Llama 3、Qwen 3 8B 以及 DeepSeek V2 Lite Chat 等多种具有代表性的模型系列进行对比分析。

实验方法与量化指标

在实验过程中,研究者向模型输入了涵盖语法纠错、逻辑推理、常识问答等 6 个类别的认知任务提示词。

针对每一个提示词,模型会生成一段 100 个 Token 的回答,实验设备则同步记录下每一层中所有注意力头或专家模块的激活值。

具体而言,研究人员计算了这些输出向量的 L2 范数,以此作为该单元在特定时间步的激活强度数据。

基于这些时间序列数据,研究团队应用了整合信息分解(Integrated Information Decomposition, ID)框架。

这一框架能够将注意力头对之间的交互分解为「持续性协同」和「持续性冗余」等不同原子项。

通过对所有注意力头对的协同值和冗余值进行排名并求差,研究者得到了一个关键指标:协同-冗余秩(Synergy-Redundancy Rank)。该指标能够清晰地标示出模型组件在处理信息时,究竟是倾向于进行独立的信号聚合,还是在进行跨单元的深度集成。

跨模型的空间分布规律

实验数据揭示了一个在不同架构模型中高度一致的空间组织规律。在归一化后的模型层深图中,协同分布呈现出显著的「倒 U 型」曲线 :


  • 冗余外周(Redundant Periphery):模型的早期层(靠近输入端)和末期层(靠近输出端)表现出极低的协同秩,信息处理以冗余模式为主。在早期层,这反映了模型在进行基本的解词元化(Detokenization)和局部特征提取;而在末期层,则对应着 Token 预测和输出格式化的过程。

  • 协同核心(Synergistic Core):模型的中层则展现出极高的协同秩,形成了核心处理区。例如,在对 Gemma 3 4B 的热图分析中,中间层的注意力头之间表现出密集且强烈的协同交互,这正是模型进行高级语义集成和抽象推理的区域。

架构差异与一致性

值得注意的是,这种「协同核心」的涌现并不依赖于特定的技术实现。

在 DeepSeek V2 Lite 模型中,研究者即使是以「专家模块」而非「注意力头」作为分析单位,依然观察到了相同的空间分布特征。

这种跨架构的收敛性表明,协同处理可能是实现高级智能的一种计算必然,而非单纯的工程巧合。

这种组织模式与人脑的生理结构形成了精确的映射:人脑的感官和运动区域同样表现出高冗余性,而负责复杂认知功能的联合皮层则处于高协同的「全局工作空间」中心。

智能的涌现:学习驱动而非架构使然

一个关键的问题在于:这种结构是 Transformer 架构自带的,还是通过学习习得的?

研究人员通过分析 Pythia 1B 模型的训练过程发现,在随机初始化的网络中,这种「倒 U 型」的协同分布并不存在。随着训练步数的增加,这种组织架构才逐渐稳定形成。


这意味着,协同核心是大模型获得能力的标志性产物

在拓扑性质上,协同核心具有极高的「全局效率」,有利于信息的快速集成;而冗余外周则表现出更强的「模块化」,适用于专门化处理。这种特征再次与人类大脑的网络架构形成了精确的平行关系。

协同核心的功能验证

为了验证协同核心是否真的驱动了模型行为,研究团队进行了两类干预实验:消融实验和微调实验。

消融实验:研究发现,消融那些高协同性的节点,会导致模型出现灾难性的性能下降和行为背离,其影响远超随机消融或消融冗余节点。这证明协同核心是模型智能的核心驱动力。


微调实验:在强化学习微调(RL FT)场景下,仅针对协同核心进行训练,获得的性能提升显著优于针对冗余核心或随机子集的训练。有趣的是,在监督微调(SFT)中这种差异并不明显。研究者认为,这反映了 RL 促进通用化而 SFT 更多倾向于记忆的特性。


结语

这项研究为大模型的可解释性开辟了新路径。它表明,我们可以从「自上而下」的信息论视角来理解模型,而不仅仅是「自下而上」地寻找特定的电路。

对于 AI 领域,识别协同核心有助于设计更高效的压缩算法,或者通过更有针对性的参数更新来加速训练。对于神经科学,这提供了一种计算上的验证,预示着协同回路在强化学习和知识迁移中可能扮演着至关重要的角色。

大模型虽然基于硅基芯片和反向传播算法,但在追求智能的过程中,它们似乎不约而同地走向了与生物大脑相似的组织模式。这种智能演化的趋同性,或许正是我们揭开通用智能奥秘的关键线索。

更多详情请参阅原论文。

【免责声明】转载出于非商业性的教育和科研目的,只为学术新闻信息的传播,版权归原作者所有,如有侵权请立即与我们联系,我们将及时删除。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
WTT多哈球星赛:混双4强诞生!国乒1胜2负,“独苗”爆冷头号种子

WTT多哈球星赛:混双4强诞生!国乒1胜2负,“独苗”爆冷头号种子

全言作品
2026-01-16 21:04:56
翻车现场!TVB上位小花颁奖礼再失言坦认失礼:越看越尴尬

翻车现场!TVB上位小花颁奖礼再失言坦认失礼:越看越尴尬

一盅情怀
2026-01-15 18:28:31
医生忠告:70岁以上老人,宁吃热乎馒头喝稀粥,也别碰5类食物

医生忠告:70岁以上老人,宁吃热乎馒头喝稀粥,也别碰5类食物

医学原创故事会
2026-01-15 22:34:16
章莹颖只是冰山一角:在暗网购物车里,人不是人,可能是“零件”

章莹颖只是冰山一角:在暗网购物车里,人不是人,可能是“零件”

普览
2026-01-10 20:44:27
女儿演《怪奇物语》红翻天!伊森霍克自嘲在家地位降级:没人在乎爸爸

女儿演《怪奇物语》红翻天!伊森霍克自嘲在家地位降级:没人在乎爸爸

ETtoday星光云
2026-01-12 18:18:03
“这也配叫前程似锦?”家长炫耀女儿上岸研究生,被评论区打脸

“这也配叫前程似锦?”家长炫耀女儿上岸研究生,被评论区打脸

夜深爱杂谈
2025-12-14 17:12:53
1949年杜月笙落魄抵香港,李裁法迎接,师徒相聚显江湖末路忠义

1949年杜月笙落魄抵香港,李裁法迎接,师徒相聚显江湖末路忠义

唠叨说历史
2026-01-14 15:08:58
柯洁发文悼念聂卫平!他生前收入有4个来源 恐给子女留下丰厚遗产

柯洁发文悼念聂卫平!他生前收入有4个来源 恐给子女留下丰厚遗产

乡野小珥
2026-01-17 03:37:49
贾国龙,这是要不死不休啊

贾国龙,这是要不死不休啊

亮见
2026-01-16 14:43:38
北京近4战3败!球迷狂刷官媒评论区“现场喊到头晕 多希望你们赢”

北京近4战3败!球迷狂刷官媒评论区“现场喊到头晕 多希望你们赢”

狼叔评论
2026-01-16 23:38:16
伊朗反派公布伊朗未来路线图:放弃核武、承认以色列、靠拢美国

伊朗反派公布伊朗未来路线图:放弃核武、承认以色列、靠拢美国

桂系007
2026-01-15 10:50:58
盘后大利好,证监稳市场信号引燃市场!

盘后大利好,证监稳市场信号引燃市场!

风风顺
2026-01-17 02:00:03
冯德莱恩美梦彻底破灭,欧盟最终还是选择了妥协!

冯德莱恩美梦彻底破灭,欧盟最终还是选择了妥协!

沙雕小琳琳
2026-01-16 01:04:59
克罗斯:巴萨不会赢得任何国际赛事冠军,欧战中对手是顶级的

克罗斯:巴萨不会赢得任何国际赛事冠军,欧战中对手是顶级的

懂球帝
2026-01-16 07:10:06
老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

老用户成“冤大头”?新号29元100G 老号89元不够用 3招破局不换号

Thurman在昆明
2026-01-03 15:59:21
北京84-90负山西,赛后5好1坏,周琦怒喷焦海龙

北京84-90负山西,赛后5好1坏,周琦怒喷焦海龙

冷眼看尽世间繁华
2026-01-16 22:57:05
苍天好轮回!徐帆回应离婚5个月后,冯小刚终于迎来'反噬'

苍天好轮回!徐帆回应离婚5个月后,冯小刚终于迎来'反噬'

浮光惊掠影
2026-01-14 03:53:42
CBA新排名!广厦霸榜,上海山东浙江强势崛起,辽晋有望改变颓势

CBA新排名!广厦霸榜,上海山东浙江强势崛起,辽晋有望改变颓势

细话篮球
2026-01-17 02:21:56
加拿大总理见到中方,当面说出了一句话,旁边官员听到后都惊了

加拿大总理见到中方,当面说出了一句话,旁边官员听到后都惊了

老范谈史
2026-01-16 20:37:25
医生发现:坚持用盐水漱口的人,咽喉可能正在发生这5个积极变化

医生发现:坚持用盐水漱口的人,咽喉可能正在发生这5个积极变化

健康科普365
2026-01-04 09:41:09
2026-01-17 04:56:49
中国人工智能学会
中国人工智能学会
中国人工智能学会网易官方账号
3828文章数 1489关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

教育
亲子
数码
时尚
本地

教育要闻

孩子千万不要早恋

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

数码要闻

熊猫MX34U7 34英寸带鱼屏显示器发布,售价1299元

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

无障碍浏览 进入关怀版