网易首页 > 网易号 > 正文 申请入驻

复杂性科学视角下大语言模型涌现现象的解释丨周四直播·大模型可解释性读书会

0
分享至

导语

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从不同视角梳理大语言模型可解释性的科学方法论。

自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享简介

除了人们熟知的神经标度律,大语言模型还展现出了许多神奇的现象,比如涌现、顿悟等等。涌现是指,当LLM的规模达到某一阈值时,模型突然在某些方面的能力有了显著的提升。这种剧烈的非线性变化看起来是不可预测的。为什么会发生这样的现象?很多学者已经注意到这样的现象,并尝试解释它。

实际上,在复杂系统研究领域,自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享大纲

1.现象描述

2.对涌现的初步解释

3.对涌现的机制解释

  • 知识量子视角

  • 渗流模型视角

  • 多尺度视角与代理模型

核心概念

涌现

渗流相变

互信息

序参量

神经标度律

参考文献

1.「大语言模型」通过系统性评估发现,其涌现能力(如复杂推理)在模型规模突破临界阈值后突然显现,而非线性增长。(核心发现:当参数规模超过10^22时,LLMs在算术/推理等任务上表现出现跃升式进步,证明能力涌现具有规模依赖性)

Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., Yogatama, D., Bosma, M., Zhou, D., Metzler, D., Chi, E. H., Hashimoto, T., Vinyals, O., Liang, P., Dean, J., & Fedus, W. (2022). Emergent Abilities of Large Language Models (arXiv:2206.07682). arXiv.

2.「大语言模型的涌现能力」通过任务指标重构分析提出质疑,认为其可能是评测中的度量选择(如非线性评分)或分词策略带来的统计假象,而非本质能力跃升。

Schaeffer, R., Miranda, B., & Koyejo, S. (2023). Are Emergent Abilities of Large Language Models a Mirage? (arXiv:2304.15004).

3.「Transformer涌现能力」通过渗流理论建模形式语言任务,揭示其能力突变本质是网络连接性在训练中达到临界阈值后产生的相变现象。

Lubana, E. S., Kawaguchi, K., Dick, R. P., & Tanaka, H. (2024). A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language (arXiv:2408.12578).

4.探讨语言模型(LMs)在参数规模和训练数据扩展时,新能力如何涌现(如复杂推理、多步任务等),并尝试提供理论解释。

Arora, S., & Goyal, A. (2023). A Theory for Emergence of Complex Skills in Language Models (arXiv:2307.15936). arXiv. https://doi.org/10.48550/arXiv.2307.15936

5.「神经网络的量化缩放模型」提出信息压缩理论,证明模型性能的幂律缩放源于参数空间对数据分布的逐步量化逼近,且最优量化精度随模型规模对数增长。

Michaud E, Liu Z, Girit U, et al. The quantization model of neural scaling[J]. Advances in Neural Information Processing Systems, 2023, 36: 28699-28722.

6.「语言模型语义涌现量化研究」提出信息熵框架,证明语义理解能力的涌现源于潜在表征空间的层级化重组,其临界阈值与模型深度呈指数关系。

Chen, H., Yang, X., Zhu, J., & Wang, W. (2024). Quantifying Semantic Emergence in Language Models (arXiv:2405.12617). arXiv.

7.「大语言模型的生物学隐喻研究」提出神经可塑性启发的训练框架,证明Transformer注意力机制与生物神经网络突触修剪存在动力学相似性,其层级化信息整合遵循能量最小化原则。

Lindsey, et al., "On the Biology of a Large Language Model", Transformer Circuits, 2025.

主讲人介绍

杨明哲,北京师范大学系统科学学院硕士生,在张江老师因果涌现研究小组。研究领域是因果涌现、复杂系统自动建模。

参与时间

2025年7月3日(周四)晚上19:30-21:30


报名加入社群交流

https://pattern.swarma.org/study_group_issue/935?from=wechat

扫码参与,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同探索大模型可解释性这一前沿领域的发展。

大模型可解释性读书会

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从以下四个视角梳理大语言模型可解释性的科学方法论:

自下而上:Transformer circuit 为什么有效?

自上而下:神经网络的精细决策逻辑和性能根因是否可以被严谨、清晰地解释清楚?

复杂科学:渗流相变、涌现、自组织等复杂科学理论如何理解大模型的推理与学习能力?

系统工程:如何拥抱不确定性,在具体的业界实践中创造价值?

五位发起人老师会带领大家研读领域前沿论文,现诚邀对此话题感兴趣的朋友,一起共创、共建、共享「大模型可解释性」主题社区,通过互相的交流与碰撞,促进我们更深入的理解以上问题。无论您是致力于突破AI可解释性理论瓶颈的研究者,探索复杂系统与智能本质的交叉学科探索者,还是追求模型安全可信的工程实践者,诚邀您共同参与这场揭开大模型“黑箱”的思想盛宴。

读书会计划于2025年6月19日启动,每周四晚19:30-21:30,预计持续分享10周左右。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月金股出炉!这些翻倍股已被提前锁定

5月金股出炉!这些翻倍股已被提前锁定

新浪财经
2026-04-30 21:28:34
印尼获赠航母!将成亚洲第五个拥有航母的国家

印尼获赠航母!将成亚洲第五个拥有航母的国家

看看新闻Knews
2026-04-30 17:00:10
连爆十几条热搜!孙杨这次,被他妈害惨了……

连爆十几条热搜!孙杨这次,被他妈害惨了……

桌子的生活观
2026-04-30 12:19:46
全红婵爸爸为啥要一次性买500吨糖?原因曝光,全网都为他点赞!

全红婵爸爸为啥要一次性买500吨糖?原因曝光,全网都为他点赞!

社会日日鲜
2026-04-30 06:21:54
致敬帕勒莫!维尼修斯6分钟内罚丢3个点球,球迷看傻眼了

致敬帕勒莫!维尼修斯6分钟内罚丢3个点球,球迷看傻眼了

仰卧撑FTUer
2026-04-30 21:41:06
中国和美国谈妥了

中国和美国谈妥了

阿振观点
2026-05-01 00:26:28
伊朗最高领袖,“最详细伤情”披露

伊朗最高领袖,“最详细伤情”披露

中国新闻周刊
2026-04-30 16:23:05
1季度四大直辖市经济分野,京沪双驾齐驱,天津有定力,重庆掉队

1季度四大直辖市经济分野,京沪双驾齐驱,天津有定力,重庆掉队

金卡读城
2026-04-30 17:32:25
乌克兰开始反攻俄罗斯

乌克兰开始反攻俄罗斯

凤眼论
2026-04-30 15:19:22
黑山外教顶替杜锋带队打G2,能否力挽狂澜?

黑山外教顶替杜锋带队打G2,能否力挽狂澜?

多特体育说
2026-04-30 22:53:36
铁路员工抽烟后续:12306一锤定音,当事人道歉,舆论反扑举报者

铁路员工抽烟后续:12306一锤定音,当事人道歉,舆论反扑举报者

阅微札记
2026-04-30 19:31:48
浙江男子花860万买了套排屋,收房时傻眼,院子里有一个“凸起”,业主:跟老家的厕所一样,开发商:不利因素已公示

浙江男子花860万买了套排屋,收房时傻眼,院子里有一个“凸起”,业主:跟老家的厕所一样,开发商:不利因素已公示

极目新闻
2026-04-30 10:33:16
北影30年后再聚首:陈坤老了,黄晓明精致了,意想不到的人也来了

北影30年后再聚首:陈坤老了,黄晓明精致了,意想不到的人也来了

往史过眼云烟
2026-04-30 19:28:05
胖东来249元毛巾被质疑暴利割韭菜!官方硬核回应:将公示毛利并起诉博主

胖东来249元毛巾被质疑暴利割韭菜!官方硬核回应:将公示毛利并起诉博主

品牌新
2026-04-30 15:49:12
怒骂队友后王钰栋道歉:想赢球有些着急,球场上出现不成熟行为

怒骂队友后王钰栋道歉:想赢球有些着急,球场上出现不成熟行为

奥拜尔
2026-04-30 18:44:36
正部级易会满被“双开”:贯彻落实党中央关于资本市场重大决策部署阳奉阴违、推诿卸责

正部级易会满被“双开”:贯彻落实党中央关于资本市场重大决策部署阳奉阴违、推诿卸责

界面新闻
2026-04-30 17:18:06
挥泪斩马谡!皇马正式批准出售1.5亿“超巨”!2.4亿“顶星”来投

挥泪斩马谡!皇马正式批准出售1.5亿“超巨”!2.4亿“顶星”来投

头狼追球
2026-04-30 08:03:42
炸了!美伊战火重开,美军航母突然遭袭!

炸了!美伊战火重开,美军航母突然遭袭!

大嘴说天下
2026-04-30 19:07:44
一手好牌打个稀烂,直到张军被调查,才明白,林丹的选择有多清醒

一手好牌打个稀烂,直到张军被调查,才明白,林丹的选择有多清醒

林子说事
2026-04-30 18:33:16
陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

就一点
2026-04-29 17:28:35
2026-05-01 04:35:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5795文章数 4672关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

时尚
游戏
房产
旅游
数码

春天穿衣要杜绝老气感!衣服选对、搭配到位,减龄舒适又得体

《007 初露锋芒》制作成员采访:潜龙腾渊"/> 主站 商城 论坛 自运营 登录 注册 《007 初露锋芒》制作成员采访:潜龙腾渊 神堡薛师傅 2026...

房产要闻

熬了6年,涨了2亿,三亚核心区这块地再次上架

旅游要闻

上海旅游业者“踩线团”赴金门交流,金门考察团同日抵厦

数码要闻

机械革命耀世18 Pro游戏本270HX Plus + 5070 12GB,10499元

无障碍浏览 进入关怀版