网易首页 > 网易号 > 正文 申请入驻

复杂性科学视角下大语言模型涌现现象的解释丨周四直播·大模型可解释性读书会

0
分享至


导语

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从不同视角梳理大语言模型可解释性的科学方法论。

自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享简介

除了人们熟知的神经标度律,大语言模型还展现出了许多神奇的现象,比如涌现、顿悟等等。涌现是指,当LLM的规模达到某一阈值时,模型突然在某些方面的能力有了显著的提升。这种剧烈的非线性变化看起来是不可预测的。为什么会发生这样的现象?很多学者已经注意到这样的现象,并尝试解释它。

实际上,在复杂系统研究领域,自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享大纲

1.现象描述

2.对涌现的初步解释

3.对涌现的机制解释

  • 知识量子视角

  • 渗流模型视角

  • 多尺度视角与代理模型

核心概念

涌现

渗流相变

互信息

序参量

神经标度律

参考文献

1.「大语言模型」通过系统性评估发现,其涌现能力(如复杂推理)在模型规模突破临界阈值后突然显现,而非线性增长。(核心发现:当参数规模超过10^22时,LLMs在算术/推理等任务上表现出现跃升式进步,证明能力涌现具有规模依赖性)

Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., Yogatama, D., Bosma, M., Zhou, D., Metzler, D., Chi, E. H., Hashimoto, T., Vinyals, O., Liang, P., Dean, J., & Fedus, W. (2022). Emergent Abilities of Large Language Models (arXiv:2206.07682). arXiv.

2.「大语言模型的涌现能力」通过任务指标重构分析提出质疑,认为其可能是评测中的度量选择(如非线性评分)或分词策略带来的统计假象,而非本质能力跃升。

Schaeffer, R., Miranda, B., & Koyejo, S. (2023). Are Emergent Abilities of Large Language Models a Mirage? (arXiv:2304.15004).

3.「Transformer涌现能力」通过渗流理论建模形式语言任务,揭示其能力突变本质是网络连接性在训练中达到临界阈值后产生的相变现象。

Lubana, E. S., Kawaguchi, K., Dick, R. P., & Tanaka, H. (2024). A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language (arXiv:2408.12578).

4.探讨语言模型(LMs)在参数规模和训练数据扩展时,新能力如何涌现(如复杂推理、多步任务等),并尝试提供理论解释。

Arora, S., & Goyal, A. (2023). A Theory for Emergence of Complex Skills in Language Models (arXiv:2307.15936). arXiv. https://doi.org/10.48550/arXiv.2307.15936

5.「神经网络的量化缩放模型」提出信息压缩理论,证明模型性能的幂律缩放源于参数空间对数据分布的逐步量化逼近,且最优量化精度随模型规模对数增长。

Michaud E, Liu Z, Girit U, et al. The quantization model of neural scaling[J]. Advances in Neural Information Processing Systems, 2023, 36: 28699-28722.

6.「语言模型语义涌现量化研究」提出信息熵框架,证明语义理解能力的涌现源于潜在表征空间的层级化重组,其临界阈值与模型深度呈指数关系。

Chen, H., Yang, X., Zhu, J., & Wang, W. (2024). Quantifying Semantic Emergence in Language Models (arXiv:2405.12617). arXiv.

7.「大语言模型的生物学隐喻研究」提出神经可塑性启发的训练框架,证明Transformer注意力机制与生物神经网络突触修剪存在动力学相似性,其层级化信息整合遵循能量最小化原则。

Lindsey, et al., "On the Biology of a Large Language Model", Transformer Circuits, 2025.

主讲人介绍

杨明哲,北京师范大学系统科学学院硕士生,在张江老师因果涌现研究小组。研究领域是因果涌现、复杂系统自动建模。

参与时间

2025年7月3日(周四)晚上19:30-21:30


报名加入社群交流

https://pattern.swarma.org/study_group_issue/935?from=wechat

扫码参与,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同探索大模型可解释性这一前沿领域的发展。

大模型可解释性读书会

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从以下四个视角梳理大语言模型可解释性的科学方法论:

自下而上:Transformer circuit 为什么有效?

自上而下:神经网络的精细决策逻辑和性能根因是否可以被严谨、清晰地解释清楚?

复杂科学:渗流相变、涌现、自组织等复杂科学理论如何理解大模型的推理与学习能力?

系统工程:如何拥抱不确定性,在具体的业界实践中创造价值?

五位发起人老师会带领大家研读领域前沿论文,现诚邀对此话题感兴趣的朋友,一起共创、共建、共享「大模型可解释性」主题社区,通过互相的交流与碰撞,促进我们更深入的理解以上问题。无论您是致力于突破AI可解释性理论瓶颈的研究者,探索复杂系统与智能本质的交叉学科探索者,还是追求模型安全可信的工程实践者,诚邀您共同参与这场揭开大模型“黑箱”的思想盛宴。

读书会计划于2025年6月19日启动,每周四晚19:30-21:30,预计持续分享10周左右。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沙特富翁带7个儿子来中国旅游,下飞机众人疑惑:这居然是中国?

沙特富翁带7个儿子来中国旅游,下飞机众人疑惑:这居然是中国?

今天说故事
2025-09-10 18:03:28
赵露思带爸妈韩国度假被偶遇,网友:妈妈像富婆爸爸像日本大学生

赵露思带爸妈韩国度假被偶遇,网友:妈妈像富婆爸爸像日本大学生

小咪侃娱圈
2025-09-19 09:06:47
特朗普称对俄领导人失望,泽连斯基再度视察前线

特朗普称对俄领导人失望,泽连斯基再度视察前线

山河路口
2025-09-19 18:16:45
600376,尾盘跳水跌停,此前12天11板

600376,尾盘跳水跌停,此前12天11板

第一财经资讯
2025-09-19 14:58:56
曹髦为什么不趁上朝时做掉司马昭?而是选择自杀式讨伐

曹髦为什么不趁上朝时做掉司马昭?而是选择自杀式讨伐

掠影后有感
2025-09-19 14:56:46
紧急发布!苹果为 iPhone 17 推出 iOS 26 修订版

紧急发布!苹果为 iPhone 17 推出 iOS 26 修订版

简科技
2025-09-19 13:00:05
空调大王跌落神坛,巨亏14亿,叫板董明珠扬言造最好空调现成老赖

空调大王跌落神坛,巨亏14亿,叫板董明珠扬言造最好空调现成老赖

北纬的咖啡豆
2025-09-16 19:16:27
9000万欧新援!沃尔特马德替补席上边吃香蕉边看比赛

9000万欧新援!沃尔特马德替补席上边吃香蕉边看比赛

直播吧
2025-09-19 03:16:07
胜战红利!中国武器间接拿下史上最大军售,歼10红旗9将进驻沙特

胜战红利!中国武器间接拿下史上最大军售,歼10红旗9将进驻沙特

芳芳历史烩
2025-09-19 09:30:50
内塔尼亚胡不装了,放话要报复中国,中方的回应,给美以提了个醒

内塔尼亚胡不装了,放话要报复中国,中方的回应,给美以提了个醒

爱意随风起呀
2025-09-18 14:17:06
复仇者联盟?波杰姆斯基亲笔:女武神全员都憋着一股劲要证明自己

复仇者联盟?波杰姆斯基亲笔:女武神全员都憋着一股劲要证明自己

直播吧
2025-09-19 20:20:05
封毅,被查

封毅,被查

新京报
2025-09-19 19:48:35
已成主力!罗马诺:曼联认为霍伊伦将被买断,5000万几乎确保进账

已成主力!罗马诺:曼联认为霍伊伦将被买断,5000万几乎确保进账

直播吧
2025-09-19 19:04:02
杨振宁的“长寿秘诀”,最核心的并不是多运动、喝水,而是这4点

杨振宁的“长寿秘诀”,最核心的并不是多运动、喝水,而是这4点

知鉴明史
2025-08-17 12:00:06
恶性度最高的肿瘤是那些?

恶性度最高的肿瘤是那些?

肿瘤医学论坛
2025-09-16 19:19:27
这场发布会,潘功胜、李云泽、吴清等将出席!

这场发布会,潘功胜、李云泽、吴清等将出席!

上观新闻
2025-09-19 19:16:06
梅拉尼娅偏爱宽檐帽,几乎遮住整张脸,肢体专家揭秘真实原因

梅拉尼娅偏爱宽檐帽,几乎遮住整张脸,肢体专家揭秘真实原因

红袖说事
2025-09-18 23:16:56
留洋又+1!17岁中国球员将前往欧洲,加盟荷兰知名球队

留洋又+1!17岁中国球员将前往欧洲,加盟荷兰知名球队

足球观察1
2025-09-18 16:27:39
8000 个家庭案例研究曝光:中国孩子已经变了,老师和家长却还没跟上!

8000 个家庭案例研究曝光:中国孩子已经变了,老师和家长却还没跟上!

心理提升课堂
2025-09-06 16:21:06
开国少将李伯秋:抗美援朝打满全场,为何86年被开除军籍党籍?

开国少将李伯秋:抗美援朝打满全场,为何86年被开除军籍党籍?

太傅言史
2025-09-10 09:31:00
2025-09-19 20:59:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5361文章数 4651关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

一艘从中国出发的货轮将试航北方海路新路线 中方回应

头条要闻

一艘从中国出发的货轮将试航北方海路新路线 中方回应

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

684亿大牛股,把孕妇逼到胎停?

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

教育
游戏
亲子
本地
公开课

教育要闻

“初中补了3年课,高一就露馅了”,家长晒女儿分数,看清了现实

IGN《仁王3》制作组访谈:通关流派任君挑选!

亲子要闻

千城百县看中国|山东巨野:全国爱牙日 义诊送健康

本地新闻

大学生军训哪家强,广西申请“出战”!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版