网易首页 > 网易号 > 正文 申请入驻

复杂性科学视角下大语言模型涌现现象的解释丨周四直播·大模型可解释性读书会

0
分享至

导语

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从不同视角梳理大语言模型可解释性的科学方法论。

自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享简介

除了人们熟知的神经标度律,大语言模型还展现出了许多神奇的现象,比如涌现、顿悟等等。涌现是指,当LLM的规模达到某一阈值时,模型突然在某些方面的能力有了显著的提升。这种剧烈的非线性变化看起来是不可预测的。为什么会发生这样的现象?很多学者已经注意到这样的现象,并尝试解释它。

实际上,在复杂系统研究领域,自菲利普·安德森提出“More is different”之后,涌现现象本身就是一个经久不衰的重要研究问题。那我们能否借助复杂系统涌现理论来解释甚至预测LLM的涌现现象?这是一个方兴未艾的领域,本次读书会主要为该领域的主要工作做一个概览性的介绍。

分享大纲

1.现象描述

2.对涌现的初步解释

3.对涌现的机制解释

  • 知识量子视角

  • 渗流模型视角

  • 多尺度视角与代理模型

核心概念

涌现

渗流相变

互信息

序参量

神经标度律

参考文献

1.「大语言模型」通过系统性评估发现,其涌现能力(如复杂推理)在模型规模突破临界阈值后突然显现,而非线性增长。(核心发现:当参数规模超过10^22时,LLMs在算术/推理等任务上表现出现跃升式进步,证明能力涌现具有规模依赖性)

Wei, J., Tay, Y., Bommasani, R., Raffel, C., Zoph, B., Borgeaud, S., Yogatama, D., Bosma, M., Zhou, D., Metzler, D., Chi, E. H., Hashimoto, T., Vinyals, O., Liang, P., Dean, J., & Fedus, W. (2022). Emergent Abilities of Large Language Models (arXiv:2206.07682). arXiv.

2.「大语言模型的涌现能力」通过任务指标重构分析提出质疑,认为其可能是评测中的度量选择(如非线性评分)或分词策略带来的统计假象,而非本质能力跃升。

Schaeffer, R., Miranda, B., & Koyejo, S. (2023). Are Emergent Abilities of Large Language Models a Mirage? (arXiv:2304.15004).

3.「Transformer涌现能力」通过渗流理论建模形式语言任务,揭示其能力突变本质是网络连接性在训练中达到临界阈值后产生的相变现象。

Lubana, E. S., Kawaguchi, K., Dick, R. P., & Tanaka, H. (2024). A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language (arXiv:2408.12578).

4.探讨语言模型(LMs)在参数规模和训练数据扩展时,新能力如何涌现(如复杂推理、多步任务等),并尝试提供理论解释。

Arora, S., & Goyal, A. (2023). A Theory for Emergence of Complex Skills in Language Models (arXiv:2307.15936). arXiv. https://doi.org/10.48550/arXiv.2307.15936

5.「神经网络的量化缩放模型」提出信息压缩理论,证明模型性能的幂律缩放源于参数空间对数据分布的逐步量化逼近,且最优量化精度随模型规模对数增长。

Michaud E, Liu Z, Girit U, et al. The quantization model of neural scaling[J]. Advances in Neural Information Processing Systems, 2023, 36: 28699-28722.

6.「语言模型语义涌现量化研究」提出信息熵框架,证明语义理解能力的涌现源于潜在表征空间的层级化重组,其临界阈值与模型深度呈指数关系。

Chen, H., Yang, X., Zhu, J., & Wang, W. (2024). Quantifying Semantic Emergence in Language Models (arXiv:2405.12617). arXiv.

7.「大语言模型的生物学隐喻研究」提出神经可塑性启发的训练框架,证明Transformer注意力机制与生物神经网络突触修剪存在动力学相似性,其层级化信息整合遵循能量最小化原则。

Lindsey, et al., "On the Biology of a Large Language Model", Transformer Circuits, 2025.

主讲人介绍

杨明哲,北京师范大学系统科学学院硕士生,在张江老师因果涌现研究小组。研究领域是因果涌现、复杂系统自动建模。

参与时间

2025年7月3日(周四)晚上19:30-21:30


报名加入社群交流

https://pattern.swarma.org/study_group_issue/935?from=wechat

扫码参与,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同探索大模型可解释性这一前沿领域的发展。

大模型可解释性读书会

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从以下四个视角梳理大语言模型可解释性的科学方法论:

自下而上:Transformer circuit 为什么有效?

自上而下:神经网络的精细决策逻辑和性能根因是否可以被严谨、清晰地解释清楚?

复杂科学:渗流相变、涌现、自组织等复杂科学理论如何理解大模型的推理与学习能力?

系统工程:如何拥抱不确定性,在具体的业界实践中创造价值?

五位发起人老师会带领大家研读领域前沿论文,现诚邀对此话题感兴趣的朋友,一起共创、共建、共享「大模型可解释性」主题社区,通过互相的交流与碰撞,促进我们更深入的理解以上问题。无论您是致力于突破AI可解释性理论瓶颈的研究者,探索复杂系统与智能本质的交叉学科探索者,还是追求模型安全可信的工程实践者,诚邀您共同参与这场揭开大模型“黑箱”的思想盛宴。

读书会计划于2025年6月19日启动,每周四晚19:30-21:30,预计持续分享10周左右。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿根廷神级预言家,1000多幅预言画几乎全中?未来世界3国主导?

阿根廷神级预言家,1000多幅预言画几乎全中?未来世界3国主导?

飞云如水
2024-08-01 21:28:13
重庆重要人事调动

重庆重要人事调动

白衣海盗
2026-01-09 10:00:22
深夜英特尔狂飙超8%,中概股下挫,油价、白银拉升

深夜英特尔狂飙超8%,中概股下挫,油价、白银拉升

21世纪经济报道
2026-01-10 00:03:07
央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

央视怒批,人民日报点名封杀,这5位目无法纪的大网红,彻底凉凉

一娱三分地
2025-12-04 17:00:33
“大尺度”新年挂历火了!活菩萨椰树怂了

“大尺度”新年挂历火了!活菩萨椰树怂了

李东阳朋友圈
2026-01-09 20:01:49
橘玛丽:从“大G御姐”到百变女王,这位姐的逆袭剧本太顶了!

橘玛丽:从“大G御姐”到百变女王,这位姐的逆袭剧本太顶了!

碧波万览
2026-01-10 03:55:03
美女打屁股大赛,火了

美女打屁股大赛,火了

微微热评
2025-10-08 22:10:24
数据新闻丨3046公里!这是塔克拉玛干的大漠锁边记

数据新闻丨3046公里!这是塔克拉玛干的大漠锁边记

闪电新闻
2026-01-09 15:09:00
偌大的海南岛面积足有3.4万平方公里,为啥却少有大型港口呢?

偌大的海南岛面积足有3.4万平方公里,为啥却少有大型港口呢?

向航说
2025-12-12 00:40:02
三星掌门人北京逛街,穿“老头马甲”秒售罄!有钱男人为啥爱马甲

三星掌门人北京逛街,穿“老头马甲”秒售罄!有钱男人为啥爱马甲

商务范
2026-01-07 17:57:48
天生富贵命!这 3 对生肖夫妻,招财旺家一辈子,子孙后代都享福

天生富贵命!这 3 对生肖夫妻,招财旺家一辈子,子孙后代都享福

人閒情事
2026-01-09 22:03:34
阿隆索:西蒙尼的行为不是一个优秀的体育人士该有的

阿隆索:西蒙尼的行为不是一个优秀的体育人士该有的

懂球帝
2026-01-09 10:05:11
国内首例!万吨桥梁成功转体跨越上海磁浮线

国内首例!万吨桥梁成功转体跨越上海磁浮线

看看新闻Knews
2026-01-09 09:53:01
2019年17岁女孩找大叔偷情,缠绵时给大叔下药,透支大叔卡上的钱

2019年17岁女孩找大叔偷情,缠绵时给大叔下药,透支大叔卡上的钱

谈史论天地
2026-01-09 13:20:03
AI的尽头是医疗!AMD苏姿丰最新对话:开发药物,将像造iPhone一样简单!

AI的尽头是医疗!AMD苏姿丰最新对话:开发药物,将像造iPhone一样简单!

智药局
2026-01-07 19:40:48
越南当年为何敢和中国开战?黎笋长子多年后说出了核心真相

越南当年为何敢和中国开战?黎笋长子多年后说出了核心真相

古书记史
2025-12-22 19:21:12
国乒奥运阵容浮出水面,21岁新星弯道超车,4人稳固,1主力被冷落

国乒奥运阵容浮出水面,21岁新星弯道超车,4人稳固,1主力被冷落

知轩体育
2025-12-08 01:23:52
色字头上一把刀!沈阳一男子追求00后女生“霸王硬上弓”,被判刑

色字头上一把刀!沈阳一男子追求00后女生“霸王硬上弓”,被判刑

火山詩话
2026-01-09 08:45:32
若中日再次爆发战争,结局会如何?俄罗斯和美国看法一致

若中日再次爆发战争,结局会如何?俄罗斯和美国看法一致

老谢谈史
2025-12-01 20:40:13
许晴一看就老了,竟然还没张凯丽显年轻!

许晴一看就老了,竟然还没张凯丽显年轻!

草莓解说体育
2026-01-07 09:12:50
2026-01-10 06:11:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5596文章数 4661关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

媒体称委内瑞拉代总统计划13日访问华盛顿 委方回应

头条要闻

媒体称委内瑞拉代总统计划13日访问华盛顿 委方回应

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

关晓彤鹿晗风波后露面 不受影响状态佳

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

助跑三年的奇瑞 接下来是加速还是起跳?

态度原创

亲子
旅游
数码
手机
艺术

亲子要闻

“国学驯化”从娃娃抓起?

旅游要闻

想看雾凇别瞎跑!吉林阿什哈达这 5 个观赏秘诀,帮你避开空跑遗憾

数码要闻

铭凡CES 2026新闻稿提及英特尔酷睿Ultra 9 290HX Plus处理器

手机要闻

vivo X200T详细参数曝光,X300 Ultra待发布

艺术要闻

15位著名画家的女性之美:哪一张触动了你的心?

无障碍浏览 进入关怀版