网易首页 > 网易号 > 正文 申请入驻

大模型上下文学习的统计物理视角丨周四直播·大模型可解释性读书会

0
分享至

导语

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从不同视角梳理大语言模型可解释性的科学方法论。

什么是上下文学习?大语言模型如何通过上下文学习获得更强的泛化能力和通用性?上下文学习背后的理论机制又是什么?本次分享中将结合黄海平教授团队最近的工作,详细介绍上下文学习的前因后果,从一个简单的情景出发,通过巧妙的物理模型和强大的数学工具,揭开上下文学习背后的统计物理图像。

分享简介

大语言模型展现出令人惊讶的上下文学习能力:能够仅依靠输入提示和少量示例,在无需额外训练的情况下完成未见过的复杂任务。如何为这一经验现象提供理论解释,并将其与理论物理建立联系,是一个具有挑战性的问题。在本次分享中,我们首先带领大家梳理大模型训练和部署的流程,说明为什么需要上下文学习;然后我们考虑一个简单的情景,将上下文学习任务与经典的统计物理模型建立联系,使用平均场理论求解这个模型,并且解释其背后的物理图像。我们将会揭示,随着预训练任务多样性的增加,模型的能量景观会出现一个全局最小值,从而自然地催生出上下文学习能力。

分享大纲

背景回顾

  • 机器学习的发展历程

  • 大语言模型和Transformer结构

  • 上下文学习的基本概念

相关内容

  • 相关工作介绍

  • 统计物理方法介绍

统计物理模型

  • 从上下文学习到自旋模型

  • 使用空腔方法求解模型

  • 能量景观与物理图像分析

总结与展望

  • 创新点和局限性

  • 进一步的研究方向

核心概念

上下文学习 In-Context Learning

上下文学习(ICL)是指大型语言模型能够通过输入中提供的示例和任务描述,在不更新模型参数的情况下学习执行新任务的能力。这一概念最初由Brown等人在GPT-3的研究中提出。

自旋玻璃模型 Spin Glass Model

自旋玻璃是磁性合金材料的一种亚稳定的状态,其中的磁矩分布呈现出长程无序性。物理学家提出很多数学模型来描述这种具有随机性和阻挫性的系统,后来发现这些模型及其发展出的物理方法可以应用在更广泛的复杂系统和无序网络的研究中。

空腔方法 Cavity Method

空腔方法是M. Mézard、G. Parisi等人发展出的一种数学工具,用于求解统计物理中的平均场模型,特别是自旋玻璃模型,后来发现其与其他领域的方法(比如信念传播算法)密切相关,显示出更广泛的适用性。

能量景观 Energy Landscape

在物理中,能量景观描述的是系统在一组广义坐标下的势能;在机器学习中,能量景观描述的系统在某个参数空间中的损失函数;更普遍地来看,它实际上为数学中的优化问题提供了一个直观的几何视角。

参考文献

[1] Yuhao Li, Ruoran Bai, and Haiping Huang. Spin glass model of in-context learning. arXiv:2408.02288, 2024

[2] Mezard M, Parisi G, Virasoro M A. Spin Glass Theory and Beyond[M]. World Scientific, 1986.

[3] Huang H. Statistical mechanics of neural networks[M]. Springer, 2021.

[4] Brown T, Mann B, Ryder N, et al. Language Models are Few-Shot Learners[C]. Advances in Neural Information Processing Systems: Vol. 33. 2020: 1877-1901.

[5] Von Oswald J, Niklasson E, Randazzo E, et al. Transformers Learn In-Context by Gradient Descent[C]. International Conference on Machine Learning, ICML, 2023.

[6] Lu Y M, Letey M I, Zavatone-Veth J A, et al. Asymptotic theory of in-context learning by linear attention[A]. 2024. arXiv: 2405.11751.

[7] Chen S, Sheen H, Wang T, et al. Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality[A]. 2024. arXiv: 2402.19442.

主讲人简介

李宇豪,本科期间在中山大学物理学院黄海平教授的PMI Lab(物理、机器与智能实验室)实习,研究方向为无序系统的统计物理,特别是自旋玻璃的平均场理论、神经网络的泛化原理、大模型背后的物理机制。

参与时间

2025年7月24日(周四)晚上19:30-21:30


报名加入社群交流

https://pattern.swarma.org/study_group_issue/949?from=wechat

扫码参与,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同探索大模型可解释性这一前沿领域的发展。

大模型可解释性读书会

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从以下四个视角梳理大语言模型可解释性的科学方法论:

自下而上:Transformer circuit 为什么有效?

自上而下:神经网络的精细决策逻辑和性能根因是否可以被严谨、清晰地解释清楚?

复杂科学:渗流相变、涌现、自组织等复杂科学理论如何理解大模型的推理与学习能力?

系统工程:如何拥抱不确定性,在具体的业界实践中创造价值?

五位发起人老师会带领大家研读领域前沿论文,现诚邀对此话题感兴趣的朋友,一起共创、共建、共享「大模型可解释性」主题社区,通过互相的交流与碰撞,促进我们更深入的理解以上问题。无论您是致力于突破AI可解释性理论瓶颈的研究者,探索复杂系统与智能本质的交叉学科探索者,还是追求模型安全可信的工程实践者,诚邀您共同参与这场揭开大模型“黑箱”的思想盛宴。

读书会已于2025年6月19日启动,每周四晚19:30-21:30,预计持续分享8-10周左右。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
厅级干部已经成为了高危职业

厅级干部已经成为了高危职业

风向观察
2026-05-04 14:17:07
硅谷华裔工程师回国两周后,反而更看好美国了?

硅谷华裔工程师回国两周后,反而更看好美国了?

回旋镖
2026-05-04 11:10:15
亨得利晒与9岁吴宜泽合影!奥沙利文:他将夺冠 三年成为世界第一

亨得利晒与9岁吴宜泽合影!奥沙利文:他将夺冠 三年成为世界第一

念洲
2026-05-04 13:12:23
4月,房价跌幅继续扩大

4月,房价跌幅继续扩大

大川东山再起
2026-05-04 16:10:02
日本陆自部队新徽章,被骂下线

日本陆自部队新徽章,被骂下线

扬子晚报
2026-05-04 14:48:54
浏阳烟花爆竹企业爆炸事故已致3人死亡,25人受伤;涉事企业成立26年,周边居民称600米外玻璃被震碎

浏阳烟花爆竹企业爆炸事故已致3人死亡,25人受伤;涉事企业成立26年,周边居民称600米外玻璃被震碎

大风新闻
2026-05-04 22:05:03
斯诺克世锦赛:墨菲被罚4分单杆逆转!缩小分差,吴宜泽连输2局!

斯诺克世锦赛:墨菲被罚4分单杆逆转!缩小分差,吴宜泽连输2局!

刘姚尧的文字城堡
2026-05-04 21:07:55
你家楼下的便利店老板们,已经笑不出来了。

你家楼下的便利店老板们,已经笑不出来了。

差评XPIN
2026-05-04 00:03:31
埃梅里轮换7人“送”三分背后:热刺的保级阳谋与英超的江湖人情

埃梅里轮换7人“送”三分背后:热刺的保级阳谋与英超的江湖人情

落夜足球
2026-05-04 19:53:17
手机正在打败中国的大学教育制度

手机正在打败中国的大学教育制度

回旋镖
2026-05-04 12:19:32
离了大谱:当妈的猥亵女儿?

离了大谱:当妈的猥亵女儿?

十柱
2026-05-04 14:54:35
足坛最大实锤!凯塔亲口承认,当年睡了伊卡尔迪的老婆旺达?

足坛最大实锤!凯塔亲口承认,当年睡了伊卡尔迪的老婆旺达?

罗氏八卦
2026-05-04 18:05:03
3连鞭,10-10!墨菲触底反弹,或进入逆战模式,吴宜泽兵败如山倒

3连鞭,10-10!墨菲触底反弹,或进入逆战模式,吴宜泽兵败如山倒

刘姚尧的文字城堡
2026-05-04 21:36:15
世锦赛战报:决赛,吴宜泽单局被罚7次,墨菲连扳两局仍落后9-10

世锦赛战报:决赛,吴宜泽单局被罚7次,墨菲连扳两局仍落后9-10

求球不落谛
2026-05-04 21:13:07
张雪回应53号车手遗憾退赛:赛车机械故障,初步排查是发动机机油压力下降

张雪回应53号车手遗憾退赛:赛车机械故障,初步排查是发动机机油压力下降

贝壳财经
2026-05-03 21:28:05
最高5088元/年!豆包真敢啊

最高5088元/年!豆包真敢啊

罗超频道
2026-05-04 15:39:06
“山西订婚强奸案”男子刑满释放回家 其母:刚回来状态有些紧张,以后要好好生活

“山西订婚强奸案”男子刑满释放回家 其母:刚回来状态有些紧张,以后要好好生活

红星新闻
2026-05-04 18:24:32
官方:辽宁铁人宣布李金羽下课 且不再担任总经理

官方:辽宁铁人宣布李金羽下课 且不再担任总经理

体坛周报
2026-05-04 18:07:32
黄秋生作品出局:两场演唱会同日取消,风向已经很清楚了

黄秋生作品出局:两场演唱会同日取消,风向已经很清楚了

一盅情怀
2026-05-04 15:54:27
赖清德,他将如何从斯威士兰返回台湾?或许比去程更狼狈

赖清德,他将如何从斯威士兰返回台湾?或许比去程更狼狈

黄娜老师
2026-05-04 19:20:05
2026-05-04 23:15:00
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5799文章数 4672关注度
往期回顾 全部

科技要闻

在中国市场搞「付费订阅」,豆包咋想的?

头条要闻

上科大39岁博导王晨辉为救孩子去世 同学发声

头条要闻

上科大39岁博导王晨辉为救孩子去世 同学发声

体育要闻

骑士破猛龙:加雷特·阿伦的活力

娱乐要闻

张敬轩还是站上了英皇25周年舞台

财经要闻

魔幻的韩国股市,父母给婴儿开户买股票

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

手机
房产
艺术
数码
游戏

手机要闻

REDMI K100会涨价?后续新机曝光

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

艺术要闻

火灾后第17年,TVCC电视文化中心正式启用

数码要闻

华硕推出ZenScreen OLED MQ16FC便携显示器:16英寸,280欧元起

离谱!WBG遭TES零封,冠军打野被粉丝贴脸辱骂,俱乐部回应来了

无障碍浏览 进入关怀版