网易首页 > 网易号 > 正文 申请入驻

大模型上下文学习的统计物理视角丨周四直播·大模型可解释性读书会

0
分享至


导语

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从不同视角梳理大语言模型可解释性的科学方法论。

什么是上下文学习?大语言模型如何通过上下文学习获得更强的泛化能力和通用性?上下文学习背后的理论机制又是什么?本次分享中将结合黄海平教授团队最近的工作,详细介绍上下文学习的前因后果,从一个简单的情景出发,通过巧妙的物理模型和强大的数学工具,揭开上下文学习背后的统计物理图像。

分享简介

大语言模型展现出令人惊讶的上下文学习能力:能够仅依靠输入提示和少量示例,在无需额外训练的情况下完成未见过的复杂任务。如何为这一经验现象提供理论解释,并将其与理论物理建立联系,是一个具有挑战性的问题。在本次分享中,我们首先带领大家梳理大模型训练和部署的流程,说明为什么需要上下文学习;然后我们考虑一个简单的情景,将上下文学习任务与经典的统计物理模型建立联系,使用平均场理论求解这个模型,并且解释其背后的物理图像。我们将会揭示,随着预训练任务多样性的增加,模型的能量景观会出现一个全局最小值,从而自然地催生出上下文学习能力。

分享大纲

背景回顾

  • 机器学习的发展历程

  • 大语言模型和Transformer结构

  • 上下文学习的基本概念

相关内容

  • 相关工作介绍

  • 统计物理方法介绍

统计物理模型

  • 从上下文学习到自旋模型

  • 使用空腔方法求解模型

  • 能量景观与物理图像分析

总结与展望

  • 创新点和局限性

  • 进一步的研究方向

核心概念

上下文学习 In-Context Learning

上下文学习(ICL)是指大型语言模型能够通过输入中提供的示例和任务描述,在不更新模型参数的情况下学习执行新任务的能力。这一概念最初由Brown等人在GPT-3的研究中提出。

自旋玻璃模型 Spin Glass Model

自旋玻璃是磁性合金材料的一种亚稳定的状态,其中的磁矩分布呈现出长程无序性。物理学家提出很多数学模型来描述这种具有随机性和阻挫性的系统,后来发现这些模型及其发展出的物理方法可以应用在更广泛的复杂系统和无序网络的研究中。

空腔方法 Cavity Method

空腔方法是M. Mézard、G. Parisi等人发展出的一种数学工具,用于求解统计物理中的平均场模型,特别是自旋玻璃模型,后来发现其与其他领域的方法(比如信念传播算法)密切相关,显示出更广泛的适用性。

能量景观 Energy Landscape

在物理中,能量景观描述的是系统在一组广义坐标下的势能;在机器学习中,能量景观描述的系统在某个参数空间中的损失函数;更普遍地来看,它实际上为数学中的优化问题提供了一个直观的几何视角。

参考文献

[1] Yuhao Li, Ruoran Bai, and Haiping Huang. Spin glass model of in-context learning. arXiv:2408.02288, 2024

[2] Mezard M, Parisi G, Virasoro M A. Spin Glass Theory and Beyond[M]. World Scientific, 1986.

[3] Huang H. Statistical mechanics of neural networks[M]. Springer, 2021.

[4] Brown T, Mann B, Ryder N, et al. Language Models are Few-Shot Learners[C]. Advances in Neural Information Processing Systems: Vol. 33. 2020: 1877-1901.

[5] Von Oswald J, Niklasson E, Randazzo E, et al. Transformers Learn In-Context by Gradient Descent[C]. International Conference on Machine Learning, ICML, 2023.

[6] Lu Y M, Letey M I, Zavatone-Veth J A, et al. Asymptotic theory of in-context learning by linear attention[A]. 2024. arXiv: 2405.11751.

[7] Chen S, Sheen H, Wang T, et al. Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality[A]. 2024. arXiv: 2402.19442.

主讲人简介

李宇豪,本科期间在中山大学物理学院黄海平教授的PMI Lab(物理、机器与智能实验室)实习,研究方向为无序系统的统计物理,特别是自旋玻璃的平均场理论、神经网络的泛化原理、大模型背后的物理机制。

参与时间

2025年7月24日(周四)晚上19:30-21:30


报名加入社群交流

https://pattern.swarma.org/study_group_issue/949?from=wechat

扫码参与,加入社群,获取系列读书会永久回看权限,与社区的一线科研工作者沟通交流,共同探索大模型可解释性这一前沿领域的发展。

大模型可解释性读书会

集智俱乐部联合上海交通大学副教授张拳石、阿里云大模型可解释性团队负责人沈旭、彩云科技首席科学家肖达、北京师范大学硕士生杨明哲和浙江大学博士生姚云志共同发起。本读书会旨在突破大模型“黑箱”困境,尝试从以下四个视角梳理大语言模型可解释性的科学方法论:

自下而上:Transformer circuit 为什么有效?

自上而下:神经网络的精细决策逻辑和性能根因是否可以被严谨、清晰地解释清楚?

复杂科学:渗流相变、涌现、自组织等复杂科学理论如何理解大模型的推理与学习能力?

系统工程:如何拥抱不确定性,在具体的业界实践中创造价值?

五位发起人老师会带领大家研读领域前沿论文,现诚邀对此话题感兴趣的朋友,一起共创、共建、共享「大模型可解释性」主题社区,通过互相的交流与碰撞,促进我们更深入的理解以上问题。无论您是致力于突破AI可解释性理论瓶颈的研究者,探索复杂系统与智能本质的交叉学科探索者,还是追求模型安全可信的工程实践者,诚邀您共同参与这场揭开大模型“黑箱”的思想盛宴。

读书会已于2025年6月19日启动,每周四晚19:30-21:30,预计持续分享8-10周左右。

详情请见:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
分析 | 特朗普称抓获马杜罗,美在委实施“斩首行动”,下一步会发生什么?

分析 | 特朗普称抓获马杜罗,美在委实施“斩首行动”,下一步会发生什么?

上观新闻
2026-01-03 19:50:12
看见佟丽娅大腿上那两道线条了吗?

看见佟丽娅大腿上那两道线条了吗?

小光侃娱乐
2026-01-03 15:40:02
古巴、哥伦比亚、伊朗、俄罗斯发声

古巴、哥伦比亚、伊朗、俄罗斯发声

鲁中晨报
2026-01-03 17:54:42
司晓迪事件最全瓜!檀健次私下是舔狗,林更新爱约,张一山最大方

司晓迪事件最全瓜!檀健次私下是舔狗,林更新爱约,张一山最大方

萌神木木
2026-01-03 11:40:35
特朗普下令开炮,委国首都炸成火海,34国被催开会

特朗普下令开炮,委国首都炸成火海,34国被催开会

时时有聊
2026-01-03 19:04:29
大陆军演刚结束,岛内最新民调出炉,结果惊人,赖清德被将军

大陆军演刚结束,岛内最新民调出炉,结果惊人,赖清德被将军

军机Talk
2026-01-03 10:55:17
美军凌晨斩首!委内瑞拉防空毫无反应:美军陆战队直扑玛格丽塔岛

美军凌晨斩首!委内瑞拉防空毫无反应:美军陆战队直扑玛格丽塔岛

南宫一二
2026-01-03 19:32:59
看看各国对委内瑞拉总统马杜罗被捕的态度

看看各国对委内瑞拉总统马杜罗被捕的态度

小鬼头体育
2026-01-04 01:26:35
如入无人之境!美军对委内瑞拉发动军事行动中俄制防空系统被瘫痪

如入无人之境!美军对委内瑞拉发动军事行动中俄制防空系统被瘫痪

军迷战情室
2026-01-03 21:26:04
央行定调:下一步要“涨物价”,强拉通胀了!这意味着什么?

央行定调:下一步要“涨物价”,强拉通胀了!这意味着什么?

诗意世界
2026-01-03 13:16:32
河北农村取暖现状扎心了!补贴取消后燃气费翻倍,老人裹棉袄过冬

河北农村取暖现状扎心了!补贴取消后燃气费翻倍,老人裹棉袄过冬

ICT解读者
2026-01-03 13:21:29
鹿晗喝醉后和司晓迪同床,更多同款证据被扒,难怪关晓彤要分手

鹿晗喝醉后和司晓迪同床,更多同款证据被扒,难怪关晓彤要分手

叶公子
2026-01-03 13:02:36
脸都打肿了!新华社这回算是直接把那个遮羞布给掀开了。

脸都打肿了!新华社这回算是直接把那个遮羞布给掀开了。

忠于法纪
2025-12-24 21:27:55
发明煤改气的人真是个天才

发明煤改气的人真是个天才

阿亮评论
2026-01-03 10:12:32
英国首相斯塔默回应美国袭击委内瑞拉:我想和特朗普谈谈

英国首相斯塔默回应美国袭击委内瑞拉:我想和特朗普谈谈

环球网资讯
2026-01-03 20:46:35
张本智和拜鬼,央媒公开点名,释放关键信号!樊振东率先做出反制

张本智和拜鬼,央媒公开点名,释放关键信号!樊振东率先做出反制

十点街球体育
2026-01-04 00:00:03
美国告知全世界,马杜罗将进监狱,不到24小时,反美强国仗义出手

美国告知全世界,马杜罗将进监狱,不到24小时,反美强国仗义出手

时时有聊
2026-01-03 20:32:29
这一仗彻底把中国打醒!美军的狠毒的作战方式,中国摸的很清楚了

这一仗彻底把中国打醒!美军的狠毒的作战方式,中国摸的很清楚了

史之铭
2025-12-12 19:23:56
“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

“最美新生儿”火了,似乎在娘胎整容化妆一般,全网都想沾喜气

菁妈育儿
2026-01-03 12:44:30
豪华!郑智刚上任新帅,就挖走国足2名人才,组建豪华团队

豪华!郑智刚上任新帅,就挖走国足2名人才,组建豪华团队

何老师呀
2026-01-03 19:59:27
2026-01-04 03:40:49
集智俱乐部 incentive-icons
集智俱乐部
科普人工智能相关知识技能
5583文章数 4661关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

教育
艺术
游戏
手机
公开课

教育要闻

初二是分水岭,不是许愿池

艺术要闻

色彩能愉悦你的眼睛,黑白则能慰藉你的心灵!

猎魂世界:开服后全主C状态及处境分析!不知不觉已经十二位了!

手机要闻

小米展示YU7门锁机械拉线:内外都有,专用备份电池

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版