网易首页 > 网易号 > 正文 申请入驻

朗之万方程,机器学习与液体中的粒子运动,一个意想不到的联系

0
分享至

梯度下降算法是机器学习中最流行的优化技术之一。它有三种类型:批量梯度下降(GD)、随机梯度下降(SGD)和小批量梯度下降(在每次迭代中用于计算损失函数梯度的数据量不同)。

本文的目标是描述基于朗格文动力学(LD)的全局优化器的研究进展,LD是一种分子运动的建模方法,它起源于20世纪初阿尔伯特·爱因斯坦和保罗·朗之万关于统计力学的著作。

我将从理论物理学的角度提供一个优雅的解释,为什么梯度下降的变种是有效的全局优化器。

奇迹的一年

没有迹象表明一场革命即将发生。1904年,如果阿尔伯特·爱因斯坦放弃了物理学,他的科学家同行们可能甚至都不会注意到。幸运的是,这并没有发生。1905年,这位年轻的专利职员发表了四篇革命性的论文。

  • 阿尔伯特·爱因斯坦

流体中的随机运动

在其中一篇论文中,爱因斯坦推导出了所谓的布朗运动模型,即液体中悬浮粒子的随机运动,由与更小、快速运动的分子(例如在水中运动的花粉颗粒)的碰撞引起。

  • 布朗运动:尘埃粒子与气体分子的碰撞

在这篇论文中,他证实了原子和分子的存在,由此诞生了物理学的一个新的分支——分子动力学,创造了应用数学的一个崭新领域——随机微积分。

朗之万动力学

1908年,在爱因斯坦发表他的里程碑式论文三年后,法国物理学家保罗·朗之万发表了另一篇开创性的文章,他在文中概括了爱因斯坦的理论,并发展了一个描述布朗运动的新微分方程,即今天的朗之万方程(LE):

其中x是运动粒子的位置,m是它的质量,R表示一个(随机的)力产生与较小的,快速移动的流体分子的碰撞(见上面的动画),F表示任何其他外力。随机力R是一个delta相关的平稳高斯过程,其均值和方差如下:

  • R是一个正常的过程。

术语“delta相关”意味着两个不同时间的力是零相关的。LE是第一个描述不平衡热力学的数学方程。

  • 法国物理学家保罗·朗之万

如果粒子的质量足够小,我们可以把左边设为零。此外,我们可以用某个势能的导数来表示一个(保守)力。我们得到:

  • 小质量的朗之万方程

写作:

其中δt是一个小时间间隔,并有移动项,我们得到了小质量粒子的离散朗之万方程:

  • 小惯性粒子的离散朗之万方程。

用这种方式表示,朗之万方程描述了经历布朗运动的粒子的增量位移。

布朗运动的Python代码

为了模拟二维离散布朗过程,采用了两种一维过程。步骤如下:

  • 首先,选择时间步数“steps”。
  • 坐标x和y是随机跳跃的累积和(函数np.cumsum()用于计算它们)。
  • 中间点X和Y通过使用np.interp()插值计算。
  • 然后使用plot()函数绘制布朗运动。

代码是:

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inlinesteps = 5000
random.seed(42)
x,y = np.cumsum(np.random.randn(steps)), np.cumsum(np.random.randn(steps))points = 10
ip = lambda x, steps, points: np.interp(np.arange(steps*points),
np.arange(steps)*points,
x)
X, Y = ip(x, steps, points), ip(y, steps, points)fig, ax = plt.subplots(1, 1, figsize=(10, 10))
ax.set_title('Brownian Motion')
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.plot(X, Y, color='blue',
marker='o', markersize=1)

  • 布朗运动图解

朗之万动力学与全局极小值

朗之万动力学的一个重要性质是随机过程x(t)(其中x(t)服从上面给出的Langevin方程)的扩散分布p(x)收敛于平稳分布,即普遍存在的波尔兹曼分布(BD)。

  • 波尔兹曼分布

它集中在势能E(x)的全局最小值附近(从它的函数形式,我们可以很容易地看到BD峰在势能E(x)的全局最小值上)。更准确地说,如果温度按照离散步骤缓慢降至零:

那么p(x)在n的大值时收敛于玻尔兹曼分布(x收敛于E(x)的全局最小值)。朗之万方程的时变温度通常被解释为描述亚稳态物理状态的衰减到系统的基态(这是能量的全局最小值)。因此,我们可以使用朗之万动力学来设计算法,使其成为潜在非凸函数的全局最小化。

这一原理是模拟退火技术的基础,用于获得近似的全局最优函数。

  • 模拟退火在寻找极大值中的应用。

梯度下降算法

现在我将转到机器学习优化算法。

梯度下降是一个简单的迭代优化算法最小化(或最大化)函数。在机器学习的背景下,这些函数是损失函数。为具体起见,考虑一个多元损失函数L(w),定义了一些不动点p周围的所有点w。GD算法基于一个简单的性质,即从任何点p开始,函数L(w)在其负梯度方向上衰减最快:

  • 损失函数的负梯度。


人们首先猜测最小值的初始值,然后计算序列:

遵循迭代过程:

  • 梯度下降法递归。

其中,γ为学习率,允许在每次迭代n时改变学习率。如果损失函数L及其梯度具有一定的性质,按照一定的协议选择学习率变化,保证局部收敛(只有当L是凸函数时才保证收敛到全局最小值,因为对于凸函数,任何局部最小值也是全局最小值)。

随机梯度下降(SGD)和小批量梯度下降

基本的GD算法在每次迭代时都扫描完整的数据集,而SGD和小批量GD只使用训练数据的一个子集。SGD在每次迭代中使用单个训练数据样本更新梯度,即在扫描训练数据时,对每个训练示例执行上述w的更新。小批量GD使用小批量的训练示例执行参数更新。

让我们用数学的方式来解释。用于一般训练集:

  • n个样本的训练集。


损失函数的一般形式为:

  • 一般损失函数。

在小批梯度下降的情况下,总和仅在批内的训练示例。特别是SGD只使用一个样本。与普通的GD相比,这些过程有两个主要优势:它们速度更快,并且可以处理更大的数据集。

定义G和g如下所示,在这种情况下我们有:

在下面的动画中,SGD的收敛和其他方法一起展示了(这些其他方法,本文没有提到,是SGD的最新改进)。

机器学习与物理,作为朗之万过程的梯度下降

下一个步骤对于论证是至关重要的。为了让读者理解主要思想,我省略了一些较为严格的细节。

我们可以把小批量梯度写成全梯度和正态分布的η之间的和:

现在将这个表达式代入GD迭代表达式中,我们得到:

  • 小批量梯度下降迭代步骤

一个优雅的联系

将小批量梯度下降迭代的表达式与朗之万方程进行比较,我们可以立即注意到它们的相似性。更准确地说,它们通过以下方式变得相同:

用γ代入δt,我们发现:

因此,SGD或小批量梯度下降算法形式上类似于朗之万过程,这就解释了为什么如果学习率按照前面提到的协议变化,它们有非常高的概率选择全局最小值。

这个结果并不新鲜。事实上,有许多证据表明,在通常的梯度下降递归中添加一个噪声项会使算法收敛到全局最小值。

结论

在这篇文章中,我展示了将随机或小批量梯度下降看作是朗之万随机过程,并通过学习率包括额外的随机化级别,我们可以理解为什么这些算法可以作为全局优化器工作得如此好。这是一个很好的结果,它表明从多个角度检查一个问题通常是非常有用的。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突发!以色列导弹袭击伊朗,德黑兰附近发生强烈爆炸,多架航班在伊朗领空改道

突发!以色列导弹袭击伊朗,德黑兰附近发生强烈爆炸,多架航班在伊朗领空改道

封面新闻
2024-04-20 10:24:53
大S口碑疑跌入谷底!汪小菲堵学校门口见孩子,网曝大S二审败诉了

大S口碑疑跌入谷底!汪小菲堵学校门口见孩子,网曝大S二审败诉了

小徐讲八卦
2024-04-20 13:08:44
母子情深!28年来每晚与母亲共枕,他们的亲密举动让人瞠目结舌!

母子情深!28年来每晚与母亲共枕,他们的亲密举动让人瞠目结舌!

户外阿崭
2024-04-11 22:37:39
最强女海王!河南已婚女子同时交13名男友,颜值照曝光,网友:确实长得美……

最强女海王!河南已婚女子同时交13名男友,颜值照曝光,网友:确实长得美……

鱼乐星鲜事
2024-04-08 20:38:06
国家提醒商家备好现金收款,将停止电子支付?

国家提醒商家备好现金收款,将停止电子支付?

户外钓鱼哥阿旱
2024-04-20 15:18:07
广东VS广厦之G2——放一追三不是童话,今晚扳平比分更在情理当中

广东VS广厦之G2——放一追三不是童话,今晚扳平比分更在情理当中

阿牛体育说
2024-04-20 13:34:58
阚清子,又白又大又深,我感觉掉进去就爬不上来了

阚清子,又白又大又深,我感觉掉进去就爬不上来了

娱乐圈酸柠檬
2024-04-17 21:19:08
6分钟内摧毁19个导弹基地,80架战机被击落,228枚导弹成炮灰

6分钟内摧毁19个导弹基地,80架战机被击落,228枚导弹成炮灰

环球Talk
2024-03-04 23:19:28
精彩!王曼昱4-1战胜早田希娜,晋级四强,与张本美和进行半决赛

精彩!王曼昱4-1战胜早田希娜,晋级四强,与张本美和进行半决赛

湘楚风云
2024-04-19 18:58:58
震惊!李云泽以新身份亮相,部署重要行动。

震惊!李云泽以新身份亮相,部署重要行动。

创作者_1660054629785
2024-04-20 10:45:51
朱立伦对外释放访问大陆的“2个条件”

朱立伦对外释放访问大陆的“2个条件”

寥寥无几溜了
2024-04-20 06:47:26
女子和老公亲昵时,摸到乳房有个“小酒窝”,5个月后硬块长大了

女子和老公亲昵时,摸到乳房有个“小酒窝”,5个月后硬块长大了

荷兰豆爱健康
2024-04-19 07:55:33
吴艳妮参赛成绩倒数第一 带病出战对决世界高手 霸气放话上场就干

吴艳妮参赛成绩倒数第一 带病出战对决世界高手 霸气放话上场就干

厝边人侃体育
2024-04-20 11:28:03
千万吨级国营钢铁集团,迎来“85后”总经理!

千万吨级国营钢铁集团,迎来“85后”总经理!

蓝色海边
2024-04-20 13:25:42
愤怒!中国女排球员留洋夺冠,却遭强烈针对,把她从冠军海报抹掉

愤怒!中国女排球员留洋夺冠,却遭强烈针对,把她从冠军海报抹掉

罗掌柜体育
2024-04-20 10:12:05
王艺迪出局黑脸!把日本主力输了一遍,马琳躲开却派陈梦恩师指挥

王艺迪出局黑脸!把日本主力输了一遍,马琳躲开却派陈梦恩师指挥

三十年莱斯特城球迷
2024-04-18 14:00:45
咸鱼变“黄鱼”,表面上买女生自用自行车,实是做肮脏的交易​

咸鱼变“黄鱼”,表面上买女生自用自行车,实是做肮脏的交易​

三月柳
2024-04-18 14:13:38
阿娇现身宁波卫生院看诊,安静排队等待叫号,穿着朴素眼神着急

阿娇现身宁波卫生院看诊,安静排队等待叫号,穿着朴素眼神着急

七星娱乐圈
2024-04-18 07:55:54
23年皇马生涯结束!罗马诺:预计纳乔6月离队,国米对他有意

23年皇马生涯结束!罗马诺:预计纳乔6月离队,国米对他有意

懂球帝
2024-04-20 01:47:15
27岁女子确诊阴道癌,痛苦不已,母亲:这个习惯,我多次劝她改

27岁女子确诊阴道癌,痛苦不已,母亲:这个习惯,我多次劝她改

荷兰豆爱健康
2024-04-18 20:31:35
2024-04-20 16:06:44
老胡说科学
老胡说科学
科学如此美妙,我想让你知道
1215文章数 33526关注度
往期回顾 全部

科技要闻

华为今年最关键的事曝光!Pura 70有新消息

头条要闻

上海地铁试点"闸机常开门"首日:有乘客在闸机前愣住

头条要闻

上海地铁试点"闸机常开门"首日:有乘客在闸机前愣住

体育要闻

米切尔这次对线不会输了吧

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

新华资管香港的秘密:猛投地产或致巨亏

汽车要闻

78.9万的极氪009光辉 让加价MPV无话可说

态度原创

时尚
艺术
本地
手机
公开课

40岁女人夏天通勤试试这样搭配!时尚、大方、高级,很显气场

艺术要闻

“妮可·巴菲特:疗伤一代”亚洲大展启幕 千禧世代的疗伤之旅

本地新闻

春色满城关不住|千阳春日限定美景上线了!

手机要闻

4月19日OPPO A3 Pro正式开售 京东手机小时达下单 1小时到手新机

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版