网易首页 > 网易号 > 正文 申请入驻

顾险峰:看穿机器学习的黑箱

0
分享至

转自老顾谈几何

公众号ID:conformalgeometry

作者:顾险峰

图1. 基于最优传输映射(Optimal Mass Transportation Map)的保面积映射(area-preserving mapping)。

今天老顾讲解了Wasserstein GAN模型和最优传输理论的几何解释,详细给出了W-GAN中关键概念的几何理解,包括概率分布(probability distribution)、最优传输映射(Optimal Mass Transportation Map)、Brenier势能、Wasserstein距离等等。理论上,深度学习领域中常用的概率生成模型(Generataive Model)都可以用最优传输理论来分析,随机变量生成器都可以用最优传输映射来构造。相比于传统神秘莫测的深度神经网络(DNN),最优传输映射是完全透明的,用最优传输理论来探索深度神经网络,可以帮助我们更好的理解深度学习的本质。今天,很多研究生和几位教授听了老顾的讲座,随后和老顾展开了热烈的讨论,并对一些基本问题展开了深入的交流。下面,老顾开始撰写下一次的课程讲义。

深度学习的方法强劲有力,几乎横扫视觉的所有领域,很多人将其归功于神经网络的万有逼近能力(universal approximation property):给定一个连续函数或者映射,理论上可以用(一个包含足够多神经元的隐层)多层前馈网络逼近到任意精度。对此,老顾提出另外的观点:有些情况下,神经网络逼近的不是函数或映射,而是概率分布;更为重要的,逼近概率分布比逼近映射要容易得多。更为精密的说法如下:在理想情况下,即逼近误差为零的情形,如果神经网络逼近一个映射,那么解空间只包含一个映射;如果神经网络逼近一个概率分布,那么解空间包含无穷个映射,这些映射的差别构成一个无穷维李群。

我们这一讲就是要证明这个观点,所用的工具是(包括无穷维)微分几何。

二十年前,老顾在哈佛学习的时候,Mumford教授、师兄朱松纯就已经系统性地将统计引入视觉,他们提出了用图像空间中的概率分布来表示视觉概念的纲领。今天,一些深度学习的模型(例如GAN)所遵循的原则和他们的纲领是一脉相承的。这也正是老顾更为看好逼近概率分布,而非逼近映射的原因之一。

概率生成模型

那么

给出了随机变量,符合单位区间的均匀分布(uniform distribution)。由均匀分布,我们可以生成任意的概率分布。例如,我们可以构造一个映射

将单位正方形上的均匀分布映射成平面上的高斯分布:

图2. 怪兽的最优传输映射。

在上一讲中,我们给出了最优传输理论的几何解释。给定一个区域

,其上定义着两个概率测度

,则唯一存在一个最优传输映射

,将概率分布

映射成概率分布

,亦即对于一切可测集合

这个最优传输映射是某个凸函数的梯度映射,这个凸函数被称为是Brenier势能函数,满足蒙日-安培方程。如图2所示,我们将怪兽曲面(第一帧和第四帧)保角地映射到平面圆盘上面(第二帧),保角映射将曲面的面积元映射到平面上,诱导了平面圆盘上的一个概率测度。平面圆盘上也有均匀概率分布(第三帧),从第二帧到第三帧的映射为最优传输映射。图1和图3显示了基于最优传输映射的曲面保面积参数化(Surface Area-preserving Parameterization)。

图3. 基于最优传输映射(Optimal Mass Transportation Map)的保面积映射(area-preserving mapping)。

在Wasserstein生成对抗网络中(Generative Adversarial Network), 生成器(generator)可以被抽象为一个非线性映射。将全空间映到自身,同时将均匀概率分布映射成概率分布,,同时尽量极小化概率分布和真实数据概率分布之间的Wasserstein距离。那么,我们的问题是:

满足保持测度条件的映射是否唯一?如果不唯一,又有多少?

对于这个问题的彻底解答需要用到映射极分解理论(Mapping Polar Decomposition)。

映射极分解理论

我们考虑所有的可微双射,满足条件。存在唯一的最优传输映射,它是Brenier势能函数的梯度映射。映射的极分解理论就是说可以分解成两个映射的复合(composition),

,

这里映射保持初始测度不变,因此的雅克比行列式处处为1。所有这种在映射复合的意义下构成一个李群(Lie Group),被称为是保体积微分同胚群(Volume-Preserving Diffeomorphisms),记为。我们下面来说明,这个李群是无穷维的。

图4. 曲面上的光滑矢量场。

如图4所示,我们在曲面上构造一个光滑切向量场

,则切向量场诱导了曲面到自身的一个单参数微分同胚群

,满足常微分方程:

直观上,切向量场可以视作曲面上的一个流场,每一点p依随这个流场流动,流动的速度向量等于矢量场在p点处的切向量。在时刻 t,流场初始点到终点的映射,就给出了微分同胚

。那么,如果切矢量场的散度(divergence)处处为0,则

的雅克比行列式处处为1,即不可压缩流场诱导保体积微分同胚。这一点,可以用嘉当的神奇公式来证明(Cartan's Magic Formula)。

我们来仔细解释嘉当的神奇公式。我们以平面为例,平面的面元是一个2阶微分形式(2-form)

。考察任意一个区域

,在微分同胚

下的像为区域

。像的面积为

那么

关于时间t的导数被称为面元

关于矢量场

的李导数(Lie Derivative),记为

嘉当的神奇公式具有形式:

这里d是外微分算子。在平面上,

为2-形式,因此

恒为0。如果矢量场

散度处处为0,则

恒为0。直接计算得到:

因此 我们得到

因此面元

关于矢量场

的李导数为零。微分同胚

保持面元不变,

的雅克比行列式处处为1。

由此可见,曲面上不可压缩流场(散度为0的切矢量场)诱导保面积微分同胚。曲面上任选一个光滑函数,其梯度场旋量处处为0。在曲面上任意一点p处,我们将梯度向量围绕法向量逆时针旋转90度,所得的矢量场散度处处为0。我们知道,曲面上的函数是无穷维的,因此无散场也是无穷维的,保面积微分同胚群也是无穷维的。

我们现在可以回答上面提出的问题,满足保持测度条件

的映射

不唯一;所有这种映射可以表示成保体积微分同胚和最优传输映射的复合;保体积微分同胚是无穷维的。

连接着两个同胚

。这条路径的长度可以计算

两个保体积微分同胚之间的距离定义为连接它们的所有路径长度中最短者。用这个度量,我们可以定量测量两次训练结果的内在差异程度。保体积微分同胚群的度量几何(无穷维微分几何)在视觉领域和医学图像领域被作为形状空间的一种理论工具。

小结

通过以上讨论,我们看到如果用一个深度学习的网络来逼近一个映射,解空间只有一个映射;如果来逼近一个概率分布,则解空间为无穷维的保体积微分同胚群。因此,用深度学习网络来逼近一个概率分布要比逼近一个映射、函数容易得多。这或许可以用来解释如下的现象:基于老顾以往的经验,我们用神经网络来求解非线性偏微分方程,要比用神经网络给图像分类困难,因为前者需要精确逼近泛函空间中的可逆映射,而后者需要逼近图像空间中的概率分布。

?本文为机器之心转载文章,转载请联系本公众号获得授权

?------------------------------------------------

加入机器之心(全职记者/实习生):hr@almosthuman.cn

投稿或寻求报道:editor@almosthuman.cn

广告&商务合作:bd@almosthuman.cn

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
破百+1!赵心童霸榜,世界排名创新高,PK小特争冠,冲击4大成就

破百+1!赵心童霸榜,世界排名创新高,PK小特争冠,冲击4大成就

刘姚尧的文字城堡
2026-04-05 07:00:00
万元悬赏卡皮巴拉“萌萌”,好消息:找到了,坏消息:又跑了,体型壮硕堪比小猪,蹿坏网后逃脱追捕

万元悬赏卡皮巴拉“萌萌”,好消息:找到了,坏消息:又跑了,体型壮硕堪比小猪,蹿坏网后逃脱追捕

观威海
2026-04-04 09:47:03
杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

千秋文化
2026-04-01 20:35:51
桥本赛后痛哭流涕!首次参赛止步8强 日媒:屈服世二后女队全出局

桥本赛后痛哭流涕!首次参赛止步8强 日媒:屈服世二后女队全出局

颜小白的篮球梦
2026-04-05 08:00:42
再见了《疯狂的冰箱》!上海主持路易辞掉铁饭碗,48岁未婚藏心酸

再见了《疯狂的冰箱》!上海主持路易辞掉铁饭碗,48岁未婚藏心酸

橙星文娱
2026-04-05 11:01:32
大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

巢客HOME
2026-04-05 09:00:12
李一桐医院挂急诊背后:娱乐圈这股风气,该停了!

李一桐医院挂急诊背后:娱乐圈这股风气,该停了!

歪歌社团
2026-04-03 04:38:59
银行不会直说的潜规则:存款满50万,你就有资格提条件

银行不会直说的潜规则:存款满50万,你就有资格提条件

王二哥老搞笑
2026-04-03 01:16:36
空姐真的挺辛苦的

空姐真的挺辛苦的

微微热评
2026-04-05 10:10:26
招商蛇口裁员8902人

招商蛇口裁员8902人

地产微资讯
2026-04-05 10:33:19
下周国内成品油价格或继续上调

下周国内成品油价格或继续上调

第一财经资讯
2026-04-03 22:30:02
罕见!刘炜后新疆新帅格兰也离职 两任教练离队仅排倒数第四

罕见!刘炜后新疆新帅格兰也离职 两任教练离队仅排倒数第四

醉卧浮生
2026-04-05 13:03:11
掘金官方力挺MVP!约基奇40+13+8+0失误完压文班 休媒:当世最强

掘金官方力挺MVP!约基奇40+13+8+0失误完压文班 休媒:当世最强

颜小白的篮球梦
2026-04-05 07:37:34
重要突破!科学家发现:注射一个肿瘤细胞,全身癌细胞竟然消失

重要突破!科学家发现:注射一个肿瘤细胞,全身癌细胞竟然消失

39健康网
2026-04-04 18:22:52
6站0冠!曝22岁张本智和绝望落泪+自责悔恨 2年前曾大喊:我想死

6站0冠!曝22岁张本智和绝望落泪+自责悔恨 2年前曾大喊:我想死

风过乡
2026-04-05 11:08:11
蔡磊渐冻症是假的?本人发文亲自回应!

蔡磊渐冻症是假的?本人发文亲自回应!

芳华青年
2026-04-04 20:45:22
日媒:一伊朗籍男子在日本被殴打致死,日本警方展开调查

日媒:一伊朗籍男子在日本被殴打致死,日本警方展开调查

环球网资讯
2026-04-05 11:05:40
蓝营震荡!郑丽文再获一大靠山,大佬集体转向,唯有一人不肯低头

蓝营震荡!郑丽文再获一大靠山,大佬集体转向,唯有一人不肯低头

共工之锚
2026-04-04 19:28:55
22.99万起的凯迪拉克XT5,正把豪华车市逼向绝路?

22.99万起的凯迪拉克XT5,正把豪华车市逼向绝路?

道哥说车
2026-04-04 10:51:41
地球将在2026年8月12日“失重7秒”死4000万人?谣言!!!

地球将在2026年8月12日“失重7秒”死4000万人?谣言!!!

大道微言
2026-04-03 12:22:13
2026-04-05 15:28:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12681文章数 142612关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

特朗普:获救的美飞行员受伤 营救行动中无美国人伤亡

头条要闻

特朗普:获救的美飞行员受伤 营救行动中无美国人伤亡

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

房产
亲子
家居
健康
时尚

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

亲子要闻

星火成炬|小小世界,慢慢长大

家居要闻

温馨多元 爱的具象化

干细胞抗衰4大误区,90%的人都中招

女人不管多大年纪衣服不要随便穿,这些穿搭可借鉴,优雅显瘦

无障碍浏览 进入关怀版