网易首页 > 网易号 > 正文 申请入驻

扩散模型=进化算法!生物学大佬用数学揭示本质

0
分享至

新智元报道

编辑:alan

【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。

扩散模型居然就是生物的进化算法!

这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:

论文地址:https://arxiv.org/pdf/2410.02543

论文的压轴大佬是美国发育和合成生物学家Michael Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。

Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:

视频地址:https://youtu.be/RjD1aLm4Thg

在ALife 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。

这位懂计算机的生物学专家是如何理解「扩散模型就是进化算法」的?

答案是数学。

扩散模型的本质

在生物圈中,至少有两个过程能够泛化并创造新事物:

进化:生物通过自然选择适应环境的缓慢过程(需要多代); 学习:生物个体获取知识并概括主观经验的快速过程(自己这一代)。

研究者不断探索进化与学习之间的联系,从Hinton的经典著作《How Learning Can Guide Evolution》(1987年),到Vanchurin、Wolf、Katsnelson、Koonin的《Toward a theory of evolution as multilevel learning》(2022年),以及Watson和Levin的《The collective intelligence of evolution and development》(2023年)。

目前的工作认为,在扩散模型的框架中,生成模型执行顺序随机去噪,可以通过执行自然选择、突变和生殖隔离的进化过程来理解。

前向扩散过程将图像作为输入(也可以是任何其他信号),并逐步按顺序添加噪声,直到它变成一坨完完全全的噪声。

与之相对,扩散模型的反向是一个去噪的过程,以噪声作为输入并依次去除,最终发掘出隐藏在噪声背后的图像。

原始扩散模型:https://arxiv.org/abs/2006.11239

想象一个复杂的任务(例如,找到飞机机翼的最佳形状),我们可以先创建一组随机解决方案——就像自然界中的生物种群。然后根据特定标准(比如飞行情况)评估每个解决方案。

过程中可以「杂交」不同解决方案的优势(从一个方案中获取一些参数,从另一个方案中获取另一些参数),偶尔还可以随机改变这些方案(的参数),由此获得新一版解决方案。

将这个过程重复多次,就像在自然选择中一样,通过遗传和变异,更成功的版本存活下来并继续发展。

通常,参数空间的结构事先是未知的,因此初始总体通常以标准正态分布开始。这种方法的主要优点是它不需要精确理解任务的工作原理——只需能够评估解决方案的质量就足够了。

扩散模型在每个时间步长直接从样本的噪声中预测原始数据样本:

样本x的估计可以表示为条件概率,结合贝叶斯公式可得:

基于深度学习的扩散模型是使用均方误差损失进行训练的,所以估计函数变为:

其中的高斯项仅对局部邻居敏感,将上式简化:

由此可知,扩散模型和进化算法都涉及迭代数据更新和从复杂分布中对新对象进行采样,两者都是定向更新和随机扰动的组合。

在进化的情况下,是选择+突变,而在扩散的情况下,是随机噪声+学习去噪。

这就提出了一个问题:这两个过程的机制是否从根本上相互关联?生物进化和生成建模之间是否存在深刻的数学二元性?

扩散与进化

首先,作者从生成模型的角度分析了进化。

观察生物圈中的物种种群,变异进化过程可以理解为基因型和表型分布的转变。突变和选择共同改变了这些分布的形状。

许多受生物启发的进化算法都是通过维护和迭代大量种群的分布,来优化目标函数。

同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。

另一方面,也可以从进化的角度来看待扩散。

在训练过程中,向数据点逐步加入干扰,模型会学习预测这种干扰以逆转该过程。在采样阶段,模型从高斯分布开始,通过降噪逐步更新数据点。

在这种情况下,定向降噪可以解释为有向选择,并且每个步骤都会增加一个类似于突变的小噪声,与生物的进化过程一致。

而如果把进化过程反过来,那么高度适应自然的进化种群将逐渐溶解,类似于正向扩散过程。

考虑统计物理学中的能量和概率,进化任务可以将适应度映射到概率密度,从而来与生成任务联系起来(高适应度对应于高概率密度)。

作者最终从数学上推导出了一种称为Diffusion Evolution的新算法,基于迭代误差校正来进行优化,类似于扩散模型,但不依赖于神经网络:

1)从一组随机解开始(如扩散模型中的噪声); 2)在每个步骤中,每个解决方案都由一个适应度函数评估,对每个解决方案进行「去噪」(与相邻解决方案加权平均来估计),并向前迈出一小步,同时加入一个小的随机突变; 3)逐渐减小相邻搜索半径(首先全局探索解决方案空间,然后在本地进行优化)

与许多经典进化算法通常收敛为单个解不同,Diffusion Evolution可以同时发现并维护多个表现良好的解。

实验

研究人员在多个二维优化场景中进行了实验(Rosenbrock和Beale有一个最优值,Himmelblau、Ackley和Rastrigin有多个最优值),并与其他进化算法(CMA-ES、OpenES和PEPG)做出比较。

每种方法运行进化算法100次,每个实验的群体规模为512,使用25次迭代(OpenES需要1000步才能收敛)。

结果表明,Diffusion Evolution找到了高质量和多样化的解决方案,尤其是在最后三种情况下,其他方法都遇到了困难,并且往往收敛到单一解决方案。

在进化算法中,适应度评估通常是计算成本最高的操作,作者通过从扩散模型的工作中借用余弦调度来减少迭代次数。

在另一项实验中,研究人员提出了 Latent Space Diffusion Evolution,灵感来自潜在空间扩散模型 (通过探索低维潜在空间来解决高维参数空间的问题)。

学习和进化,本质上是在做同样的事情,顺着这条路,我们可以继续思考:

模型推理是有限的,而真正的进化可能是无限且开放式的,如何使Diffusion Evolution适应开放式环境?

其他版本的扩散模型会衍生出新的进化算法吗?扩散模型中的归纳偏差可以被引入进化算法吗?扩散模型可以通过进化的思想来改进吗?

参考资料:

https://gonzoml.substack.com/p/diffusion-models-are-evolutionary

https://arxiv.org/pdf/2410.02543

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
9月降息,北京房价继续下跌

9月降息,北京房价继续下跌

有事问彭叔
2025-09-12 18:00:55
卢卡斯:巴黎赛程密集而我们状态正佳,希望伤员们情况不太严重

卢卡斯:巴黎赛程密集而我们状态正佳,希望伤员们情况不太严重

直播吧
2025-09-15 02:46:10
“南京大屠杀纯属捏造”,公开称日本无需道歉的马立诚,如今怎样

“南京大屠杀纯属捏造”,公开称日本无需道歉的马立诚,如今怎样

刘浶开挖机
2025-08-17 10:15:46
河南省委书记率团访问期间,坐进了飞机驾驶室

河南省委书记率团访问期间,坐进了飞机驾驶室

政知新媒体
2025-09-13 23:55:55
66岁毕福剑也没想到,自己败光的体面,如今被29岁的女儿挣了回来

66岁毕福剑也没想到,自己败光的体面,如今被29岁的女儿挣了回来

心静物娱
2025-09-03 13:47:40
取代伊萨克!纽卡9500万新援首秀建功 赛后获评全场最佳

取代伊萨克!纽卡9500万新援首秀建功 赛后获评全场最佳

球事百科吖
2025-09-14 04:32:00
WTT澳门冠军赛,王楚钦4-0完胜巴西名将雨果,成功捧起冠军奖杯!

WTT澳门冠军赛,王楚钦4-0完胜巴西名将雨果,成功捧起冠军奖杯!

大眼瞄世界
2025-09-15 00:06:14
Google Gemini 登顶最佳免费 iPhone 应用

Google Gemini 登顶最佳免费 iPhone 应用

cnBeta.COM
2025-09-15 02:27:06
如果在家突发脑梗,黄金自救“5步骤”,奉劝你每个都要记在心里

如果在家突发脑梗,黄金自救“5步骤”,奉劝你每个都要记在心里

爆炸营养彭鑫蕊
2025-09-12 16:27:58
签了,老将底薪!老子不等了!去TM勇士,留着库明加自己玩吧

签了,老将底薪!老子不等了!去TM勇士,留着库明加自己玩吧

张家大院趣说天下事
2025-09-14 06:30:10
2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

归史
2025-08-27 14:29:47
史记:“E杯傲世”宫西光列传

史记:“E杯傲世”宫西光列传

一代文嚎
2025-09-02 12:35:25
吴艳妮发文回应世锦赛止步预赛:有遗憾,这个周期中国女子栏没有缺席任何世界大赛,我永远是最顽强的那个存在

吴艳妮发文回应世锦赛止步预赛:有遗憾,这个周期中国女子栏没有缺席任何世界大赛,我永远是最顽强的那个存在

极目新闻
2025-09-14 12:24:39
于朦胧母亲悲痛发声:儿子是我最大骄傲,如今要替他完成最后心愿

于朦胧母亲悲痛发声:儿子是我最大骄傲,如今要替他完成最后心愿

甜柠聊史
2025-09-14 08:46:44
王思聪上海豪宅再次降价出售,还是难找买主!偌大豪宅只能装灰尘

王思聪上海豪宅再次降价出售,还是难找买主!偌大豪宅只能装灰尘

娱乐团长
2025-09-12 22:01:51
基因好是啥体验?网友:精力旺盛真的是天赋基因,这种人都不胖

基因好是啥体验?网友:精力旺盛真的是天赋基因,这种人都不胖

带你感受人间冷暖
2025-09-15 00:05:16
江西外卖员刘乐被执行死刑,手戴镣铐与妻子告别:来世再见

江西外卖员刘乐被执行死刑,手戴镣铐与妻子告别:来世再见

人间百态大全
2025-09-11 06:54:55
A股:明天,9月15号,迎来一个重要信号!将出现更大级别上涨?

A股:明天,9月15号,迎来一个重要信号!将出现更大级别上涨?

史书无明
2025-09-14 17:07:41
瓜迪奥拉:我们仍有诸多需要改进之处,福登本场发挥堪称卓越

瓜迪奥拉:我们仍有诸多需要改进之处,福登本场发挥堪称卓越

雷速体育
2025-09-15 02:24:10
朝鲜导游含泪坦言:中国游客有钱,但请别用优越感刺伤我们的尊严!

朝鲜导游含泪坦言:中国游客有钱,但请别用优越感刺伤我们的尊严!

百姓识天下
2025-09-11 22:06:13
2025-09-15 03:07:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13445文章数 66149关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

罗永浩向贾国龙重新开战:我看你智力有问题 不可救药

头条要闻

罗永浩向贾国龙重新开战:我看你智力有问题 不可救药

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

游戏
时尚
家居
亲子
军事航空

《隐形守护者》导演新影游demo15日上线!有金发美女

听说现在年轻人的家都“歪七扭八”的?

家居要闻

原木风格 温馨舒适氛围

亲子要闻

人才

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版