网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

教AI「择偶生娃」，复刻自然演化！上交校友提名最佳论文

2025-08-26 17:22:31　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：元宇好困

【新智元导读】Sakana AI以自然演化为灵感，提出了一种全新的模型融合进化方法M2N2。通过引入自然界的「择偶机制」，AI可以像生物一样「竞争、择偶、繁衍」。在当前全球算力短缺、模型训练实际规模受制的情况下，Sakana AI借助自然界的启示，为模型融合探索出了一条新路。

如果让AI模型像生物一样演化，它们会不会彼此竞争、协作、结合，并繁衍出越来越强的后代？

「物竞天择，适者生存」的进化论思想，是否也适用于AI模型？

就在最近，Sakana AI从自然演化的过程中汲取灵感，提出了一种利用「竞争与吸引力」的自然选择机制，来提升AI模型融合效果的方法。

Sakana AI认为，AI模型的发展，也和自然演化的过程类似：

集体智慧从群体中涌现。

比如：自然并没有创造单一的、巨大的单体生物，而是孕育了一个多样化的生态系统。在自然界的生态系统中，每一个个体通过竞争、合作与组合来适应环境、繁衍后代。

这正是Sakana眼中的AI世界该有的样子：

当人类不再试图构建一个庞大的单体AI，而是演化出整个AI生态系统，各个专业AI模型在其中竞争、合作、融合……这会带来什么？

他们没有简单停留在想象阶段，而是一直在探索模型融合，试图利用演化，来破解现有模型融合的「最佳配方」。

现在，他们把这个「最佳配方」公开了！

目前，相关研究已在GECCO 2025会议上发表，并荣获最佳论文提名奖！

论文地址：https://arxiv.org/abs/2508.16204

GitHub：https://github.com/SakanaAI/natural_niches

以往的模型融合，需要人工介入，手动定义模型的分割方式（例如，按固定的层或块）。

能不能让这个过程，也像自然界的演化那样，自动运行？

Sakana AI提出了M2N2（Model Merging of Natural Niches，自然生态位的模型融合），攻克了上述难题。

该方法来自于自然演化的三个关键思想：

演化融合边界：M2N2让模型的组合更为自由，打破了预定义的静态边界，大大拓宽了模型组合的探索空间和可能性。如同自然界交换可变长度的DNA片段，而非整个染色体。
多样性竞争：M2N2模仿了自然界的「丛林法则」，让模型们为了有限的资源（即训练集中的数据点）展开竞争，迫使模型走向专业化，寻找自己的「生态位」，从而创造出一个由多样化、高性能专家组成的种群，为优质模型的「繁衍」提供更多优秀的种子模型。
择偶机制：M2N2引入了一种「吸引力」启发式方法，它会根据模型的互补优势，智能地进行配对融合——即选择在对方弱项上表现出色的伙伴，这使得演化搜索的效率大幅提升，也大大降低了模型融合的计算成本。

这一尝试的结果，也令人振奋：M2N2模型融合技术，开始在模型演化中被成功应用，表现也优于其他演化算法。比如：

从随机网络演化出的MNIST分类器，性能媲美CMA-ES算法，但计算效率更高。
能够扩展到大型预训练模型，尤其是在数学和网络购物任务上，生成的融合模型表现显著优于其他方法。
在模型融合过程中，还避免了模型微调中「灾难性遗忘」的问题。

这让网友Aragon Dev感叹：

「2025年，智能体真比自己先找到对象」

M2N2：全新的模型进化方法

M2N2通过引入一种结合竞争、吸引力与带切分点的模型融合的全新进化方法，显著提升了模型融合的效果。

它首次将模型融合用于从零开始训练，并在性能与计算效率上优于所有当前的进化算法。

研究人员在将M2N2扩展至LLM与基于扩散的图像生成模型后，表现出了诸多优势。比如，它可以

稳定融合且避免灾难性遗忘
兼容不同目标训练的模型
通过避免梯度计算降低内存占用
在无需原始训练数据的情况下保留模型能力

在模型融合中，目标是在个初始模型中找到融合模型的最优参数∗，使得通常以任务分数的和/平均表示的优化目标最大化。

在M2N2中，研究人员对融合函数ℎ做出修改，使融合边界可进化。同时对优化目标，做出调整以促进多样解。

M2N2消除了固定的模型融合边界。

为摆脱固定融合边界的约束，研究人员通过探索更广泛的边界与系数，逐步扩展搜索空间，这一渐进引入复杂度的做法，既拓宽可能性，又保持计算可控。

对有限资源的竞争，天然会促进多样性。

研究人员通过修改优化目标来鼓励多样性。通过限制资源供给，M2N2激发竞争，自然偏好占据新生态位的个体。

他们的具体做法是：

将群体能从某个样本中提取的总适应度限制为容量。

候选解从获得的适应度，正比于其分数相对于群体总分的占比。

修改后的目标为：

在生物学中，这种结合（繁殖）代价高昂，因此动物会在择偶过程中投入大量资源。

M2N2额外考虑父本之间的互补性，通过逐步引入复杂度，在保持计算可控的同时扩大了可探索范围。

实验1：进化MNIST分类器

这项实验所优化的，是一个总计19,210个参数的两层前馈神经网络。

从零开始时，研究人员随机初始化模型。

对于预训练模型，研究人员构建了两个专门化模型：一个在数字0–4上训练，另一个在数字5–9上训练。

结果表明，在从零开始时，与其它模型融合方法相比，M2N2在测试准确率上有显著优势（图2左）。

对从零开始训练的模型，切分点与吸引力得分影响很小。但如图2右所示，当从预训练模型起步时，切分点变得至关重要，而吸引力在整个训练过程中都能显著提升性能。

在多样性方面，图3左展示了至少被库中一个模型正确标注的训练样本占比——训练覆盖率。

图3右侧，展示了群体性能多样性随训练的演化：

若所有模型对同一样本均对/均错，则熵为0（无多样性）；若模型在预测上均匀分裂，熵达最大1。

从图3中，可以看出M2N2的模型库，很快覆盖了绝大多数训练样本，并在整个训练过程中保持高覆盖。

图3还展示了所有样本的平均熵：M2N2在初期熵快速上升，随后随着低性能模型的灭绝而逐渐下降。

对比之下，MAP-Elites通过保留低性能模型持续提高多样性，但未能实现高覆盖。

总体来看：M2N2维持了一个优势互补的模型库，既促进有效融合，又会在训练推进时系统性地淘汰弱模型。

如图4显示，较小的库在起步更好，但更快收敛到较差解。

这表明应按计划的前向次数来扩展库大小。

值得注意的是，上图中库增大并不增加计算成本（前向次数不变），但会增加内存占用。对超大模型，可以将模型库存盘，而非常驻内存。

实验2：LLM数学专家与智能体融合

实验中，研究人员将数学专家WizardMath-7B-V1.0，与智能体环境专家AgentEvol-7B融合，目标是在数学基准GSM8k与网页购物基准WebShop上表现良好。

实验结果表明，表1显示M2N2得分最高。吸引力与切分点两项技术都至关重要，其中切分点技术更重要一些。

当融合数学与智能体技能时，CMA-ES得分较低，可能由于参数划分不佳，这强调了在优化过程中纳入融合边界的必要性。

如图5所示，MNIST的发现，还可推广到LLM融合。

如左图，自然生态位方法保持了高训练覆盖率；在模型探索不同生态位的早期，熵上升（右图）；随着低性能模型被移除、优势被聚合，熵逐步下降。

相比之下，MAP-Elites侧重最大化熵，但因为它保留了低性能模型，将牺牲训练效率与覆盖；GA 则迅速降低覆盖与熵，并「贪心」地收敛到其最优解，最终使整个库「塌缩」为单一解，熵接近零。

实验3：融合基于扩散的图像生成模型

在该实验中，研究人员评估了M2N2在融合多样文本到图像模型中的表现。

初始模型包括针对日文提示训练的JSDXL，以及主要由英文提示训练的三个模型：SDXL1.0、SDXL-DPO与Juggernaut-XL-v9。

这些模型共享的基础模型是SDXL 1.0的架构。

模型融合的主要目标，是在保留JSDXL理解日文提示能力的同时，整合各初始模型在图像生成方面的最佳能力。

表2展示了各模型在测试集上的表现，可以看出M2N2在测试集上的NCS分数优于所有其他模型。

图6展示了M2N2的融合模型，如何成功结合各初始模型的优势并缓解其弱点，展示了其在追求性能多样性与质量聚合方面的成功。

若不考虑融合模型，可以观察到每个初始模型在不同测试用例上，均可能产出最高与最低质量的结果。

此外，很难找到一个清晰模式，来描述每个模型的专长，或指导如何构造有效的自定义多样性度量。

M2N2的多样性保持机制，通过自动保留那些在其他模型表现不佳的样本上独特出众的模型，解决了这一难题。

M2N2融合模型，相对于初始模型有两点关键改进：

生成更逼真的照片，与我们使用真实照片的训练集更一致；
对输入标题的语义理解更强。

如图6中最右列展示，虽然若干初始模型生成了好看的自行车，但M2N2的融合模型不仅准确聚焦于标题中指明的「车牌号显示区域」，还生成了更像真实照片而非合成渲染的图像。

M2N2在语言理解能力上，也同样出色。

图7显示，M2N2融合模型对日语与英语都有良好理解。

这种涌现的双语能力体现了M2N2的一项关键优势：

它能够聚合互补能力，同时避免基于梯度训练常见的灾难性遗忘。

表3显示了M2N2融合模型显著优于其他模型，这在统计上印证了研究人员在定性结果中的观察。

模型融合的可行性高度依赖模型间的相似程度，但也存在一定限制：当微调模型与其基座模型显著偏离（通常由于大量、分歧的训练）时，融合会变得不可行。

表3中列出了基于100对样本，日文提示与其英文翻译生成图像的CLIP特征余弦相似度均值（±标准误），数值越高表明跨语言一致性越好。研究人员假设状态表示分歧较大的模型不适合融合。然而，尚无标准的模型兼容性度量。

若能定义此类度量，便可在预处理（如微调）中作为正则化使用，从而更好地控制兼容性并提升融合成功率。

研究人员认为，共同演化的模型会受到「保持可融合兼容性」的强烈进化压力。若某个模型偏离并与其他模型不兼容，将无法产生「可存活的后代」，致其改进停滞并最终灭绝。

验证这一假设，将有助于理解模型共演化的动力学。此外，将兼容性度量纳入吸引力启发式，可能促进不同「物种」模型的共演化（定义为彼此可融合、但与其他组不可融合的模型群体）。

作者简介

Yujin Tang

Yujin Tang是Sakana AI的主任研究科学家，研究方向包括强化学习、机器人学、进化算法和生成模型等。

他在东京大学获得计算机科学博士学位，在早稻田大学获得硕士学位，并在上海交通大学获得学士学位。

在加入Sakana AI之前，他曾是Google DeepMind和Google Brain的高级研究科学家。

参考资料：

https://x.com/SakanaAILabs/status/1959799343088857233%20%20

https://arxiv.org/abs/2508.16204

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

LeetCode C++近满分！Autogenesis要给智能体装上自进化操作系统

机器之心Pro 2026-05-31 19:50:42
0 跟贴 0
超越单体智能｜多智能体系统的协作、归因与自我演化综述

机器之心Pro 2026-05-31 19:46:15
2 跟贴 2

内存暴降50倍，MIT提出注意力匹配，能终结大模型显存危机吗？

机器之心Pro 2026-05-31 19:40:19
1 跟贴 1

AI 杀入医药界，一日两登 Nature，已发现 3 种抗癌药

生物学霸 2026-05-31 17:17:09
0 跟贴 0
朱旻琦：具身智能用一天进化一天、聪明一天机器人普及核心痛点是需要二次开发和适配

财联社 2026-04-17 16:59:02
0 跟贴 0

复旦铁三角：开辟最优物理AI路径！时空一体世界动作模型问世

新智元 2026-05-31 13:08:37
3 跟贴 3

Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC2026

量子位 2026-05-31 18:04:54
0 跟贴 0
τ0-WM：最大规模预训练的开源具身世界模型来了

量子位 2026-05-31 15:37:06
3 跟贴 3

清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

机器之心Pro 2026-05-31 18:26:33
0 跟贴 0
高盛加入“AI瓶颈交易”：MLCC是新存储，已成AI服务器GPU和内存后“第三大成本”

华尔街见闻官方 2026-05-31 20:54:26
2 跟贴 2
DDIM之父宋佳铭，宣布离职

量子位 2026-05-31 22:29:09
1 跟贴 1
只懂AI不懂ESG的企业，无法穿越周期

财天COVER 2026-05-31 23:44:01
0 跟贴 0
人大主办！全球青年科学家共话AI未来

智东西 2026-05-31 21:02:16
0 跟贴 0
南开通报论文问题

弓立军 2026-05-31 10:57:28
0 跟贴 0
大理小伙子把打跳当论文标题，将大理打跳音乐带到甘肃答辩现场

大理融媒 2026-05-31 09:39:21
0 跟贴 0
深度长文：统治地球1.6亿年的恐龙，为何从未演化出文明？

宇宙时空 2026-05-29 20:15:05
1 跟贴 1
交通 | 推荐几本整数规划、数学优化、设施选址领域的学术专著

新浪财经 2026-05-31 23:45:59
0 跟贴 0
微软开启Skills自我进化！像训练神经网络一样训练技能

机器之心Pro 2026-05-31 18:18:22
0 跟贴 0
中山大学通报康某某、邝某某相关学术论文图片及数据存疑问题：2人被免职

环球网资讯 2026-05-30 20:40:09
2 跟贴 2
男子在河边处理动物，从没见过这种生物，没看到它的头在哪！

书夫星爱生活 2026-05-28 16:16:04
3 跟贴 3
40天干翻五位学术顶流！被学术圈驱逐的博士，如今被逼到绝境？

保德全 2026-05-30 09:59:23
50 跟贴 50
耿同学：治疗男性妇科疾病，山东大学齐鲁医院的论文，这不胡闹么

夏洛老湿 2026-05-30 04:07:30
1000 跟贴 1000
迪迪虾来了！比亚迪全车智能体正式落地

唐长老KAI 2026-05-31 04:49:45
11 跟贴 11
媒体：印度多个领域面临严重问题莫迪发出罕见的号召

上观新闻 2026-05-31 19:14:08
9198 跟贴 9198
港中文新优化器Pion：在等谱流形上更新大模型

机器之心Pro 2026-05-31 19:31:39
0 跟贴 0
德国小镇信鸽被注药水上演迷失大戏

小眼睛小世界 2026-05-31 06:18:41
114 跟贴 114
吉大！讲义气！

深度报 2026-05-31 22:49:32
0 跟贴 0
印度神童阿南德发2025预言，AI导致全球瘫痪，他看完数据后背发凉

纸鸢奇谭 2026-05-31 23:33:03
0 跟贴 0
毕业生论文致谢保卫处走红，当事人：教会我用善意的眼光对待生活

星视频 2026-05-30 19:42:02
0 跟贴 0
西北师范大学生命科学学院原院长宁应之逝世，弥留之际，将学生论文答辩事宜委托给同事

澎湃新闻 2026-05-30 19:58:13
0 跟贴 0
这样的实验，是多少人想做的，结果并不是大家想的那样！

趣萌生活馆 2026-05-31 18:03:33
3 跟贴 3
"论文改了八稿，简历投了百份"被指冒犯毕业生，网点回应已撤下

看度新闻 2026-05-31 08:23:06
0 跟贴 0
智能体从「单兵作战」到「精锐团队」 -2

机器之心Pro 2026-04-28 16:56:00
0 跟贴 0
一名青椒的非典型周日晚上

向湾硚 2026-05-31 22:05:35
0 跟贴 0
算法收车：德国汽车交易“去人工化”实录

闪存猎手 2026-06-01 04:33:12
0 跟贴 0
7k星标的开源skill，给你组一支AI科研团队

量子位 2026-05-16 19:58:50
0 跟贴 0
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
高考作文考科技千万别这么写不能写成论文，科技的硬，必须包裹上文化的软

托塔老师 2026-05-31 15:15:26
0 跟贴 0
阅读量上不去？你可能一直在犯这3个低级错误

云朵偷喝奶茶 2026-06-01 02:30:36
0 跟贴 0
中国代表"香会"向菲律宾防长提问菲防长现场大放厥词

北京日报 2026-05-31 21:15:10
5981 跟贴 5981

2026 医保飞检风暴：医院空了，医护闲了，绩效却只剩 2 元？

2026 医保飞检风暴：医院空了，医护闲了，绩效却只剩 2 元？

医客

2026-05-31 12:06:27

33分惨案夜！广厦揪4战犯，暴露3大不争事实，杨鸣一针见血真敢说

33分惨案夜！广厦揪4战犯，暴露3大不争事实，杨鸣一针见血真敢说

后仰大风车

2026-05-31 22:55:35

窦骁妈妈惊现神级气质！对比何超莲妈妈，网友：婆婆赢在了骨相里

窦骁妈妈惊现神级气质！对比何超莲妈妈，网友：婆婆赢在了骨相里

一盅情怀

2026-05-31 14:49:21

她新疆出生、湖南血脉、回族妈妈养大，北漂20年，两段情别离

她新疆出生、湖南血脉、回族妈妈养大，北漂20年，两段情别离

笑饮孤鸿非

2026-05-31 14:00:39

1-0大冷！中国男足以小打大赢了，等了整整7年，短短15天双杀沙特

1-0大冷！中国男足以小打大赢了，等了整整7年，短短15天双杀沙特

侃球熊弟

2026-05-31 23:03:13

正大量上市，钾含量是苹果8倍，6月使劲吃，腿脚有劲，精神饱满

正大量上市，钾含量是苹果8倍，6月使劲吃，腿脚有劲，精神饱满

阿龙美食记

2026-05-28 16:48:12

还是人家懂事！新加坡防长:请不要用“低级别”称呼中方代表团

还是人家懂事！新加坡防长:请不要用“低级别”称呼中方代表团

阿龙聊军事

2026-06-01 05:40:07

男子把软卧让给一老人，过道坐一晚，谁料，第二天发现口袋多了180块和一张纸条：有需要，找我儿子

男子把软卧让给一老人，过道坐一晚，谁料，第二天发现口袋多了180块和一张纸条：有需要，找我儿子

背包旅行

2026-05-31 15:26:58

总决赛三战33助攻仅4失误！古德温稳居FMVP榜首答案+保罗合体？

总决赛三战33助攻仅4失误！古德温稳居FMVP榜首答案+保罗合体？

颜小白的篮球梦

2026-05-31 21:24:54

赵海燕儿子大婚，儿媳漂亮长得像混血儿，大姑闫学晶未出席婚礼

赵海燕儿子大婚，儿媳漂亮长得像混血儿，大姑闫学晶未出席婚礼

TVB的四小花

2026-05-31 17:16:46

奥斯卡影后出道15年：从现象级爆红到人间蒸发

奥斯卡影后出道15年：从现象级爆红到人间蒸发

追星雷达站

2026-06-01 01:17:04

第一批失业的8090后，可能已经没班可上了

第一批失业的8090后，可能已经没班可上了

霹雳炮

2026-05-31 22:53:03

云南鸵鸟肉案凶手被判死刑，当地曾多人购买，这些人后来怎样了

云南鸵鸟肉案凶手被判死刑，当地曾多人购买，这些人后来怎样了

林林故事揭秘

2025-01-03 17:30:21

35页ＰＰＴ疯传：洛阳女子1女谈3男，每天卡时间，都已谈婚论嫁

35页ＰＰＴ疯传：洛阳女子1女谈3男，每天卡时间，都已谈婚论嫁

烈史

2026-05-30 13:23:41

别墅搜出23件国宝，全家集体失联！整整17年，徐湖平案终于落幕

别墅搜出23件国宝，全家集体失联！整整17年，徐湖平案终于落幕

鉴史录

2026-05-31 12:57:55

55岁汪峰给所有男人提了个醒：可以老、可以胖，但穿衣打扮要注意

55岁汪峰给所有男人提了个醒：可以老、可以胖，但穿衣打扮要注意

寻墨阁

2026-05-31 12:49:15

负债824亿、账上只剩82亿：一群猪，把700亿富豪逼上了悬崖

负债824亿、账上只剩82亿：一群猪，把700亿富豪逼上了悬崖

历史伟人录

2026-05-31 18:28:28

红土女王出局！斯瓦泰克0-2止步16强，法网女单将决出新冠军

红土女王出局！斯瓦泰克0-2止步16强，法网女单将决出新冠军

全景体育V

2026-05-31 19:00:21

50岁后才懂，夏天的热是最好的补药

50岁后才懂，夏天的热是最好的补药

诗词天地

2026-05-30 06:00:13

一个家最好的风水，从来不是优秀的孩子，而是被善待的妈妈

一个家最好的风水，从来不是优秀的孩子，而是被善待的妈妈

青苹果sht

2026-05-30 05:15:46

AI产业主平台领航智能+时代

15351文章数 66894关注度

往期回顾全部

科技要闻

戴尔诺基亚又回来了！AI重估老牌科技公司

头条要闻

特朗普生日白宫办格斗赛近距离观赛花超100万美元

头条要闻

特朗普生日白宫办格斗赛近距离观赛花超100万美元

体育要闻

阿森纳用最悲壮的方式，成就了巴黎王朝

娱乐要闻

朱军退休，正义虽迟但到，女方受惩

财经要闻

医学首席转岗搞科技，A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百领克10+&领克10上市16.99万元起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

时尚

房产

教育

游戏

亲子要闻

好想快进到这几期啊！

梓渝：慢下来，也很好

房产要闻

红动五月！全国抢入核心资产，广州盯紧凯旋新世界！

教育要闻

跟以前相比，文光成绩断崖式下跌的原因是多方面的，其中最主..

《巫师3》资料片“血与酒”发售十周年纪念贺图发布

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版