网易首页 > 网易号 > 正文 申请入驻

数字生命「培养皿」里,AI竟然学会了打架、结盟、抢地盘

0
分享至


来源:机器之心报道

一直以来,关于人工生命(Artificial Life, ALife)的研究致力于回答这样一个问题:生命的复杂性能否在计算系统中自然涌现?

这一探索的核心目标,被称为开放式复杂化(open-ended complexification)—— 让人工系统能够像生物世界一样,在持续的适应与演化中自发产生新的结构与功能。

近年来,NCA(Neural Cellular Automata,神经细胞自动机)为这种探索提供了新的思路。它们能够在局部规则下展现分布式生长与自组织能力。然而,大多数 NCA 模型仍基于单一、固定的结构,难以突破演化的封闭边界。

在这样的背景下,来自Sakana AI的研究者提出了一种新的 ALife 模拟系统 ——PD-NCA( Petri Dish Neural Cellular Automata)。在该系统中,多个 NCA 智能体在同一环境中竞争,它们的唯一目标是实现自我复制(self-replication)。

PD-NCA 与传统的 NCA 框架有着显著不同:

  • 传统的 NCA 通常由单一、固定的模型在网格上运行,其参数在训练完成后保持不变;

  • 而在 PD-NCA 中,Sakana AI 引入了一个由多个独立且持续学习的 NCA 构成的种群。

每个 NCA 都拥有自己独立的神经网络参数,并在模拟过程中通过基于梯度的持续优化不断更新与适应。

这些智能体共享一个共同的空间基质 —— 即所谓的培养皿(Petri Dish)。

在这个培养皿中,不同 NCA 之间通过可微分的攻击与防御通道进行交互,表现出既竞争又合作的动态关系。

与传统 NCA 不同,后者的形态发生过程通常是根据预训练规则以确定性方式展开的;PD-NCA 则通过 learning-in-the-loop 的机制,让学习过程本身参与到模拟之中,从而实现开放式的适应与复杂性涌现。

换言之,在一个可微的、动态学习的环境中,生命体样的结构不再被预先设定,而是能在交互、进化与竞争中自行演化出丰富的行为与形态。


  • 论文标题:Petri Dish Neural Cellular Automata

  • 论文地址:https://pub.sakana.ai/pdnca/

  • 项目地址:https://github.com/SakanaAI/petri-dish-nca

在 PD-NCA 中,每一个个体都在努力扩张自身,同时学习如何适应环境并超越邻近的竞争者。

结果显示,PD-NCA 能够产生多种复杂的涌现行为,例如周期性动态(cyclic dynamics)、领地防御(territorial defense)以及自发协作(spontaneous cooperation)。

下方的视频展示了多次模拟过程中不断演化出的丰富变化与复杂性 —— 每一种颜色代表不同的 NCA 个体。

方法介绍


模拟在一个离散的空间网格上运行。你可以把它想象成一个棋盘,它有特定的宽度(W)和高度(H)。

在棋盘的每一个格子上,都存储着一组信息,称为通道(C)。

在任何一个时间点(t)和网格位置(x,y),该格子的状态(s)都由一个特征向量来定义。这个向量包含了三个关键部分:攻击通道(a)、防御通道(d)、隐藏状态(h)。


在模拟的每一个时间步,都会依次经历以下四个阶段:处理(Processing)、竞争(Competition)、归一化(Normalization)、状态更新(State Update)。

处理阶段

每个 NCA 智能体(可以理解为模拟中的「玩家」)本身都是通过一个卷积函数来定义的。

这个函数会「观察」某个位置(x,y)及其邻近区域(N)的状态,然后生成一个「状态更新提议(Δs)」,也就是它「希望」这个格子在下一刻变成什么样。


智能体能否提出这个「提议」,受到一个「存活掩码(A)」的控制。简单来说,智能体只能在它自己存活的格子或紧邻的格子里提出更新建议。

  • 背景环境(一个恒定的对手)

为了确保模拟始终充满活力,尤其是在某个区域只有一个智能体「活着」的情况下研究人员引入了一个静态的「背景环境(E)」

它就像一个恒定的背景竞争者,在模拟开始时随机初始化一次,然后就固定不变。

这个「背景环境」也会像智能体一样,在每个格子上提出它自己的「更新提议」。这确保了所有智能体必须时刻保持积极的攻击和防御,以对抗这种持续的背景压力,从而防止「躺平」或停滞

竞争阶段

这是决定谁的「提议」更重要的阶段。

研究者设计了一个基于实力的「仲裁机制」。在任何一个格子上,任意两个实体(比如智能体 i 和智能体 j)之间的「互动强度()」是这样计算的:


一个智能体 i 在某个格子上的「总竞争力()」就是它与所有其他智能体的互动强度,再加上它与背景环境的互动强度的总和。



归一化阶段

为了模拟环境中「资源有限」的特性,研究者采用 Softmax 归一化操作。

这个步骤会把所有智能体和背景环境的「总竞争力()」转化成各自的「贡献权重(w)」。

这个权重代表了在最终更新状态时,每个智能体的「提议」占多少分量。


计算式中的「温度参数(τ)」用来控制竞争的「尖锐程度」。温度越低,竞争越激烈,第一名的优势就越大。

状态更新阶段

最后,网格的下一个新状态()是这样决定的:

当前的旧状态(),加上所有实体(包括背景环境)的「更新提议(Δs)」分别乘以它们各自「贡献权重(w)」后的总和。


与此同时,智能体的「存活状态(A)」也会根据这场竞争的结果进行更新。


规则是:如果一个智能体在某个格子上的「贡献权重(w)」高于一个「最低生存阈值()」,它就在那里存活;否则它在该格子的存活度就记为 0。

  • 关于状态和可视化的说明

在实验中,这个「最低生存阈值()」被设为0.4

这带来一个有趣的结果:它允许最多 2 个智能体在同一个格子里共存(因为 0.4 + 0.4 < 1.0)。研究者发现,如果阈值高于 0.5(导致赢家通吃,只留 1 个),模拟会变得很无聊。

研究者这样设置的灵感来源于混合专家(MoE)模型(它们通常会选择 Top-2 专家),这能确保模拟保持一定的探索性。

因此,虽然模拟的真实状态是连续的(一个格子可能是多个智能体更新提议的混合体),但在可视化视频中,为了清晰起见,只显示了每个格子上「贡献权重」最高的那个智能体,并用不同颜色来区分。

  • 优化目标(智能体的「动机」)

那么,智能体是如何「学习」的呢?

每个智能体 i 的优化目标(L)都是为了最大化其领土,即最大化它在整个网格上的「总存活度」。

在实际计算中,作者通过最小化「负对数存活度」来实现这个目标。


这个目标设定非常巧妙,它会自然地「涌现」出复杂的行为智能体必须学会在「进攻扩张」(优化其攻击通道)和「防守领地」(优化其防御通道)之间找到精妙的平衡,以便在与其他智能体和持续的背景环境压力对抗时,尽可能多地「活下去」。

实验

该研究开展了多项实验来探索 PD-NCA。

动态特性

在探索 PD-NCA 的过程中,他们发现当网格规模(grid size)与 NCA 个体数量同时增加时,系统的群体行为会变得更加丰富与复杂。

这表明未来的研究方向之一是进一步在更大尺度的网格上运行 PD-NCA,支持更多数量的 NCA 个体,并可能同时在多块 GPU 上并行计算。


下面是网格大小的影响。网格大小从 16 x 16 到 196 x 196 的结果:


下图展示了从 16×16 网格扩展到 196×196 网格时 NCA 行为的变化。


学习的影响

下方的视频展示了学习机制对 PD-NCA 模拟结果的影响。

在没有学习的情况下,系统最终会进入一种稳定状态,仅呈现出微小的波动;而引入学习之后,可以观察到有趣的周期性行为,以及系统在不同交互状态之间的持续变化与演化。

这些现象表明:NCA 的数量、网格规模以及学习过程,是产生 PD-NCA 中复杂动态与多样行为的关键因素。

接下来作者探索了反向传播的重要性。左侧视频展示的是未启用反向传播的模拟,右侧视频则展示了正常启用反向传播的运行结果。对比结果表明:反向传播显著提升了系统中复杂涌现行为的丰富度与持续性。

超参数搜索

下面视频中,左上、中间下方和右下角的模拟都先运行了很多步没有提前进行学习,然后运行了几步,又进行了学习。这反映在它们的行为上:在反向传播改变平衡之前,它们都呈现出稳定的石头剪刀布动态。中间上方的模拟展示了稳定的循环是如何出现和竞争的,暗示了共生起源的存在。

超循环

在包含 3 到 6 个 NCA 的实验中,作者测试了是否可以鼓励形成更长长度的超循环结构(hypercycles)。


结果显示,尽管修改了损失函数,但观察到完整长度的超循环很少能够稳定存在。相反,NCA 循环坍缩为较短的 2–3 NCA 循环,或者出现寄生行为与叛逃级联现象。

在图中最右侧的 N=6 实验中,黄色智能体因绿色智能体的扩张而获得奖励,但绿色智能体却反过来侵占了黄色智能体的领地。同时,我们还观察到一个由黄色与蓝色智能体组成的截断的二元循环(2-cycle),其中蓝色智能体在对抗寄生性的绿色智能体时扮演防御者角色。

了解更多内容,请参考原文。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

胖哥不胡说
2026-01-20 11:47:25
71-29票表决结果出炉,特朗普进退维谷,美国紧急撤侨

71-29票表决结果出炉,特朗普进退维谷,美国紧急撤侨

花谢依然美
2026-02-05 14:17:07
80年母亲心软放走盗贼,10年后收到一个包裹,打开一看全家蒙圈

80年母亲心软放走盗贼,10年后收到一个包裹,打开一看全家蒙圈

民间精选故事汇
2024-09-08 10:30:03
曼联中场新希望!外租19岁新星获重用,控球+抢断能力出众

曼联中场新希望!外租19岁新星获重用,控球+抢断能力出众

夜白侃球
2026-02-05 19:47:28
英国美女狱警,与重刑犯多次发生不正当关系

英国美女狱警,与重刑犯多次发生不正当关系

中国新闻周刊
2026-02-03 22:45:09
爱泼斯坦受害者日记曝光!婴儿出生10分钟被抢,美司法部遮掩20年

爱泼斯坦受害者日记曝光!婴儿出生10分钟被抢,美司法部遮掩20年

糖逗在娱乐
2026-02-05 12:19:02
祖巴茨因与妻子的孩子出生缺战骑士!他俩是NBA高颜值夫妇

祖巴茨因与妻子的孩子出生缺战骑士!他俩是NBA高颜值夫妇

Emily说个球
2026-02-05 12:27:17
后怕!如果当初决策层相信了许小年,中国可能会比现在落后二十年

后怕!如果当初决策层相信了许小年,中国可能会比现在落后二十年

蓝色海边
2026-02-05 07:55:38
4字拒赛!樊振东婉拒乒联破例邀约,巅峰退隐藏何深意?

4字拒赛!樊振东婉拒乒联破例邀约,巅峰退隐藏何深意?

苏甩甩
2026-02-05 09:45:04
网飞特离谱的黄暴美剧,偏偏还很火,真是独一份了

网飞特离谱的黄暴美剧,偏偏还很火,真是独一份了

来看美剧
2026-02-01 19:51:56
分手14年,释小龙何洁境遇天差地别,一个身家过亿,一个养不起娃

分手14年,释小龙何洁境遇天差地别,一个身家过亿,一个养不起娃

查尔菲的笔记
2026-01-09 22:17:44
现货白银站上92美元/盎司

现货白银站上92美元/盎司

新京报
2026-02-05 12:50:08
阿斯:平图斯的阻氧面罩整套3万欧,帮助规划球员体能、强度

阿斯:平图斯的阻氧面罩整套3万欧,帮助规划球员体能、强度

懂球帝
2026-02-05 19:05:10
爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

爱泼斯坦私人飞机驾驶员:克林顿曾坐过26次,空姐像糖果脱衣舞娘

海佑讲史
2026-02-05 13:00:05
A股:今天下探到4048后反复回弹,种种迹象表明,A股迎更大级别变盘

A股:今天下探到4048后反复回弹,种种迹象表明,A股迎更大级别变盘

股市皆大事
2026-02-05 15:28:19
布伦森在尼克斯主场砍下11次40+,超越安东尼升至队史第2

布伦森在尼克斯主场砍下11次40+,超越安东尼升至队史第2

懂球帝
2026-02-05 19:53:05
悲剧!云南一地电车失控起火,路过小伙徒手勇救3人!副驾没救出

悲剧!云南一地电车失控起火,路过小伙徒手勇救3人!副驾没救出

火山诗话
2026-02-05 11:08:15
大S祭日上,具俊晔穿的那件棕色大衣,是大S在27年前送给他的礼物

大S祭日上,具俊晔穿的那件棕色大衣,是大S在27年前送给他的礼物

一盅情怀
2026-02-03 17:54:38
9胜0负!历史第一!成NBA最神奇的球队,三巨头逆天改命要冲冠了

9胜0负!历史第一!成NBA最神奇的球队,三巨头逆天改命要冲冠了

老侃侃球
2026-02-05 03:30:03
轰-6K呼啸而至,美菲演习区域内,到处是中国的战机和舰艇!

轰-6K呼啸而至,美菲演习区域内,到处是中国的战机和舰艇!

锋芒点兵
2026-02-05 17:34:31
2026-02-05 22:00:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4523文章数 37402关注度
往期回顾 全部

科技要闻

美团7.17亿元收购叮咚买菜

头条要闻

多家医美机构可"造腹肌" 有人花7万元打了83支玻尿酸

头条要闻

多家医美机构可"造腹肌" 有人花7万元打了83支玻尿酸

体育要闻

奇才:我学生……独行侠:成交!

娱乐要闻

微博之夜卷入座位风波!杨幂超话沦陷

财经要闻

中美"只会有好消息" 经济冷暖看房价

汽车要闻

李想为全新L9预热 all in AI造更好的车

态度原创

教育
游戏
时尚
艺术
旅游

教育要闻

高考地理中的过渡性思维+尺度思想,太重要了

PS官号下场吃瓜?《绝地潜兵》发布神秘代码引热议

春天最火的第一双鞋竟然是它?赵今麦、周也都爱穿!

艺术要闻

他热爱绘画,生活中的每一刻都充满激情!

旅游要闻

2月11日启幕!苏州虎丘山灯会邀您入画游

无障碍浏览 进入关怀版