金融市场暴跌,生态系统失衡……如果一个系统即将崩溃,它会提前“露出马脚”吗?在混乱的数据中,我们能否提前捕捉到那些细微但关键的信号?近期,研究人员通过网络论坛的一项在线“画图游戏”,引入可解释的机器学习框架,试图预测何时“风险降至”,并且希望解释机器学习背后的“黑箱”。
撰文 | 郭瑞东
1
一个愚人节游戏成为大型社会实验
要论愚人节互联网公司玩出的花活,Reddit搞的r/place值得一说。他们给出一块100万像素的空白巨大画布,每个用户每5分钟会得到一个机会,可以在上面更改一个像素的颜色(图1)。由于有时间限制,即使是画出一个10*10像素的图画,也需要500分钟,可这8个多小时中,说不定会有别的捣蛋者修改你图画中的像素——要想在r/place中画出图案,唯一的办法是团队合作。
从2017年的第一次活动,到2022年,画布规模已扩展到400万像素,颜色也增加到32种。在2022年活动开始的三天半的时间里,有1040万参与者共同完成了约1.6亿次像素修改。网友们自发组织,在画布创作了约 10,900 个作品。从游戏角色到国家旗帜,从动漫人物到艺术二创,每个作品背后都是一个有组织的在线社区。
![]()
图1 图像产生过程丨图源:参考文献[3]
这项千万人参与的社会实验,为人类集体行为的研究提供了素材。当社区A精心绘制的《星球大战》海报突然被社区B用纯色块覆盖时,一个临界转变(critical transition)就发生了(图2C),而研究者想要研究的就是这样的临界转变点。在经济学中,临界转变可能表现为市场突然崩盘,在电力系统中则可能体现为局部故障迅速级联扩展,最终导致大范围停电。如能成功地检测临界转变的早期迹象,可以使相关人员做好准备,减轻甚至避免此类转变。
![]()
图2 画布的演化及找到的临界转变点丨图源:参考文献[1]
r/place游戏意外地为科学家提供了一个前所未有的机会:同时观察由具有反身性的个体组成的数千个子系统(每个作品)的临界转变。在现实中,我们几乎无法同时观察数千个市场,看它们何时突然崩盘,但在r/place中,数据结果是公开、精确且高分辨率的。r/place的实验记录相当于给研究者提供了“上帝视角”的实时数据库,构图的更新迭代就是微型社会的集体行为缩影,为研究人类社会的临界转变提供可控的实验场景。
2
用可解释机器学习预测人类行为
传统上对临界转变的研究,多聚焦在地质、气候及生态等不包含人与人群相互影响的系统中。这些系统在临界转变发生之前,描述系统状态统计量的方差和自相关性会显著增加。这种被称为临界慢化(critical slowing down)的现象,曾被视为临界转变的普适性前兆信号,当系统面对外界扰动的恢复速率显著降低时,系统的波动和耦合增加,预示着临界点即将到来。
但人类社会中,这套预测方法失效了。就拿r/place来说,有组织攻击是“突发冲击”,不是逐步累积的;另一方面,转变可能是因为防御方主动撤退,并非系统失稳。
既然人类行为的复杂性超出了单一理论的解释范围,那预测的时候,就需要直接从数据中挖掘模式。2026年1月2日,普林斯顿大学的一个团队在《美国科学院院刊》(PNAS)上发表了这项社会实验的研究[1]。研究者开发了一套基于可解释机器学习的预警系统,试图从r/place所反映的真实环境学习临界转变的数据模式,最终该模型实现了以极高成功率完成对2023年r/place临界转变的预测。
研究者首先定义了何时能视作画面出现临界转变(图3A):先用过去3小时内,每个像素出现时间最长的颜色作为图像稳定状态(称为参考图像);若当前图像与参考图像的像素差异比例超过35%(体现实质性改变,而非小修小补),且是过去3小时平均值的6倍以上(体现突然性),则将该图像视作发生了临界转变。
然后,他们从r/place像素变换的时间序列数据中,手动构建出19个特征,涵盖图像动态(偏离度、熵)、用户行为(修改次数、新用户比例)、攻防博弈(攻击强度、恢复率)、历史记忆(过去7小时加权平均),这些特征相当于机器学习算法的数字感官(图3B)。
![]()
图3 该研究的数据处理流程包括定义临界转变,筛选输入数据,训练决策树模型,预测临界转变及使用SHAP为预测给出解释。丨图源:参考文献[1]
接下来,研究人员开始构建机器学习模型,其预测目标并非简单判断是否将要发生临界转变,而是预测距离下一次临界转变还剩多少时间(图3D),这种设计将使预测准确性(即预测值和真实值的差异)更容易评估。
最后研究者通过可解释机器学习,对模型纳入的特征按照其对预测结果的重要性进行打分,以找出哪些因素能够预测临界转变的发生(图3E)。
模型训练好后,预测结果显示:距离临界点越近,其预测准确性越高。在20分钟预警窗口下,误报率仅3.6%,而该模型最远可以提前6小时给出预测,这是传统方法难以实现的(图4)。研究者使用2022年数据训练的模型,直接用于2023年实验,模型性能仅轻微下降,这一结果证明该模型捕捉到人类协作的通用规律。
![]()
图4:模型的预测准确性对比丨图源:参考文献[1]
3
促成临界转变的6种特征模式
本研究最大的特点是达成了模型“可解释”。机器学习常被诟病为“黑箱”。但该研究中,每次预测中哪些特征的贡献最大,可通过SHAP进行评估。SHAP值来源于博弈论,通过考察如果加入这个特征,预测准确性会增加多少,以评估新加入特征对预测的重要性。通过SHAP值,能够将抽象的机器学习预测“翻译”成了人类可读的定性预警规则或“行为模式”。
r/place上大部分图案的临界转变,对应的都是社区之间的攻防战——防守方试图在画面上维持某个图案,而攻击方想让图案消失。研究者通过对预测过程中关键变量(SHAP值大)的变化趋势进行分析,结合自身对r/place这个游戏的了解,将转变前发生的变化分为6类。这6类模式可以对应现实人类社群的行为模式,可能会在金融市场、生态系统等具有现实影响的环境中呈现。因此,这项研究可以为现实情况的临界转变提供预警参考。
![]()
图5:6类成功预测临界转变对应的特征丨图源:参考文献[1]
第一类是传统上的强烈临界慢化(图5A)。该场景下,决定预测准确性的关键特征是瞬时图像与上一时刻的差异比例。当该特征值(即图像瞬时变化剧烈程度)处于极高百分位(>95%) 时,此时它成为最强的预警信号。在转变前极短时间(20分钟内),作品图像的内部波动性达到顶峰,像素颜色在极短时间内频繁、大幅变化,原本维持图标的社群开始无法维持稳定图像。这表明防御方已完全丧失对图像的控制力,攻击方的每一次修改都有效,系统处于崩溃边缘。该结果符合经典理论中的临界慢化,如同湖泊在富营养化临界点前,浮游植物生物量出现极端剧烈的日波动;或金融市场在崩盘前出现极端高频的交易波动。
第二类机器学习提取出的行为模式称为攻击力主导(图5B),其关键特征是图像被攻击性修改的比例,即改成非参考色的比例。这一特征的异常升高,意味着临界转变前夕,对该图像的修改绝大多数是“攻击”(改变颜色),而非“防御”(恢复原色),攻击方形成了压倒性的力量优势。而防御社区要么因用户数不足或意愿低下无心干预,要么反击无效。这种模式在现实中也存在,比如外来入侵物种的繁殖速率远高于本地物种的恢复速率,导致系统结构被快速重塑。
第三类模式是温和的临界加速(图5C),其特征是上一时刻被攻击像素在本时刻恢复的比例。当这一比例处于中等偏高值时,其对预测临界转变重要性最高,而比例过低和过高时,该指标的重要性下降。这是一个有趣的发现,对应的情景是在攻击初期,防御社区反应迅速、动员充分(被修改的像素很快恢复)。从表面看这是趋于稳定的迹象,但模型将其识别为预警信号,可能是因为这种“高强度防御”恰恰是攻击已形成一定规模,迫使防御方进入总动员的标志,是冲突升级的体现。类似的情形也出现在电力系统中。当局部线路负荷过高时,调度系统可以通过快速重分配负荷或频繁启用备用线路来维持整体稳定。虽然系统仍保持正常运行,但这种高强度调度往往意味着系统已经处于紧张状态,一旦新的扰动出现,更容易触发级联故障。
第四类临界转变特征模式是“创新真空”(Lack of in-group innovation,图5D),对应的特征是当前处于非参考颜色(即被攻击状态)的像素,自被攻击以来平均已经过去了多长时间。当该值非常高时,即像素长时间处于被攻击状态而未被恢复,其对应的平均SHAP值急剧升高,成为强烈的预警信号。这意味着,被攻击的像素“赖着不走”的时间越长,机器学习模型就越确信一个致命的转变即将发生。
创新真空模式反映的是临界点出现之前,防御方只会进行最低限度的、机械的“修复”工作——即把被改色的像素填回原来的“参考颜色”。他们没有意愿或没有想象力去“创新”。在一个动态对抗环境中,静止就是倒退。当攻击方不断尝试新颜色、新图案、新战术时,一个只会机械回填的防御方必然会被拖垮。攻击方可以轻易地通过持续施压,耗尽防御方的热情和资源,最终完成图像的全面替换。对应到商业世界中,就是一家公司面对市场颠覆(“攻击”),如果只会机械地维护旧产品线(“回填”),而没有研发新产品、新商业模式(“创新”)。r/place中的攻击间距就相当于“市场份额丢失后多久能夺回”,时间越长,破产风险越高。
第五种模式的关键指标是冗余修改比例(图5E),即用户将像素改成本来就有的颜色。冗余修改比例越高,SHAP值越高(越安全)。这意味着低冗余修改才是预警信号。冗余修改率高通常被认为是“噪声”或“无意义行为”(比如用户为了挂名而重复修改)。但模型发现,在稳定作品中,这种“无意义”行为反而存在,且其高比例是稳定的标志。
对此一个合理的解释是,在一个组织良好的社区中,存在大量“仪式性”或“巩固性”的修改。成员们通过重复修改关键像素(如Logo的轮廓)来宣示主权,以此强化集体认同,维持存在感。这是一种低成本、高频率的协作信号。当这种信号消失时,意味着社区成员不再进行这种象征性协作,要么是心灰意冷,要么是组织瓦解,集体行动能力丧失——这是社区凝聚力崩溃的早期指标。就像一个活跃的在线论坛,不仅要看发帖量,还要看“灌水”帖、表情包大战、版聊等“无意义”互动是否频繁。这些“噪音”的消失,往往是社区活力衰竭的先兆。
最后一个能预测临界点的特征,是衡量图标中颜色分布的随机性/复杂性的熵变低(图5F),即颜色分布越简单、越有序、越单调,预警信号越强。这是由于简单图像(如纯色块、几何图形、文字)结构冗余度低。特别是对于简单图像,一个关键像素被攻陷,可能迅速引发连锁反应,导致图像整体结构崩塌。而复杂图像(如有细节的绘画、照片)具有高维度的结构冗余。局部受损不影响整体辨识度,防御方有更多时间和空间进行局部修复而不影响全局。
此外,复杂图像通常意味着更高的社区投入和更强的身份认同,其防御意愿和资源投入也更持久。在协作创作的过程中,用户之间产生的是“钦佩”。这种情感模式驱动的是良性嫉妒(benign envy)或直接的共情与合作,它激励人们学习、参与和贡献,而非退缩或攻击。复杂性降低在现实中的对应是,物种单一的人工林比物种复杂的天然林更容易遭受病虫害的毁灭性打击;产业结构单一的国家更容易受到外部环境的影响。
人群行为与物理或生态系统不同,社会系统的预警信号深深植根于人类行为与组织动力学。上述6种模式揭示了为何只使用传统的临界慢化无法预测人类行为。例如前述对冗余修改比例的解读是典型的社会学洞察,在物理系统中基本没有意义;而第四类创新真空涉及“创新”这一意向性概念。这些分析意味着对社会系统的预警,必须纳入“社会资本”“集体认同”“组织韧性”等维度。
4
黑天鹅事件
人类社会的复杂性,决定了不是每一次临界转变都能提前预警。预测算法的性能高度依赖于每个作品独特的社区动态和历史,该研究中有27%的临界转变完全无法预测。
图6A中对应的是近乎完美的预测,该图原本是一个相对复杂、有辨识度的标志性图案,像某大学橄榄球队的队徽。这样的图案背后,可能有一个组织有序、有明确身份认同的社区在持续维护,让画面最终呈现这个图案。到了临界转变时,图案被大量单一颜色的像素块覆盖,图像变得混乱,这背后可能是对手球队社区试图“攻击”,想让这个图案在画布上消失。这个作品可能经历了一个典型的“临界慢化”过程:在攻击初期,防御社区反应迅速,但随着攻击持续,系统恢复力下降。因为这是一个有组织、有稳定状态的社区作品,因此算法能够在相当长的时间内准确预测,预测值和实际值相差不多。
![]()
图6:不同图案的预测准确性
但在图6B中,预测值在时间轴上剧烈振荡,上下波动极大,完全没有随着真实临界转变的发生时间临近而收敛。这表明算法完全无法判断该作品何时会转变,其预测毫无规律可循。对此,研究人员猜测“图案1886”背后的社区缺少组织,从不同时间点的快照可以看出这个图案一直在变动,没有清晰的“被攻击-防御”模式;或者始终处于一种高频率、低强度的像素修改状态。而真正这个图案消失的,是一次偶然却有组织的大规模外部攻击,可能是一个大型社区看上了这块画布,想用这块画布来创作自己的图案。该事件在历史数据中没有可学习的先验模式,属于真正的“黑天鹅”事件,因此预测算法失灵了。
图6C中的图源于音乐专辑,可能由某个音乐爱好者小圈子维护。发生临界转变前,画面长期保持稳定,仅有极微小的修改。这一状态表明该作品长期被忽视,预测模型给出该图案距离临界点发生始终有几个小时,然而转变可能发生得非常突然,例如被一个大型社区用纯色块瞬间覆盖。该图的转变可能由外部投机攻击(opportunistic attack)引发:攻击者发现了一个无人防守的“空地”,其成功与否并不取决于创作作品的社群本身的“健康指标”,而取决于攻击者的外部决策和资源投入,这导致模型无法从该作品自身历史中进行预测。
预测失败的案例,再次说明社会系统的临界转变是异质的,其预警信号也是多元的,并非所有临界转变都可预警。任何预警系统都必须正视这种异质性。在包含人类行为的系统中,“可预测性”不仅仅取决于模型本身的复杂度,更在于社区是否形成了可识别的、有规律的动态模式。如果社群行为本身是完全随机,不可预测的,那么从系统数据中预测未来将变成本质上不可能的任务。预警系统永远有漏报,管理者必须接受这种不确定性。
6
小结
r/place像是一面数字哈哈镜,放大了驱动人类社会走到今天的最原始的动力,例如创造、防御、攻击、倦怠等,这些因素在现实生活中都有体现。PNAS发表的这项研究表明,使用可解释机器学习识别早期预警信号数据驱动方法可以补充或辅助传统理论框架,也为未来在其他领域的应用探索奠定了方法基础。
从方法论来看,该文指出机器学习确实能学到了真实、可理解的模式,而非仅仅是数据中的虚假相关(过拟合)。SHAP可解释性揭示的模式与领域专家(熟悉r/place的社区动态)的直觉是吻合的(如简单图案易被攻破、社区无组织则图案脆弱)。人类研究者通过结合领域常识,能将机器学习可解释性分析的结果转化为科学理解。这项研究不仅论证了“机器学习预测得准”,更进一步回答了“为什么准?背后发生了什么?”,从而增进了对r/place背后社群动力学的科学理解。
基于r/place的数据,对人类行为的研究还有不少,比如文献[3]关注画面创作过程,该研究发现画面生成过程中既有自上而下的控制,也存在自下而上的涌现。这项研究告诉读者,r/place游戏不止是社群之间的攻防战,还包括了创意,协作。为什么有的团队能够通过协作,在r/place上绘出图案,而有的社群却没有成功——群体协作的动力学,或许也可以通过类似的方式进行研究。
参考文献
[1]Falmagne, G., Stephenson, A. B., & Levin, S. A. (2026). Interpretable early warnings using machine learning in an online game-experiment. Proceedings of the National Academy of Sciences, 123(1), e2503493122. https://doi.org/10.1073/pnas.2503493122
[2]DIGITAL MANDALAS: COMMUNICATION AND AUTHENTIC HUMAN INTERACTION IN REDDITS R/PLACE PLATFORM. (2022). Issues In Information Systems. https://doi.org/10.48009/3_iis_2022_102
[3]van den Hoven, E., & van der Berg, B. (2021). A comparison of happiness and exhilaration: An experience sampling study. Computers in Human Behavior, 121, 106809. https://doi.org/10.1016/j.chb.2021.106809
![]()
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2.『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.