![]()
导语
在互联网时代,尽管海量数字化数据为社会科学研究提供了前所未有的资源,但其非结构化、代表性不足、易受算法干扰等缺陷,使得单纯依赖观测数据分析难以揭示可靠的因果机制。同时,真实社会系统的实地实验又常受限于经济成本、法律约束与伦理风险。在此背景下,基于主体建模(Agent-Based Modeling, ABM)作为一种“人工实验室”方法应运而生——它通过自底向上的仿真策略,在计算机中构建具有异质性、适应性和交互能力的智能体,从而模拟宏观社会现象的涌现过程。ABM不仅规避了传统方法的诸多局限,还能支持反事实推演与政策评估,正从早期的理论探索工具逐步发展为可校准、可验证、可赋能现实决策的高保真社会仿真范式。
本篇论文一作薛霄教授为发起人,报名读书会加入Agent建模与仿真的前沿探索之旅。
关键词:ABM,社会仿真,复杂系统,因果推断,数字孪生
ZM丨作者
AI Agent与智能服务实验室-TJU丨来源
![]()
论文标题:From Agent Simulation to Social Simulator: A Comprehensive Review(Part 1) 作者:Xiao Xue, Deyu Zhou, Ming Zhang, and Fei-Yue WangDOI: 10.48550/arXiv.2510.18271
1. 为什么需要ABM?
在过去十年里,互联网技术有效地将数十亿人的社会、经济、政治和文化活动数字化,由此产生了海量的数据。以这些数据为基础,研究者们将社会系统看作各组成元素之间相互作用的网络,采用复杂网络分析的手段来了解系统特性。
但是,复杂网络分析所研究的数据(如搜索和社交媒体数据)通常并非为特定的研究问题而产生,往往比传统的社会科学数据(例如调查和实验室实验)更嘈杂,结构化程度更低,且缺乏“设计”。在这种背景下,单纯的数据分析在方法论上就陷入了以下几个难以解决的困境:①数据的代表性:大数据也是一种采样,而且其代表性难以评估。使用互联网以及各种社交平台的人群在总人口中并非随机分布。②数据的真实性:从大数据中所获得的个人或群体行为模式可能与实际生活中并不一致。大数据仅记录了人们生活的某些侧面,而非全部。③数据的可靠性:在很多情况下,数据是我们使用某种产品(如搜索引擎,今日头条)时所留下的记录。需要注意的是,在使用这些产品的时候,我们的行为模式可能会被引导(推荐算法)而发生一些变化,从而使相应的数据被“扭曲”。
社会系统的实地实验可以解决上述问题,但是在实践中往往面临着巨大的挑战,原因可归结为如下几个方面:①经济方面,由于社会系统的规模和成本因素,实验代价太大,以致经济上无法承受;②法律方面,涉及国家防卫、军事战备、社会安全等问题,受法律保护,以致无法对研究的系统进行实验,也无法重建这些系统进行实验;③道德方面,社会系统往往有大量人员的参与,对这些系统进行实验,有可能干扰人的正常生活,甚至危害人的生命和财产,以致在道德上无法接受这类实验。
在这种背景下,社会建模仿真方法逐渐发展成为计算社会科学研究中的另一种主流方法。如图1所示,社会模拟把计算机作为“人工实验室”,来“培育”实际系统中可能出现的宏观现象,探究背后的规律,为分析复杂系统行为和评估干预效果提供了一种可行方式。
![]()
图1:社会模拟的核心思路
社会建模仿真方法分为两种:
(1)自顶向下建模方法:典型代表是系统动力学方法,针对某个特定对象或特定问题,采用数学语言来表达事物的特征、状态、关系和过程,经推导、演算和分析,以形成解释、判断和预测。这类方法具有高度的抽象性和严密的逻辑性,但是面对非线性系统可能会出现可描述但不可求解的情况,同时模型结果对于模型假设非常敏感,导致其结果会存在“失之毫厘、谬以千里”的风险。
(2)自底向上建模方法:典型代表是基于主体建模(Agent Based Modeling,ABM),将系统内的主体行为抽象简化成Agent,通过彼此间的简单交互来产生感兴趣的宏观结果,被认为是除经典演绎推理和归纳推理之外的第三种科学方法。与自上而下的建模方法相比,ABM的优势主要体现在融入了涌现性框架。模型的基本元素需要有足够的灵活性,包括主体的异质性与适应性、数量的可扩展性等,以至于新的、未曾预料到的特征会自然出现在模型中。
在20世纪90年代,Epstein和Axtell 的《Growing Artificial Society》首次系统地将ABM作为社会科学的建模工具。ABM与多主体系统(Multi-agent Systems)的概念相关但不同,其目标是对系统中遵循简单规则的主体集体行为进行解释性的洞察,而不是设计主体或解决特定的实际或工程问题。ABM主要用于实现如下目的:① 存在性实验:观察某套规则是否能涌现出某种复杂行为;② 理解性实验:尝试自下而上地模拟系统,用于理解复杂系统的运行过程,尤其是那些无法进行实际实验的社会复杂系统;③ 推演性实验:用于求解诸如“预测世界人口动态或者全球疫情传播”等任务的大规模方程,传统数学解决方案对于这类问题往往无能为力。
2. ABM的发展历程
ABM牵涉的技术和应用非常繁杂,其内涵和外沿又随着时间的发展不断变化,图2显示了ABM研究中的重要主题,按照事件线分为三个周期:第一个阶段(1970–1995年)是社会模拟基本概念的形成阶段,包括“人工生命”与“人工社会”;第二个阶段(1995–2004年)则是各种不同领域的人工社会模型(例如社会学、商业和市场、土地利用、金融等)纷纷涌现,同时ABM本身所存在的问题也开始引起关注;第三个阶段(2004–至今)的关键事件是ACP方法的出现,标志着ABM开始从“验证假设的玩具模型”转向“如何为现实赋能”。随着大模型技术的横空出世,Agent社会模拟领域正在步入快速发展阶段。表1给出了这个过程中的标志性事件。
![]()
图2:ABM的发展脉络
表1:ABM的发展大事记
![]()
![]()
3. ABM 的设计原则:在“抽象”与“逼真”之间找平衡
一般来说,社会模拟的表现形式比较简单,而实际系统的运行比较复杂。两者之间的矛盾主要表现在两个方面:①如果模型抽象程度过高,就会难以反映现实世界的运行规律;②如果模型抽象程度过低,建立模型的复杂度就会很高,会遇到数据缺乏、资源不足、知识体系尚未建立等一系列问题。因此,在真实世界与模拟系统之间实现适当映射是非常重要的。在计算模型的设计中,模型设计原则应该与真实情况之间达成平衡,如图3所示。
![]()
图3:ABM的发展脉络模型设计原则与真实情况的平衡关系
模型设计是在某一个层面上对现实与抽象取得平衡,所以无法预期该模型在不同层面上都表现良好。例如,高度现实的模型可能有重大的政策价值,却只有很少或根本没有理论价值;反之,高度抽象的模型可能提供深刻的科学见解,但就政策贡献而言,却无法提供可以直接应用的结果。根据与所给定参照系统的逼近程度,下面给出两种建模原则:
1. KISS原则(抽象)
KISS(keep it simple and stupid)原则主要适用于理论构建,模型规模小且参数较少,目标是为某种宏观涌现现象找到最小且反直觉的条件。以KISS为导向的ABM被视为“思考工具”或“直觉引擎”,该模型设计原则与真实情况的平衡关系如图4所示。该模型有时候被称为玩具模型,与参照系统仅在少数定性方面相似,并不试图复现任何定量特征,但它们能提供问题领域内一些适用的见解。KISS 方法的支持者赞同如下观点:“如果ABM的目标是丰富我们对某种现象涌现过程的理解......,那么假设的简单性就很重要,而对特定环境中的真实细节再现则没那么重要”。
![]()
图4:简约性方法模型设计原则与真实情况的平衡关系
Epstein和Axtell 设计的Sugarscape模型可以被视为KISS原则的典型案例。模型中关于Agent规则的假设使用了一些已有的社会学/心理学理论,但是较弱;也没有使用数据来评估模拟结果在多大程度上再现了真实世界的规律性。出于这个原因,这类ABM只具有启发式价值,但无法说清楚模型在多大程度能反映真实世界。
2. KIDS原则(逼真)
尽管从历史上看,KISS原理对该领域产生了明显的影响,但是这类“无理论依据”的ABM所产生的知识缺乏可信度,面临着一系列的质疑。习惯于KISS原则的建模者开始寻求与“现实世界”建立更紧密联系的ABM。在这种背景下,KIDS(keep it descriptive and stupid)建模原则开始兴起。这类模型以解决应用问题为导向,尽可能逼近现实,模型规模大、参数众多且很多模块需要测试,实验输出与实证数据最为契合。该模型设计原则与真实情况的平衡关系如图5所示。此类模型在商业和政府机构中应用广泛。例如,公共政策涉及高度不确定的领域(如社会网络和人类行为),ABM可用于分析政策(如经济刺激、法律法规等)的效果,以提高公共政策制定的科学性。
![]()
图5:现实主义方法模型设计原则与真实情况的平衡关系
KIDS的建模方式开始深深影响着当代ABM研究,以现实世界的数据集为基础,初始化ABM核心变量的概率分布,形式化Agent之间的网络结构,以及建立Agent行为规则。相关的案例包括创新的差异融合、声誉动力学,以及合作行为的博弈论。在经济学中,ABM也开始与经济决策的实验研究和实证验证相结合。因此,尽管“模型的校准和验证”仍然是该领域的一个研究前沿,但是ABM正在越来越多地从探索性模型转向了严格的实证验证。表2给出了相关的ABM应用分类。
表2:ABM的应用分类
![]()
4. ABM 的因果挑战:如何把“模拟因果”连到“现实因果”
在通常情况下,ABM模型非常简单,(相对)容易全面检查和理解其内部功能。因此,它们产生的知识可以从生成的角度来看(图6右侧的垂直因果),可以用因果关系来解释,即哪一个动态事件链把模型的微观假设与一组给定的宏观结果联系起来的。事实上,“可理解性”被认为有助于增强抽象模型的“可信性”。如果从因果关系的依赖性角度来看(图6左侧的水平因果),这些知识也可以从因果关系的角度进行解释。通过对ABM参数的操作(即灵敏度分析)和模型内部构件的变化(即稳健性分析),确实有可能确定模型的某个参数对宏观模式的变化负有责任。
![]()
图6:ABM的垂直因果与水平因果示意图
然而,抽象模型所产生的可解释的因果关系知识,纯粹是ABM实例化系统的内部知识。在输入方面,由于没有具体的理论或数据来支持微观层面的假设,因此无法论证 ABM 的微观机制模仿了社会现实的任何方面。在输出方面,由于模型的宏观数字结果与任何明确的经验规律都不相吻合,因此尚不清楚 ABM 实际上在复制什么。因此,无论是从因果依赖的角度还是从生成的角度,我们都无法获得关于任何微观层面机制或由其产生的动态过程的因果知识。高度抽象的 ABM 显然无法直接用于因果推理。
对于传统的观察实验而言,其难点在于如何构建反事实场景。但是对于ABM而言,仿真环境的参数可以系统地控制,构建反事实场景不再是难点。反而,如何构建出反映事实的基准场景成为新的挑战,包括模拟器是否真实反映数据生成过程以及最终模拟结果是否可靠。为了实现这个目标,ABM也可以锚定于数据,通过参数校准和实证验证,分别实现理论现实性与“输入”和“输出”的现实性。这使得ABM成为一种“模拟器”,建模者能够利用ABM在不同层级间的知识,对模型外的世界机制进行推断。由于数据可用性的限制,ABM往往无法进行完全的实证校准,只能通过可靠性工具来量化ABM对于建模假设的依赖程度。因此,如果一个ABM实现了最大限度的实证校准和验证,并经过系统可靠性检查,那么完全能够支持相关的因果推断(即现实世界中不同层级间的联系)。表3给出了研究者们在该领域的探索历程。
表3:ABM与因果推断的相关工作
![]()
5. 社会系统仿真
社会系统仿真与物理仿真类似,也需要经历概念模型、领域模型和计算模型等阶段,其间有相互的依赖和约束关系。
概念层:构建具类人特征的 Agent(感知、认知、决策、行为)。
领域层:与概念层密切相关,需要针对问题开发一系列领域模型(如地理模型、基础设施、人口模型、干预措施与社会关系等),努力得到与真实世界一致的人工社会底座。
计算层:构建出基于邻域和记忆信息的Agent策略迭代方程,表现为主体演化和情境更新的动态过程。如图7所示,数字线程可以被看作是连接不同模型的桥梁,用于展示实验周期中系统的演变、配置改变历史和特别的状态转换。
![]()
图7:人工社会的运转过程
1. 主体模型
社会仿真中的Agent是具有一定自主能力的个体,与现实社会的生物个体或者生物群体相对应。Agent个体模型则是不同领域知识发挥作用的容器,可以根据应用问题进行定制化,包括Agent的结构、是否具有学习能力、相互间的交互机制等等。一般而言,系统中的个体都采用相同的Agent结构。Russell & Norvig根据Agent的感知程度和能力将其分为五类:
1 简单主体
![]()
Agent功能基于条件-动作规则(condition-action rule):“如果满足条件,则动作”。只有当环境完全可观察时,此Agent功能才会成功。对于在部分可观察环境中操作的简单反射体,无限循环通常是不可避免的。如果主体可以随机化其动作,就有可能摆脱无限循环。
2 基于模型的主体
![]()
Agent可以处理部分可观察的环境。它的当前状态以某种结构存储在主体内部,描述了部分“无法看到的世界”。这种关于“世界如何运作”的知识被称为世界模型(world model)。Agent感知历史和行动对环境的影响可以通过使用内部模型来确定。然后它采用与简单主体相同的方式来选择下一个动作。
3 基于目标的主体
![]()
Agent通过使用“目标”信息进一步扩展了能力。目标信息描述了理想的情况,为主体提供了一种在多种可能性中进行选择的方法,即选择最有可能达到目标状态的路径。搜索和规划是人工智能的子领域,致力于寻找实现主体目标的动作序列。
4 基于效用的主体
![]()
Agent区分目标状态和非目标状态。效用函数(utility function)则是用来度量将当前状态映射到特定状态的可取程度。更通用的性能度量应该允许根据不同环境状态对主体目标的满足程度进行比较。效用一词可用于描述主体的“快乐(happy)”程度。一个理性的、基于效用的主体会选择最大化预期效用的行动。Agent必须对其环境进行建模和跟踪,涉及对感知、表示、推理和学习的大量研究。
5 具有学习能力的主体
![]()
学习的优势在于允许主体在未知环境中运行,并且可以获取比其初始知识可能更强的能力。Agent最重要的特点在于负责改进的“学习要素”和负责选择外部行动的“性能要素”。学习元素使用“批评者”对Agent的表现进行反馈,并确定应该如何修改性能元素或“演员”以在未来做得更好。“问题生成器”负责建议下一步的行动,将导致新的和信息丰富的体验。
目前主流的Agent结构由四个部分构成:Perception(感知)、Decision(决策)、Reaction(反应)和Optimization(优化)。Agent结构中的信息控制流将各个部分联系成了一个整体,如图8所示。
![]()
图8:个体Agent的结构模型
以下给出了Agent结构的形式化表达式,由一组与时间t相关的属性来描述。
表示Agent不随时间变化的特征,如标识;表示Agent随时间变化的特征,例如Agent的角色。是Agent感知到的、对其状态及行为可产生刺激作用的外在事件的集合。是Agent在感受外在事件刺激以及与其他Agent进行交互过程中所采取的决策机制。是Agent的行为集合,包括Agent自发采取的、以及受外在事件刺激采取的所有行为。一般而言,Agent会采取“效益递增”的反馈学习原则,通过与环境交互不断获得解决问题的经验,逐渐优化它的决策机制,从而能够采取更加接近完成目标的行为。
2. 环境模型
在人工社会中,环境模型就是实际物理环境在计算机中的映射,是Agent赖以存在的活动场所按照建模方式。环境模型可以分为实体型建模和网格型建模。实体型建模是指将真实社会中的建筑物、道路交通、气候条件等环境要素抽象成实体对象。网格型建模并不关注具体的环境对象,而是将聚焦点落在对环境空间的建模上,利用离散的网格来描述空间的存在和环境的属性,如图9所示。
![]()
图9:环境模型的抽象层次结构
Agent与环境模型的相互作用关系需要注意以下三个方面:
分布特征:由于实际条件的限制,环境模型的初始设置往往只能统计特征数据。因此,需要研究人工社会初始化数据的生成算法,包括Agent统计特征(总数,性别比例,年龄分布等)、Agent地理分布情况、人口社会关系属性、环境实体的统计特征(总数,类型,可容纳的人口数等)、环境实体的地理分布情况等。从群体数据的统计特征重构出群体中每个个体的具体特征,是环境建模的基本思路。
空间关联:对于个体而言,空间的迁移虽然有一定的随机性,但是更多情况下是规律性的。因此,对人工社会中的每个个体,都需要将其与固定访问的活动场所建立起关联关系。
时空关联:在人工社会中,Agent的行为会随时间而不断进行空间迁移。为了将Agent与Agent、Agent与环境的动态关联起来,需要对个体在什么时间执行什么样的活动、在什么场所执行什么样的活动、在什么样的场所发生什么样的交互做出明确的定义,以保证个体行为在时间空间上的一致性和规律性。
就环境模型的发展趋势而言,三维的数字孪生可视化,更贴近人们理解现实世界的模样,更容易让决策者理解。1994年,王飞跃提出了与数字孪生思想极为接近的“影子系统(Shadow systems)”。2002年,密歇根大学的Michael Grieves提出在虚拟空间中构建出与物理实体完全等价的数字孪生体(Twinning of Systems),强调建立虚实双向动态反馈机制,可以对物理实体进行仿真分析和优化。2004年,王飞跃提出了平行系统(Parallel Systems)的概念,并将其作为解决复杂系统问题的方法论。2006年, Grieves发表了《产品生命周期管理:驱动下一代精益思想》,正式提出了“信息镜像模型”(Mirrored Space Model)。2010年,NASA(美国国家航空航天局)在其太空技术路线图(Area 11的Simulation-Based Systems Engineering)中首次引入了数字孪生的表述:“数字孪生,是一种集成化的多种物理量、多种空间尺度的运载工具或系统的仿真,该仿真使用了当前最为有效的物理模型、传感器数据的更新、飞行的历史等等,来镜像出其对应的飞行中孪生对象的生存状态。”表4给出了不同流派的数字孪生公司在产品形态、技术体系,和价值理解方面的差异。
表4:数字孪生的技术流派
![]()
3.规则模型
规则模型描述了人工社会的循环机制,包括Agent之间、环境之间、Agent与环境之间的交互准则。这些规则既可以是真实社会规则的映射,也可以是人为假设的假想规则。如图所示,人工社会采用循环反馈的方式制定出三个层次的演化秩序,如图10所示:
![]()
图10:规则模型的运行逻辑框架
个体进化:底层是个体演化空间,用于模拟个体在社会系统中经历学习进化的现象。就社会系统而言,不同个体具有不同的利益需求,有时候个体利益与系统的整体利益并不一致,甚至可能存在冲突。因此,经常会产生“上有政策,下有对策”的行为,导致政策实施效果大打折扣。Agent间的合作并不是一帆风顺的,而是有可能发生冲突的,包括多个Agent竞争同一有限资源而导致的资源冲突;因一方实现目标而导致另一方不能实现目标的冲突;以及不同Agent 对同一问题得出矛盾结果的冲突。
群体涌现:如果把个体行为看作原因变量输入,那么涌现就作为结果现象输出。当个体行为因接受到系统反馈而产生新的行为,系统会在原有的1阶涌现基础上,产生2阶涌现 (Zna2 order emergence)。这样,系统整体和个体行为之间就形成了一个闭环回路,也就是双向反馈机制 (feedforward and feedback),有可能导致正反馈回路和相互强化出现。在这种情况下,偏离平衡的一点小波动都会导致巨大和夸张的影响。
反馈调控:调控机制是根据宏观现象对微观个体行为产生调节作用的机制。好的调控机制既要考虑个体对利益的追求,以保证系统发展的动力和活力;又要坚决防止利益失衡,避免威胁到系统的秩序和稳定。为了保证多Agent构成的团体能够以一致性的方式采取行动,协调就成为多Agent系统的核心问题。协调是对活动间互相依赖关系的管理,包括对其目标、资源、思维状态等的合理安排,体现在共享资源约束、同时性约束、生产者/消费者关系、任务/子任务关系。
6. 结语
ABM 以自底向上的机理视角,为理解与治理复杂社会系统提供了第三条道路。其方法论正从 KISS 的启发式探索走向 KIDS 的高保真校准,在 ACP、数字孪生与 AI Agent 的推动下,逐渐由“验证假设的玩具模型”迈向“对现实的赋能与决策支持”。
「大模型时代下的Agent建模与仿真」读书会
集智俱乐部联合山东工商学院副教授高德华、天津大学教授薛霄、北京师范大学教授张江、国防科技大学博士研究生曾利共同发起。读书会自2025年7月8日开始,每周二晚上7:30-9:30进行,现读书会已结束,支持查看课程回放。扫码加入Agent建模与仿真的前沿探索之旅,一起共学、共创、共建、共享「大模型时代下的Agent建模与仿真」社区,共同畅想大模型时代人工社会的未来图景!
核心问题
Agent建模与仿真是什么,核心技术发生了怎样的演变?
大模型时代,Agent建模与仿真会给复杂系统理论带来哪些突破?
大模型如何赋能Agent实现自主思考与动态适应?
大模型驱动的Agent交互会涌现出什么新型的社会现象?
Agent建模与仿真如何改变金融、心理、管理、军事等领域的研究范式?
你将收获
梳理Agent建模与仿真的历史发展脉络与方法论;
掌握一套理解、分析、控制、预测复杂系统的计算实验框架;
掌握基于多主体强化学习的复杂系统优化方法;
领略领域前沿学者的研究体系与科研路径。
详情请见:
1.
2.
3.
4.
5.
6.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.