基于时序逻辑任务的人机融合异构多智能体协同控制研究进展

分享至

现有的基于时序逻辑任务的多体协同控制方法，通常采用将时序任务描述为形式化语言后，将其转化为自动机，并与环境模型做乘积，最后在乘积自动机中做图搜索等方式完成任务规划。本文对现有方法的优缺点进行了比对，从目前常用的结合时序逻辑语言的控制方法出发，梳理了人机融合异构团队控制方法、系统对任务违反程度鲁棒性控制和人机协作任务间的耦合任务分配这3项关键技术的发展脉络，并盘点了TSTL等新兴时序语言描述在人机融合架构中的良好表现。分析了当前该类协同控制研究存在的任务描述难、解耦分配难、在线计算量大的科学技术瓶颈问题。

随着无人智能体系统的应用范围逐渐扩大，作业环境逐渐复杂化，人们对智能体所能够完成的任务提出了更高的要求。智能体需要能够理解并完成具有各种复杂时间约束，或者系统的性质随时间变化的任务。更重要的是，异构多智能体的协同配合工作越来越受到关注，如何将人作为异构多智能体的一部分，实现人机融合的协同作业系统，已经成为当下研究的重点学术问题。

为了将人引入智能体异构系统中，描述复杂的且带有严格时序关系的任务，一种形式化语言——时序逻辑（temporal logic）语言被提出。时序逻辑语言能够声明一系列不同类型的任务，且同时不会造成混淆和误解。其提供了一种准确且形式化的方法来限定系统的时序行为，以保证系统的行为符合预期，并能够及时甄别不符合任务约束的异常行为。有关时序逻辑的研究与模型检测、规划控制等方面的研究密切相关，属于多领域的交叉研究方向。时序逻辑作为一种对高阶时序任务进行描述的形式化方法，其提供一套便于人类理解的任务范式，用于声明复杂时序任务，并且可以在任务描述中包含人类在内的异构多智能体，实现人机融合。时序逻辑描述可以针对不同的系统特征以及任务形式，采用多种不同的范式类型，其中，线性时序逻辑（Linear Temporal Logic，LTL）适用于离散系统，其重点关注时序，系统的核心问题在于规划决策；而信号时序逻辑（Signal Temporal Logic，STL）则一般适用于连续系统，并对系统的动态进行规划，相比于LTL，STL具有额外的时间约束，能够对系统的完成任务时间进行约束。

同时，为构建人机融合的异构多智能体系统，考虑如何描述多机协同作业是必不可少的环节，例如多无人车围捕、多无人机编队等任务。在具有时序约束的场景中，单智能体所执行的策略是会直接影响其他智能体决策的，因而如何解决多智能体的带有耦合的时序逻辑任务控制问题，是研究的重点问题之一。目前，在结合多智能体控制与时序逻辑任务规划的研究中，已经发展出了一系列重要的成果，但在现有的研究成果中仍存在许多问题亟待解决。

在实际应用中，由于时序任务带来的任务约束、周边环境带来的环境约束以及智能体本身受到的输入限制约束等，需要解决的问题很复杂。因此，完整地解决时序逻辑任务规范下的多智能体异构控制问题是十分复杂的。一方面，要根据任务所需的形式考虑合适的时序逻辑规范；另一方面，还要根据实际的环境信息以及智能体本身的约束考虑合适的问题求解方式，例如采用混合整数线性优化、模型预测控制或者控制障碍函数方法等。另外，还需要考虑所选择的时序逻辑规范和求解方式是否匹配，是否存在无法求解的冲突问题。本文开展关于如何结合时序逻辑与多智能体控制的相关讨论。

1 国内外研究现状

1.1 基于时序逻辑任务描述的控制方法简述

早在1983年，已经有文献开始研究时序逻辑，其提到时序逻辑是一种用于指定和推论并发程序的形式化系统。它提供了一种统一的框架，用于描述任何抽象级别的系统，从而支持分层规范和验证。1994年，有关时序逻辑的研究已经基本发展为体系，并且提出了分支时序逻辑（Real-time Computation Tree Logic，RTCTL）、显式时钟逻辑（Explicit-clock Temporal Logic，XCTL）、定时命题时序逻辑（Timed Propositional Temporal Logic，TPTL）等早期时序逻辑描述的各种规范分支。近年来，结合时序逻辑规范的智能体控制方法逐渐完善，主流方法以LTL或STL作为约束，结合多种控制方法为主的智能体控制规划策略。

对于离散系统常用的LTL规范，最常用的将任务建模为LTL公式的方法为

式中，T是在系统的每个状态下为真的谓词，αϵ是原子命题，是原子命题集合，¬(非)∨(析取)和∧(合取)是标准布尔连接词，F和U是时序运算关系符，分别代表“最终”和“下一个”。

Ulusoy等提出了一种方法可自动规划一组满足高级任务规范的智能体的鲁棒最优路径。每个智能体在环境中的运动被建模为一个加权过渡系统，任务描述为环境区域内所满足的一组命题上的LTL规范。采用优化的方法，每个优化命题必须反复得到满足。目标是确保最小化优化命题满足之间的最大时间，同时确保即使智能体的行进时间不确定，依然能满足LTL规范。类似地，Ding等和Cai等同样采用优化的方法，研究了具有马尔可夫决策过程的系统的最优运动控制，以期望智能体满足在LTL规范约束下的复杂高级任务。其中，Cai等额外考虑了给定任务中潜在的不可行约束，提出了智能体对LTL任务的概率满足。图1展示了LTL任务概率满足。

图1 LTL任务在不同区域的概率满足

另外，Pacheck等考虑了LTL任务无法通过给定的行为完成的情况，提出了一种将符号修复与物理可行性检查和实现相结合的方法，以自动修改现有行为，使智能体能执行以前不可行的任务。其使用LTL规范捕捉反应性任务和安全约束目标，通过修改受符号衍生的LTL规范的原始行为，来在物理上实现任务满足。如果物理不可行，则自动为符号修复提供额外约束。LTL规范同样能建模为控制障碍函数提供约束，Bisoffi等采用了这种方法，通过障碍函数建立了一个具备可能性性质的混合系统框架扩展，其与满足LTL规范的条件相匹配。

而STL规范多用于连续时间系统，目前常用的方法是将STL规范下的任务转化成约束，结合模型预测控制或控制障碍函数的方法进行优化求解。Raman等采用了STL任务规范结合模型预测控制的方法，将任务建模如下：

给定形如xt+1=f(xt，ut)的系统，假设初始状态为x0，给定STL公式和成本函数J，在每一个时间步长t中，计算

式中，H是作为用户输入或某种其他方式提供的有限范围，uH,t是在每个时间步长t时计算的范围H的输入，且......。

其采用基于STL的使用来指定系统的广泛属性，包括安全性、响应性和有界性等。在模型预测控制中的每一步将STL规范编码为优化问题中的混合整数线性约束，是将STL规范转变为约束的常用方法。Lindemann等和Charitidou等则采用控制障碍函数的约束方法，Lindemann等提出基于控制障碍函数和STL任务规范的框架，将其时间特性用于满足STL任务，Charitidou等则受现有利用控制障碍函数（Control Barrier Function，CBF）编码STL任务的方法的启发，提出一种用于编码STL约束的连续可微函数，该函数被定义为最大算子的平滑逼近器和一组函数的组合，该函数确保所需的鲁棒性满足相应的STL任务，并导出选择K类函数的条件（当后者被认为是线性时），以确保所提出的函数是CBF。Yao等针对混合系统的研究，建立了一类由连续部分和逻辑部分组成的混合系统的数学表达式，引入局部有限时间间隔驻留（Locally Finite Time Interval Dwell，LFTID）的概念，它与满足STL规范的条件相匹配。然后，结合半张量积（Semi-Tensor Product，STP）和类李雅普诺夫方法，得到了满足给定STL规范的充分条件。

近几年，时序逻辑还在许多领域的研究中取得了显著的成果，例如考虑广义反应性下对不可能完成的时序任务的反策略优化，基于高级时序任务的机器人手臂分散控制，具有混合动力学和时序任务目标的运动规划，线性控制系统在固定时间镇定的非线性反馈设计，以及应用于回溯视界控制、修改运动规划、未知环境运动规划等。

1.2 结合时序逻辑的人机融合异构多智能体控制

为了解决日益增长的任务需求，完成单智能体无法完成的复杂强时序约束任务，异构多智能体结合时序逻辑任务规范的控制已经逐渐成为研究的主流，尤其是考虑人类或操作员作为异构系统的一部分进行干预的人机融合系统研究。在STL规范下的基于CBF控制方法逐渐向多智能体协同控制的方向发展，在基于领导者-跟随者形成控制方法或基于多智能体任务分配等传统算法中，结合时序逻辑规范的成果也逐渐涌现。Li等同时考虑了时序逻辑任务中可能出现的不相关任务、兼容任务和独占任务，将传统的基于LTL的原子命题扩展为批量原子命题，提出了LTLT公式，开发了任务批量决策规划树（Task Batch Planning Decision Tree，TB-PDT），它是专门用于时间逻辑和任务间约束的传统决策树的变体。图2为一个典型的异构多智能体系统示意图。

图2中的三角代表了异构多智能体的每个智能体部分，可能也包括人类操作员。它们的任务相互耦合且互相影响，基于TB-PDT，针对异构多智能体的快速任务分配问题，提出一种密集任务间关系树搜索（Intensive Inter-task Relationship Tree Search，IIRTS）算法，大大减少了找到满意路径的计算时间。Xu等提出一种新的协作多智能体系统的控制综合方法，以完成给定有限轨迹上的LTL的全局任务。该方法首先为不受控系统综合了可满足的全局控制器，使其满足全局规范；然后在最大同步方案上在它们之间搜索可分解的全局控制器；最后，进一步细化同步方案，得到分解后的分布式控制器。为了在可满足的全局控制器中搜索可分解的全局控制器，提出了一种基于全局控制器可分解性分析的知情搜索算法。Banks等采用了跨熵优化函数，开发了多智能体任务分配交叉熵（Multi-agent Task Allocation Cross-Entropy，MTAC-E）来对LTL规范进行分配。

图2 医院场景的异构多智能体系统

Charitidou等在该问题上有很深入的研究，重点讨论当智能体团队被先验分解为不相交的子团队时，如何将分配给多智能体系统的全局STL规范分解为局部STL任务的问题。通过给定的子团队的中间状态，将与本地任务相关联的谓词函数参数化为超立方体，通过凸程序隐式求解的方式进行求解。在后续工作中，Sharifi等基于时变高阶CBF的控制策略，结合领导者-跟随者的编队算法，使领导者掌握相关任务的知识，并控制涉及智能体的子组的性能。跟随者不知道这些任务，也没有任何控制权限来获取相关内容，根据其与领导者之间的动态联系，间接地遵循领导者的指令，以完成分配的任务。

在实际应用中，结合时序逻辑的多智能体控制方法广泛应用于无人车道路网络或高机动无人机集群中。Zheng等研究道路网络中的多智能体路径规划问题，该问题要求在分区环境中避免所有智能体之间的碰撞，其首先将代理抽象为一组过渡系统，并从这些单独的系统构建一个团队过渡系统。为团队过渡系统设计了一种机制，用于检测合成运行中的所有碰撞。然后，将“等待”和“返回”两种时序逻辑行为过渡添加到各个过渡系统中，以此避免团队过渡系统中所有可能的碰撞。Pant等则是考虑在城市空中机动（Unmanned Aerial Vehicles，UAV）中，多架有人和无人机在空域执行各种任务的场景，场景示意如图3所示。

图3 多无人机空域任务场景

该团队提出了一种共同设计规划器和控制的方法，使得给定的STL规范（可能在多个无人机上）满足动态可行的轨迹，并且其控制器可以用规划器考虑的有界跟踪误差来跟踪它们。跟踪控制器是为单个无人机的非线性动力学制定的，并且当轨迹满足一些运动学约束时，计算该控制器的跟踪误差界。其研究成果中还增强了现有的基于STL的多无人机轨迹生成器，以生成满足这些约束的轨迹。

1.3 异构系统对时序逻辑任务的违反程度

虽然时序逻辑语言可以很好地描述时序任务，并且将其分配给多智能体，但在实际系统中，很多情况下并不能保证所给出的任务能够实现。这可能是很多原因导致的，例如环境的实时变化、任务目标发生改变，或者智能体的输入达不到控制需求等。如果采用LTL规范描述任务，则只能给出轨迹对任务“是/否”满足的二值化表述，而STL规范则不同。STL规范能够提供一个数值的衡量，表征系统轨迹对任务的满足程度，该实数值一般称为STL的鲁棒性。STL的鲁棒性反映了系统对任务的满足，或者说违反程度，基于STL的鲁棒性，可以对系统进行更精细的控制，保证其在运行过程中尽可能满足所提出的任务。例如Gilpin等提出基于鲁棒性的平滑近似，克服了鲁棒函数非光滑的缺点，在保证保守性和完整性的基础上完成STL任务。Pant等考虑了类似的内容，引入了光滑算子，设计了能最大限度地提高时序逻辑公式鲁棒性的控制器。另一方面，Sadraddini等将STL的鲁棒性与模型预测控制结合起来，引入了一种保守且计算高效的框架来综合基于混合整数规划的控制策略，所设计的控制器是满足STL要求，对扰动的所有可能实现都是鲁棒的，并且相对于成本函数是最优的。Chen等则采用混合控制策略，并结合先前的工作，为领导者-跟随者系统提出了一种基于漏斗的控制策略，通过规定漏斗上约束闭环轨迹的某些瞬态行为，来增强对STL基本规范的满足。

除此之外，时序逻辑的鲁棒性还存在一些变体形式，例如Donzé等对鲁棒性进行改进，提出一些新的鲁棒性度量变体，包括混合时空鲁棒性、计算鲁棒性度量等，以及计算这些鲁棒性度量的方法和对系统参数或公式中出现的参数敏感性。Mehdipour等提出一种新的基于平均值的STL鲁棒性，构造一个在STL约束下动态系统最优控制的框架。

时序逻辑的鲁棒性已经广泛应用于各类现代智能体系统中，尤其是需要建模为混合系统的复杂系统。例如Xu等考虑现代智能建筑环境，提出了一种方法来构造混合系统的观测器，通过从模拟轨迹推断时序逻辑公式来区分混合系统的不同位置，并将其应用于智能建筑占用检测中。Bisoffi等则在具有输出反馈的线性对象上公式化了满足时序逻辑规范的问题，并与形式主义引入的递归概念联系起来，扩展了无界递归的类李雅普诺夫条件，保证了对象在后续演化中满足规范。

1.4 人机协作任务间的耦合关系

时序逻辑的鲁棒性表示了系统在运行过程中对于任务的违反程度，可以借此尽可能地构建满足任务要求的控制器。但在人机融合异构多智能体系统中，由于存在多智能体与人类间的协作、配合，某些任务间存在强耦合关系，可能无法构建出满足鲁棒性的控制器。这也成为当前异构多智能体系统完成复杂时序逻辑研究中的重点问题之一。

有许多研究者对此给出了具有针对性的解决方法。Zhou等研究了分布式框架中主从智能体的STL任务规范问题，由于耦合任务的存在，子任务的链接可能存在冲突。其提出了一种两步分步式模型预测控制（Distributed Model Predictive Control，DMPC），以最大化地满足可能的子任务数量，并最小化失败的子任务的违反程度。在第一步中，设计一种新的STL鲁棒性度量，来衡量子任务的满足程度，将其作为优化约束纳入DMPC问题中；基于第一步的规划结果，第二步中设计了一个短时间DMPC优化问题，用以最小化不满足子任务的违反程度，同时确保其他子任务的满足。Kantaros等面对大规模多智能体系统的复杂时序规划问题，提出一种新的高度可扩展的渐近最优控制综合算法，称为STyLuS*，可用于大规模最优时序逻辑综合，并证明了该方法是概率完备且渐近最优的，并且具有指数级别的收敛速度。该方法可以为非常大规模的多智能体系统合成最佳运动轨迹。Sewlia等也在其先前研究的基础上，提出MAPS2，一种分布式算法，允许多智能体系统传递以STL约束表示的耦合任务。通过建立STL解析树与满意度变量树，对STL任务进行解耦和分配。MAPS2具有概率保证，提供一种随时迭代改进智能体轨迹的算法。该算法利用STL的时间特性选择性地施加空间约束。该算法是分布式的，因为每个智能体只通过通信图定义的直接邻居来计算其轨迹。

另一方面，需要考虑多智能体团队的任务可能并非全部是协作任务，也存在需要智能体进行对抗的环境。Muniraj等结合深度学习算法，考虑了智能体如何在这种对抗环境中执行STL规范，将智能体之间的相互作用建模为具有未知转移概率函数的有限状态团队随机博弈，综合目标是确定防御智能体的最优控制策略，用以针对性对抗对手执行最佳响应STL规范的进攻者。其提出了一种多智能体深度Q学习算法，来学习得到最优策略。

1.5 一些其他的时序逻辑表述与人机融合方法

尽管在实际应用中，使用LTL规范和STL规范的场景较多，其也能较好地描述绝大部分时序逻辑任务。但在一些特殊场景下，这两种描述规范可能不能够满足复杂任务的需求。例如STL本身其实就是度量时序逻辑（Metric Temporal Logic，MTL）规范的一种变体。不同的时序逻辑语言之间在描述和应用上可能存在巨大的差别，例如MTL规范可以被建模为确定性自动机，但其变体的STL规范无法直接建模为确定性自动机，需要进一步转化。为了能够尽可能满足更多的任务需求，越来越多的时序逻辑变体的表述被提出。

Dokhanchi等提供了一种比MTL更具表现力的时序逻辑规范：定时命题时序逻辑（TPTL），并提供了动态编程算法用于监视。这种规范的特征是独立的时间变量，能够引出更为复杂的实时需求。Ghorbel等在TPTL的基础上更进一步，引入了类似STL的鲁棒性概念，使其更具表现力，提出了定时信号时序逻辑（Timed Signal Temporal Logic，TSTL），在时序逻辑的表述中引入了“冻结变量”，以便表达STL无法表达的许多自然工程需求；开发了用于在逐点语义中计算跟踪上的鲁棒性值的算法，还开发了一种优化算法，用于计算轨迹长度的时间线性鲁棒性。另外，Vasile等为了能够紧凑地表示串行任务，提出了时间窗时序逻辑（Time Window Temporal Logic，TWTL），并讨论了相对于任务终止时间的松弛性，提出了有效的基于自动机的框架来解决综合、验证和学习的方法。Sahin等扩展了LTL的概念，提出了计数线性时序逻辑（Counting Linear Temporal Logic，cLTL），用于在可能无界的范围内简明地描述多智能体的任务规范以及如何生成满足给定cLTL的轨迹。

在时序逻辑结合人机融合的研究中，Tian等基于STL提出了一种终点回溯的规划方法，突破了现有的时序逻辑研究中规划路径计算量过高的瓶颈，构建了离线构建和在线规划相结合的两阶段规划方法，将研究目标扩展到人机融合的多智能体协同工作场景。更进一步地，Shang等则深入探讨人类操作员与多个智能体相互合作的人机融合团队协作问题，提出一种分布式分层共享控制方案，为少数人类操作员提供与智能体团队进行交互的安全灵活控制接口，通过在多智能体团队在线规划过程中引入人为干预的方式，充分发挥人类比智能体更快发现并预防紧急情况的能力。

2 相关科学瓶颈问题

结合时序逻辑任务规范的人机融合异构多智能体控制尽管已经得到国内外专家的广泛关注，但是目前仍存在许多尚未攻克的瓶颈问题，表1中展示了一些现有的各类研究方法的优点及不足之处。具体来说，现有研究存在的主要问题表现在以下3个方面。

表1 该领域部分现有研究方法优缺点

2.1 具有强时间约束的复杂人机协作任务难以描述

目前绝大多数研究所针对的时序逻辑任务，依然通过LTL或者STL规范进行描述，前者可通过建模为确定性自动机的方法处理，后者通过建模为CBF或模型预测控制的优化约束的方法已逐渐成熟。但正如1.5小节所述，单纯的LTL或STL对任务的描述存在缺陷，一些具有强时间约束的复杂任务无法通过这两种规范进行描述。

尽管现在已经有许多新的时序逻辑描述出现，用以描述复杂的强时间约束问题，但这些方法通常具有局限性，对智能体系统本身提出要求，无法简单地迁移到其他智能体系统中进行应用。例如Ghorbel等提到的方法，为了解决STL无法描述的需要嵌套进行多个时间模块的描述时，通过引入冻结变量构造TSTL；但TSTL在这篇文章中只能选取其片段进行求解，虽然该片段的效果表现仍比单纯的STL要好，但由于TSTL本身的PSPACE困难问题，使其无法计算一般的TSTL公式的鲁棒性，无法推广到时间序列较长的其他智能体系统中。因此，关于如何构造出较为通用的、能够描述复杂时序逻辑任务的时序逻辑描述，仍是目前研究的难点。

2.2 具有强耦合关系的人机协作任务难以解耦

尽管现有的文献已经采用各种方法对耦合任务进行了解耦，将其作为子任务分配给相对应的智能体，但是在面对强耦合的任务，需要协作的智能体数量达到一定规模时，仍然无法做到真正的去集中式。

Sewlia等提到，通过STL解析树的方式将STL任务解耦，但无法解耦的强耦合任务依旧保留了下来，然后通过智能体与邻居间通信的方式，完成相关协作任务。这种控制方法，一旦强耦合任务需要的智能体数量增多，就可能无法做到解耦，进而无法完成分布式控制。在另一种方法中，通过离线拆解耦合边，在规划任务时令智能体认为协作条件已达成，之后通过在线广播需求实时建立耦合边的方式完成耦合协作。这种方式依旧存在在线通信延迟和实时计算量偏大的问题。因此，如何处理具有强耦合约束的任务描述，使其能够做到真正地去集中式控制，仍需要进一步的研究。

2.3 分布式在线计算量过大，难以应对突发状况

即使完成了解耦及任务分配工作，但由于时序逻辑规范通常描述为优化约束的方式加入优化算法，通常需要在线求解优化问题，且优化约束还有可能随着时间发生变化。这对智能体的在线计算能力提出了很高的要求。目前，也有例如Sadraddini等构建优化算法以提高计算效率的方法，但也有很多文献选择对给定的任务形势做出限制，来降低高级时序约束带来的高计算量。常用的方法包括不构建完整的智能体模型-任务的乘积式自动机，而是通过采样的方式构建部分自动机，或者放弃乘积式自动机的思路，通过组合优化的思想，根据偏序规划或动作链生成等方式降低在线计算量。但这些现有的方法仍难以面对强时间约束环境下的在线突发状况。

另一方面，由于任务间存在耦合关系，智能体在运行过程中不可避免地需要与邻居智能体进行沟通，这个过程中存在通信延迟，会进一步加大同分布式计算带来的风险，存在难以应对突发状况的可能。

结论

由于现有人机融合异构智能体任务描述存在的强约束、强耦合、分布式等特点，使针对这类问题的方法难以做到具有足够的通用性。但是这类任务具备很强的应用价值，虽然已经有越来越多的学者开始关注时序逻辑约束下的人机融合控制方法，并且目前已经产出了许多极具参考性的研究成果，但正如上文所述，现有的理论方法仍存在一定的局限性，无法直接推广到更广泛的应用场景中。

针对以上难点，结合时序逻辑的人机融合多智能体协作控制方式的未来发展趋势将主要分为3个领域：第一是针对任务描述问题，构建更为通用的、能够描述强耦合、强约束的时序逻辑语言，以便将复杂的时序人机融合任务描述为智能体团队能够理解和接受的通用语言；第二是针对复杂耦合任务的解耦，将智能体团队需要完成的强耦合任务，解耦为单独智能体或智能体小团队完成的分布式小任务，做到任务控制的去集中化；第三是针对大规模长时间范围内的大型任务，在任务描述和任务解耦的基础上，研究新一代的优化算法或控制算法，例如通过线性复杂度模型代替现有的自动机模型，将指数复杂度的计算量降低为线性，以此应对分布式计算量过大的问题。

相关的技术研究具备良好的应用领域与前景，考虑复杂的作业环境，例如在水下作业的无人艇集群或高空超高速环境下作业的无人机集群，考虑到人机融合中操作员对团队的干预，能准确描述任务需求，让团队及时理解并做出决策的时序逻辑语言描述尤为重要。此外，面对实时动态变化的不可知环境，系统计算的高效率非常重要，必须以分布式控制的方式降低系统的计算复杂度，来及时对动态环境和可能改变的任务需求做出实时调整。

结合时序逻辑的人机融合多智能体协作控制方式未来将进一步综合现有研究成果，以具备通用性的时序逻辑描述语言为基础，构建人机融合任务解耦及分配方案，保证任务的可行性，设计高效的任务分配及控制算法，最终实现能完成人机融合协作任务的高效多智能体团队协作控制。

本文作者：张心骜、方浩、赵欣悦、陈仲瑶、柯唯翎

作者简介：张心骜，北京理工大学自动化学院，博士研究生，研究方向为时序逻辑任务约束下的多智能体控制；方浩（通信作者），北京理工大学自动化学院，教授，研究方向为多智能体协同决策与控制。

原文发表于《科技导报》2024年第12期，欢迎订阅查看。

内容为【科技导报】公众号原创，欢迎转载
白名单回复后台「转载」

《科技导报》创刊于1980年，中国科协学术会刊，主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述，发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.