①研究背景:
在多智能体系统(Multi-Agent Systems, MAS)中,通信是实现分布式控制和规划的关键要素。通过智能体之间的信息交换,可以将预测和决策过程分布到多个节点上,从而提高系统的可扩展性与预测能力。
近年来,随着数据驱动控制方法的发展,越来越多研究尝试利用 图神经网络(Graph Neural Networks, GNNs) 来建模多智能体系统中的信息传播与决策过程。例如已有工作将 GNN 应用于 群体编队控制(flocking)、空间覆盖、多机器人路径规划以及运动规划等任务,并取得了一定效果。与此同时,研究者也逐渐关注学习控制方法的稳定性问题。已有研究尝试通过收缩分析(contraction analysis)来证明递归神经网络或控制系统的稳定性,并在 LSTM、GRU 等模型中引入输入到状态稳定性(ISS)和增量 IS(δISS) 的理论框架,以保证学习控制系统在动态环境中的稳定性。在这样的研究背景下,一个新的问题逐渐出现:如何设计一种既能利用 图结构信息传播能力,又能刻画 连续时间动力学行为 的神经网络模型,用于多智能体系统的分布式控制。
②传统方法
尽管图神经网络在多智能体控制中表现出良好的建模能力,但现有方法仍然存在一些局限。首先,大多数 GNN 模型本质上是 离散时间模型,它们通过层级传播或递归结构进行状态更新,而真实物理系统往往具有 连续时间动力学特征。因此,离散模型在刻画复杂动态系统时可能存在表达能力不足的问题。其次,传统图神经网络在多智能体场景中通常需要 大量通信变量。每个节点在每一层网络传播中都需要交换隐藏状态或特征向量,这会带来较高的通信负担,尤其是在大规模智能体系统中。另外,一些图递归神经网络(Graph Recurrent Neural Networks)在处理长序列信息时会遇到 梯度消失问题以及信息传播不平衡的问题,例如图中某些路径或节点可能在长期信息传播过程中被过度强化或忽略。因此,一个理想的模型需要同时满足几个条件:一方面能够描述 连续时间动态系统,另一方面要在 保持表达能力的同时降低通信开销,并且在理论上能够保证系统稳定性。
③LGTC模型
针对上述问题,论文提出了一种新的模型:Liquid-Graph Time-Constant (LGTC) Network。LGTC 可以看作是一种 连续时间图神经网络模型,它受到 Liquid Time-Constant (LTC) 网络 的启发。LTC 网络是一种基于 常微分方程(ODE)描述的连续时间神经网络,其时间常数是动态变化的,可以根据输入和内部状态进行调整,因此具有较强的表示能力。
在 LGTC 中,每个节点的状态演化由以下微分方程描述:

其中节点之间的交互由图结构传播算子 S 表示,例如 拉普拉斯矩阵或邻接矩阵。这种结构使得网络既能刻画 节点之间的图结构关系,又能表示 连续时间动态行为。LGTC 的一个重要特点是引入了 动态时间常数(dynamic time constant)。时间常数不仅依赖输入数据,还依赖于节点内部状态以及来自邻居节点的通信信息。这样,每个隐藏状态维度都可以捕获不同的动态模式,从而提升模型的预测能力。此外,论文还利用 收缩理论(contraction analysis) 对模型进行了稳定性分析,并证明在一定条件下系统满足 δISS(incremental input-to-state stability),从而保证多智能体系统在动态环境中的稳定性。为了进一步降低计算成本,作者还提出了一个 closed-form 近似模型,通过解析形式计算系统状态,从而避免在每一次迭代中求解 ODE。这种方法不仅提升了计算效率,同时减少了节点之间的通信次数。
④实验结果
论文在一个典型的 flocking 控制任务中对模型进行了实验验证。在该任务中,一组机器人需要通过局部通信实现协同运动:既要保持速度一致,又要避免彼此碰撞,同时由一个 leader 引导群体向目标移动。实验将 LGTC 与多种方法进行对比,包括:
- GGNN(Gated Graph Neural Network)
- GraphODE
- CfGC(闭式近似版本)

结果表明,在不同规模的智能体系统中,LGTC 在 群体编队误差和 leader 目标误差方面都优于传统 GGNN。具体而言,在某些实验设置下,LGTC 与其闭式近似模型相比 GGNN 在 flocking 误差上可提升约 40%,在 leader 误差上提升约 10%。此外,实验还验证了模型在不同通信半径条件下的鲁棒性。结果显示,当通信范围变化时,LGTC 和其闭式近似模型依然能够保持稳定性能,并且整体表现更接近专家控制器(expert controller)。
⑤总结
总体来看,这篇论文提出了一种新的 连续时间图神经网络模型 LGTC,用于多智能体系统的分布式控制。该模型通过结合 Liquid Time-Constant 网络与图结构信息传播机制,能够更好地刻画网络化动态系统的行为。同时,通过 收缩分析理论证明系统稳定性,并提出 closed-form 近似模型来降低计算与通信开销。实验结果表明,在典型的群体编队控制任务中,LGTC 在预测能力和控制性能方面均优于传统图神经网络模型。从更宏观的角度看,这项工作体现了一种值得关注的研究趋势,即 连续时间神经网络、图神经网络以及控制理论之间的融合。对于多机器人系统、分布式控制系统以及复杂网络动态建模而言,这种方法可能具有广泛的应用潜力。