基于距离及相对角度信息的多智能体系统刚性编队任务规划

作者: 黄捷 李俊杰

基于距离及相对角度信息的多智能体系统刚性编队任务规划0

摘 要:针对仅在获取多智能体局部距离及相对角度信息条件下如何保持多智能体系统刚性编任务规划队问题, 本文提出了两种多智能体刚性编队任务规划方案。 首先提出一种基于距离和相对角度的刚性编队规划方案, 规划在未知相对位置情况下确保智能体刚性编队。 其次利用零空间投影的任务规划方法解决编队任务与避障任务的冲突, 确保编队移动过程中编队队形的稳定。 再次结合距离和相对角度提出一种整体刚性编队规划方案, 并在避障过程中将多智能体系统视为整体进行避障, 确保稳定的刚性编队和避障任务的完成。 经过仿真验证本文提出的两种方法在弱化相对位置信息的条件下能够较好的保持刚性编队并完成避障任务, 对比于依赖相对位置的零空间行为控制方法弱化了对于相对位置信息的依赖。

关键词:  刚性编队; 任务规划; 多智能体系统;  相对角度信息;  距离信息

中图分类号:  TJ760

文献标识码: A

文章编号:  1673-5048(2024)02-0079-12

DOI: 10.12132/ISSN.1673-5048.2024.0003

0 引  言

由于多智能体系统具备自主性、 分布性、 协同性等特性, 近二十年来, 多智能体系统的研究成为人工智能领域的热点之一。 多智能体系统通过各智能体间的通讯、 合作、 竞争及控制等来实现大规模自主无人系统群体智能特征的涌现。 多智能体系统协作不仅是单个智能体作用的简单相加, 其整体效能还包括个体之间相互作用的非线性增量。

多智能体是表征集群飞行器等无人系统的一种典型技术, 由于飞行器等运动体往往具有任务约束和编队的性能要求, 包括了集群任务规划与协同运动控制等关键技术。 在过去的研究中, Martin等[1]基于博弈理论提出一种合作博弈理论框架用以实现多机器人的集聚与编队生成; Flores-Resendiz等[2]提出一种由有界吸引分量和互补排斥分量组成的控制策略解决二阶多智能体系统的无碰撞编队控制问题; Lin等[3]基于李代数方法提出一种多四旋翼系统内外环分布式编队控制方案, 消除干扰和偏置扰动引起的不可靠角速度反馈; Kankashvar等[4]基于改进多智能体强化学习价值函数提出一种航天器编队飞行重构跟踪方法; Guo等[5]基于一致性理论和局部邻域信息提出一种包含避障, 避碰和编队重建控制项的分布式编队控制器。

刚性编队是多智能体编队领域的一种特殊编队方法, 其要求各智能体两两之间距离保持不变, 从而形成固定的刚性队形, 多智能体刚性编队包括了刚性任务规划与运动控制。 在一些具体的应用任务, 如大型物体的搬运[6]、 多无人机协同覆盖[7-8]和多航天器稳定编队[9-10]等研究中, 所有的智能体必须组成特定的队形并在执行任务期间保持整个队形不变, 保持严格的刚性编队。 当多智能体的坐标框架存在微小的错位时, 队形会发生扭曲, 并带来额外的平移运动, 这将影响整体框架稳定性。 为了增强多智能体坐标框架的鲁棒性, 可采用刚性理论[11]这一数学工具来保证多智能体系统的刚性编队保持。 Krick等[12]以及Aranda等[13]提出,  多智能体系统刚性编队要求在欧几里得空间中, 整个系统的队形逐渐收敛到一组由期望距离所定义的刚性队形。

图论在多智能体刚性编队问题中扮演关键角色, 尤其刚性图理论成为该领域的研究热点。 Aspnes等[14]的研究揭示了刚性概念与编队问题之间的关联,  并提出了一种基于刚性图设计刚性编队规划的方法。 Olfati-Saber等[15]采用质点模型, 提出了基于势函数的编队规划方法, 并利用刚性图论定义了编队队形, 实现了基本的刚性队形。 Zhou等[16]以及Arrichiello等[17]利用全局相对位置信息并基于零空间行为控制(Null-Space-based Behavioral Control, NSBC)的方法设计了刚性编队的控制律。 然而, 在实际应用场景下如物流智能体编队控制, 智能体室内编队探测过程中, 全局的相对位置信息及全部智能体的质心往往难以获得, 且获取相对位置信息一般需要依赖卫星定位。 刘国波[18]考虑弱化相对位置信息, 提出基于部分方位刚性的多智能体领航-跟随编队控制方法, 满足了刚性编队中智能体间的期望相对方位约束。

在弱化多智能体相对位置信息的刚性编队研究中, 部分研究者针对如何形成刚性编队的规划问题进行了研究。 肖志旋等[19]利用多智能体方位信息,  提出了一种基于方位信息的刚性编队方法, 使得系统能够实现无穷小方位刚性。 然而仅利用方位信息形成的编队仍存在缩放特性, 无法在距离上满足全局刚性的要求; Yang等[20-21]基于边缘应力结构提出了一个具有全局刚性的虚拟张拉整体框架, 以满足各智能体间的严格距离要求。 然而, 该方法对距离的限制要求过于严苛, 且构造张拉结构的过程较为复杂, 在特定场景下的鲁棒性较差; Chen等[22]利用初始三个智能体的相对位置信息并根据相对角度信息对其余智能体进行刚性编队, 保证队形的刚性要求。 然而该方法仍需获取初始三个智能体的相对位置信息, 在位置信息的要求上仍有提升空间。 Wang等[23]及Zou等[24]利用领航者测量相对于不确定目标的相对方位信息, 同时保证定位和绕航目标的实现。

在多智能体刚性编队问题中, 同时满足避障约束并保持编队稳定是刚性编队过程中的一大挑战。 目前, 研究人员采用了多种避障技术, 包括人工势场方法[25-26], 基于行为的方法[27-28]和基于优化的方法[29-30]等。 这些方法在各种多智能体编队问题中得到了广泛应用, 但众所周知的是其都存在一些局限性, 例如容易陷入局部极小值问题而导致避障失败。 基于行为方法中的基于零空间的行为控制方法, 是一种通过零空间投影解决任务冲突来实现避障的方法。 该方法允许多智能体系统在执行主要任务的同时, 处理附加的次要任务或行为。 使得多智能体系统在执行主要任务时具备更高的灵活性和多功能性[31]。 例如, Zheng等[32]采用了零空间行为控制架构来实现多智能体系统的时变队形控制, 并避免与障碍物发生碰撞; Golluccio等[33]提出一种改进的学习算法对NSBC方法进行了扩充, 使得机器人能够动态选择适当的低优先级任务进行执行; Wang等[34]基于零空间行为控制方法提出了一种分层子任务融合策略, 用于解决多个子任务的无冲突融合调度; Zhang等[35]基于零空间的行为控制框架提出了一种自适应动态规划方法, 用于无人地面车辆-机械臂的协调控制。

由于飞行器编队方法大多依赖期望相对位置信息[36-37], 然而快速运动的集群无人机等系统常常难以获得期望的相对位置信息, 为了降低各飞行器对位置信息依赖, 受到文献[16, 27]等研究成果的启发, 本文进一步研究如何在不使用相对位置信息情况下通过得到各智能体间的相对角度信息与距离信息来保证多智能体系统的刚性编队规划方案。 其中, 相对角度及距离分别表示在智能体i坐标系下与父节点j以及领航者k所形成的相对角度以及在智能体i坐标系下与父节点j之间的距离。

本文的创新点如下:

(1) 提出一种基于距离及相对角度限制约束的多智能体系统刚性编队任务规划方案。 相较于文献[16],  该方案无需获取全局的编队位置信息, 消除了编队任务对于相对位置信息的依赖。 相较于文献[20-21],  该方案考虑在编队移动过程中的避障问题, 解决编队任务与避障任务的冲突。

(2) 提出一种将多智能体编队在避障行为中视为整体的大范围避障方法, 该方法在保持编队刚性的要求下, 相较于文献[16]具有更小的位移及相对角度偏差, 在不需要进行经过较小障碍通道的情况下具有更小的相对角度和距离误差。

1 基本概念及问题描述

1.1 刚性图及刚性矩阵理论

多智能体系统刚性编队在数学上可以用如图1所示的杆-球链接结构来形象地描述。 其中球代表智能体, 木杆代表边。 球和球之间由一定数量的不可形变的木杆联系, 这种拥有杆-球链接的编队就是刚性编队。 这种编队结构可以通过图论方法进行数学表示。 在刚性编队中, 智能体对应图论中的顶点, 智能体之间的通讯对应图论中的边。 本节将介绍刚性概念的规范定义和一些重要的定理性质。

定义1: 在瘙綆2中, 各个智能体的位置信息可用pi={pix,  piy}来表示, 而各个智能体的位置合集为P={p1,  p2,  …, pn}, 各个智能体之间建立的通讯关系可用E来表示, E={e1,  e2,  …, em}。 整个队伍的队形用Fp=({p1,  p2,  …, pn},  E)来表示, 各个智能体之间的距离用dij=pi-pj2来表示, 式中P与E分别为数学中的顶点集与边集的概念。

定义2: 某一个队形Fp是由P,  E,  d所唯一决定的。

定义3: 在瘙綆2中, 如果刚性是一个队形Fp的唯一运动要求, 则Fp在执行任何任务的时候都能够保持E中的各条边的距离不变, 则称Fp为刚性编队队形。

定义4: 刚性矩阵R表征了刚性编队中各个顶点之间的链接关系及各条边的距离关系, 综合性反应了刚性编队的性能指标。 刚性矩阵R具有两种定义方式, 分别从不同的角度出发但最终得到的矩阵形式是相同的。

刚性矩阵在刚性编队中扮演着至关重要的角色。 多智能体刚性编队是指由多个智能体以固定的相对位置和姿态组成的编队。 刚性矩阵作为一种数学工具, 用于描述不同多智能体之间的相对位置关系。

具体而言, 刚性矩阵用于表示一个多智能体相对于另一个多智能体的旋转和平移关系。 这些关系可以通过测量多智能体之间的距离和相对角度来确定。 在刚性编队中, 每个多智能体都配备了传感器, 用于测量其与其他多智能体之间的距离和相对角度。 这些测量值可用于确定各智能体的期望位置。

刚性矩阵的计算和更新是刚性编队算法的核心。 通过不断计算和更新刚性矩阵, 多智能体可以实时调整其相对位置和姿态, 以保持编队的稳定和准确性。 刚性矩阵的主要求解方法包括定义刚性方程以获取雅可比矩阵, 并据此得到刚性矩阵。

由定义1能够给出刚性方程gG:瘙綆2n→瘙綆|E|的概念:

gG(p)=[‖pin1-pout1‖2,  …, ‖pinm-poutm‖2]T(1)

式中: pin1,  pout1,  …,  poutm∈1,  2,  3,  …, n, pini-pouti2是由E中的ei来决定的, 表征的是第i条边的情况, 而pini和pouti分别为第i条边的两个顶点。 而刚性方程是由各个智能体构成的图的边与顶点的分布情况来决定的, 所以, 求解刚性方程的雅可比矩阵, 便可以得到刚性矩阵:

JgG(p)=2(pin1-pout1)p1(pin1-pout1)p2…(pin1-pout1)pn

(pin2-pout2)p1…(pin2-pout2)pn

(pinm-poutm)p1……(pinm-poutm)pn(2)

除去系数2, 则得到的JgG(p)=R(p), 由此可得到刚性矩阵R。 零空间行为控制方法求解得到的雅可比矩阵与得到刚性矩阵的思想相似[16], 均是通过对编队任务进行求导以得到实时雅可比矩阵从而确定各个智能体的运动规则。

1.2 基于零空间的行为控制算法介绍

本文采用了基于零空间的行为控制方法[16], 通过将多智能体的不同行为设计为不同的任务函数, 并根据实际经验对任务进行优先级设计。 此方法将低优先级的任务投影到高优先级任务的零空间向量上, 以实现在高优先级任务完整执行的同时, 执行低优先级任务与高优先级任务的不冲突部分, 解决任务的冲突问题, 保证编队稳定性。 根据实际经验, 本文将避碰和避障设置为多智能体的最高优先级任务, 编队形成、 编队切换等其他任务都作为次优先级任务。

基于上述任务优先级设计, 进一步对多智能体系统的基本任务进行设计。 假设通用任务函数为σ∈瘙綆m(m表示通用任务的维度), 则任务函数为

经典小说推荐

杂志订阅