基于多策略改进灰狼算法的多无人机三维路径规划
作者: 许子俍 胡涛 刘凯越 安乐宁 杨思为
摘 要: 多无人机三维路径规划旨在满足约束且规避威胁的基础上给出各个无人机到自身目标合理可行的飞行路径。 针对当前元启发式算法在求解多约束、 多威胁三维空间路径规划时搜索速度慢、 规划路径质量差的问题, 提出一种基于多策略改进灰狼优化算法的路径规划方法。 使用数字高程模型完成三维空间环境建模, 结合飞行场景建立包含长度、 威胁、 高度、 平滑多因素综合评价函数。 通过复合混沌序列和准反向学习策略优化初始种群, 基于迭代阶段上层狼对种群收敛的关键影响, 使用精英狼凸透镜反射学习策略提升算法规避局部最优解能力。 仿真实验表明, 多策略改进灰狼优化算法综合评价函数统计结果的最优值、 平均值、 最差值三项指标相较原算法分别提升了6.1%, 5.1%和13.3%, 验证了本文方法在多约束、 多威胁的三维空间路径规划问题求解时的有效性。
关键词: 多无人机; 三维路径规划; 灰狼优化算法; 复合混沌序列; 准反向学习; 精英狼凸透镜反射学习
中图分类号: TJ760
文献标识码: A
文章编号: 1673-5048(2024)06-0086-08
DOI: 10.12132/ISSN.1673-5048.2024.0080
0 引 言
伴随科技快速进步, 无人机(Unmanned Aerial Vehicle, UAV)凭借其在复杂和危险环境中的工作能力而在军事领域备受关注。 多无人机路径规划是多无人机任务规划系统的重点环节之一, 其目的是当多无人机在三维空间中飞行时, 可以在满足相应约束条件及不与障碍物碰撞的前提下, 以尽可能小的成本代价为每架无人机找到一条飞往各自目标的最优路径[1]。
当前, 三维路径规划方法已取得许多研究成果, 传统路径规划方法有A*算法[2]、 快速探索随机树算法[3]、 人工势场法[4]、 Dijkstra算法[5]等, 该类方法由于需要大量计算时间和资源, 对于地形变化较多、 障碍类型多样的战场环境而言大多难以适用。 元启发式算法是仿照自然行为的群智能算法, 具有计算速度快、 计算逻辑简单、 算法灵活性强的特点, 正被越来越多地应用于解决复杂空间中的多无人机三维路径规划问题。 典型元启发式算法有粒子群算法[6](Particle Swarm Optimization, PSO)、 蚁群算法[7](Ant Colony Optimization, ACO)、 遗传算法[8](Genetic Algorithm, GA)、 麻雀算法[9](Sparrow Search Algorithm, SSA)等。 例如, Shao等[10]提出一种改进PSO的多无人机三维路径规划方法, 通过引入Logistic混沌映射和自适应线性变化系数提升算法性能, 实验表明, 该方法不仅加快了收敛速度, 同时提高了解的最优性。 Ali等[11]将ACO与差分进化算法融合, 提出一种适用于山脉环境多机协同路径规划的最大最小蚁群算法, 结果表明算法鲁棒性及跳出局部最优能力得到提升。 邓灏等[12]通过引入贪婪算子、 策略选择阈值方式动态调整变异概率, 提出一种基于改进GA的多无人机搜索路径规划方法。 王玲玲等[13]提出一种基于改进SSA的实时路径规划方法, 通过分别优化初始种群分布和迭代过程提升了算法的收敛精度和速度。
上述研究表明元启发式算法在解决多无人机路径规划问题具有很大的应用潜力和改进空间。 灰狼优化算法[14](Grey Wolf Optimization, GWO)是由Mirjalili等于2014年提出的一种仿照自然界中灰狼群捕猎行为的元启发式算法。 相较于其他启发式算法, GWO具有结构简单、 参数较少、 易于实现的优点, 目前已被应用于解决频谱感知[15]、 工程设计[16]、 疾病诊断[17]等多类问题。 然而, 标准GWO在求解多约束、 多威胁三维空间路径规划时存在搜索速度慢、 易陷入局部最优解、 规划路径质量差的不足。 为此, 在使用数字高程模型(Digital Elevation Model, DEM)建模及构建多目标评价函数的基础上, 本文在标准GWO中引入复合混沌序列、 准反向学习和精英狼凸透镜反射学习策略, 提出一种多策略改进灰狼优化算法(Multi-Strategy Improved Gray Wolf Optimization, MSIGWO)。 同时, 将MSIGWO与多种元启发式算法进行对比实验, 结果表明所提算法能够得到更优的UAV飞行路径规划。
1 三维路径规划模型
1.1 问题描述
本文考虑战场环境下, 多UAV协同执行多个地面目标的路径规划问题, 设定各UAV在任务分配完毕后从指定基地起飞, 穿过战场中心区域前往敌方阵地目标点完成各自任务, 任务区域内存在多处威胁源和山峰组成的禁飞区域, 考虑UAV为躲避威胁源和随地形起伏的飞行高度变化。
使用DEM完成三维空间环境建模, 该模型由原始数字地形模型和等效威胁地形模型组成。 原始数字地形模型如下:
h1(x, y)=sin(y+a)+b·sinx+
c·cos(d·x2+y2)+e·cosy+
f·sin(g·x2+y2) (1)
式中: x, y为水平面的投影坐标, h1(x, y)表示对应水平面投影坐标的高度; a, b, c, d, e, f, g为系数, 通过调节系数值可以改变地形。
威胁地形等效模型如下:
h2(x, y)=∑ki=1h(i)·exp-x-xoixsi2-y-yoiysi2(2)
式中: x, y为水平面的投影坐标, h2(x, y)为x, y对应的山峰高度; h(i)表示山峰i的最高点高度; xoi, yoi为山峰i最高点对应的水平面投影坐标; xsi, ysi表示山峰i沿x轴和y轴坡度相关的变量, 当高度确定时, xsi, ysi越小则山峰越陡峭。
将上面两种地形结合, 即可构建一个路径规划的基础三维空间模型:
h(x, y)=max(h1(x, y), h2(x, y))(3)
为合理简化问题, 聚焦研究目标, 在三维空间环境建模中将UAV等效为一个质点。 对于一条已规划的路径, UAV从起点开始经一系列路径点后到达目标, Lkij={xkij, ykij, zkij}表示无人机Vi执行目标Tj的路径点集合中的第k个路径点的坐标。
1.2 约束条件及评价函数
为有效评判路径规划结果优劣, 考虑UAV三维空间实际飞行场景和相关约束条件, 本文三维路径规划评价函数由四部分组成: 路径长度代价、 路径威胁代价、 路径高度代价、 路径平滑代价。
(1) 路径长度代价。 经过路径规划得到的UAV路径距离越短, 反映出UAV燃料消耗和飞行时长越少, 因此将UAV路径距离作为评价函数指标之一, 表示为
F1(Pathij)=∑n-1k=1LkijLk + 1ij(4)
式中: LkijLk+1ij表示无人机Vi执行目标Tj中第k个路径点和第k+1个路径点间的欧氏距离; n表示无人机Vi执行目标Tj的路径点总数。
(2) 路径威胁代价。 考虑到实际飞行过程中, UAV因控制精度、 定位误差等因素导致实际路径与规划路径间存在一定偏差, 因此规划出的路径不仅要避开障碍物和威胁源, 还应留有适当强制安全冗余距离。 如图1所示, Om为第m个威胁源的中心点; Rm为对应的威胁半径; Z为强制安全冗余距离; E为脱离威胁距离; Dk+1k为路径LkijLk+1ij到威胁源的距离。 当UAV位于威胁源的威胁半径或强制安全冗余距离内时, 即视为损毁; 当UAV介于强制安全冗余距离之外和脱离威胁距离之内时, 设定威胁代价与Dk+1k负相关; 当UAV位于脱离威胁距离之外时, 视为无威胁代价。 路径威胁代价表示如下:
F2(Pathij)=∑n-1k=1∑Mm=1Bk(LkijLk+1ij)(5)
Bk(LkijLk+1ij)=0, Dk+1k>Rm+Z+ERm+Z+E-Dk+1k, Z<Dk+1k-Rm≤Z+E∞, Dk+1k≤Rm+Z(6)
式中: Bk(LkijLk+1ij)表示第k个路径点和第k+1个路径点间的威胁代价; M为任务区域内的威胁源总数。
(3) 路径高度代价。 在作战任务过程中, UAV飞行高度通常被限制在一定范围之内, 例如侦察任务中UAV不应超过相机指定分辨率最大高度, 同时, 为躲避地面轻武器并避免随地形反复调整飞行高度, UAV不应低于设定最低高度。 如图2所示, Hmax和Hmin分别为最大高度和最低高度, 则路径高度代价如下:
F3Pathij=Hij-(Hmax+Hmin)2, Hmin≤Hij≤Hmax∞, else (7)
(4) 路径平滑代价。 由于UAV转向和爬升时会增加机体控制难度、 加速油量消耗, 因此路径规划倾向于同
等情况下让UAV飞行轨迹保持平稳。 设定路径平滑代价包括转向代价和爬升代价, 如图3所示, 转向角度θij为两个连续路径段LkijLk+1ij和Lk+1ijLk+2ij在水平面投影的夹角; Lk+1′ijLk+2′ij为UAV从第k+1个路径点到第k+2个路径点的路径在水平面上投影; δij为UAV该段路径的爬升角度。 根据UAV性能约束, 设定θij和δij分别不得超过最大转向角θmax和最大爬升角δmax。
取Z为沿Z轴正向的单位向量, 根据图3所示, 转向角度θij可表示为
θkij=arctanLk′ijLk+1′ij·Lk+1′ijLk+2′ijLk+1′ijLk+2′ij·Lk+1′ijLk+2′ij(8)