基于DMPC的多无人机轨迹跟踪与避碰切换控制
作者: 赵超轮 戴邵武 何云风 刘帅 赵国荣
引用格式: 赵超轮,戴邵武,何云风,等 . 基于DMPC的多无人机轨迹跟踪与避碰切换控制[ J]. 航空兵器,2023, 30( 6): 64-74.
Zhao Chaolun,Dai Shaowu,He Yunfeng,et al. Trajectory Tracking and Collision Avoidance Switching Control for Multi-UAV Based on DMPC[ J]. Aero Weaponry,2023, 30( 6): 64-74.( in Chinese)
摘 要: 多无人机系统在编队飞行过程中往往会遇到突发的静态或动态的障碍物威胁,如何实现对障碍的规避是多无人机系统所必须解决的关键问题之一,为此本文提出一种带有模式切换的分布式模型预测控制算法。根据有无碰撞风险设计出跟踪、避碰两种控制模式及切换策略,其中,跟踪模式以跟踪轨迹为目标,相应算法能保证系统渐近稳定;避碰模式则以避碰为首要目标,通过触发式引入避碰约束来实现无人机与障碍间的避碰。相较传统单一模式下的预测控制算法,本文方法可使无人机更有效地规避预先未知的大型障碍,具有保守性低、计算时间短等优势, 最后利用6架四旋翼仿真验证了算法的有效性。
关键词: 多无人机;轨迹跟踪;避碰;模型预测控制;模式切换
中图分类号: TJ760;V279
文献标识码: A
文章编号: 1673-5048(2023)06-0064-11
DOI: 10.12132/ISSN.1673-5048.2023.0140
收稿日期: 2023-07-14
基金项目: 国家自然科学基金项目(61903374)
作者简介: 赵超轮(1995-),男,山东诸城人,博士研究生。
*通信作者: 戴邵武(1966-),男,湖南邵阳人,博士,教授。
0 引 言
当前,多无人机系统在众多领域展现出巨大的应用潜力,如搜索救援[1]、海洋勘测[2]、物资配送[3]、移动边缘计算[4]、军事作战[5]等。关于多无人机系统的研究越来越受到人们的重视。多无人机系统的一个核心问题是编队跟踪控制,它要求无人机在跟踪参考轨迹的同时保持指定的队形。根据无人机间信息交互情况的不同,编队跟踪控制算法可分为集中式、分布式、分散式;根据编队控制策略的不同,其可分为领航跟随法[6]、虚拟结构法[7]、基于行为法[8]、虚拟领航法[9]等;根据具体的生成控制量的方法不同,其可分为反步法[10]、滑模控制[11]、PID控制[12]、一致性算法[13]、人工势场法[14]、模型预测控制(Model Predictive Control,MPC)[15]等。
然而,对于多无人机系统,大多数控制方法在各种约束条件下,如输入饱和、速度限制、安全约束等,不能达到最优的控制性能。相比之下,MPC[16]被认为是少数几种能够显式处理约束并优化控制性能的方法之一。而分布式模型预测控制(Distributed Model Predictive Control, DMPC)[17-18]是MPC与分布式结构的有机结合,它兼顾了MPC滚动优化、显式处理约束的特点与分布式结构可扩展性强、计算量小的优势。因此,DMPC被广泛应用于各种场景,如船舶编队[19]、车辆队列[20]、无人机编队[15]等。
在DMPC研究成果中,对于编队跟踪或轨迹跟踪问题,一般是通过在目标函数中考虑轨迹跟踪代价来解决的[21-28]。为了保证编队的安全,编队控制器设计时必须考虑避碰问题。避碰主要包括编队系统内部单机与单机间的避碰、单机与外部障碍间的避碰,这两者的差异在于获取避碰对象状态的方式不同,前者可利用通信的方式进行信息的双向交互,或利用探测的方式彼此感知,而后者只能利用探测的方式单向感知。对于避碰问题,主要有两种解决思路: 一是在目标函数中增加避碰代价[21-24];二是在约束条件中增加避碰约束[25-28]。其中,仅增加避碰代价的优势是计算成本低,能解决大多数的避碰问题,但由于其本质是一种软约束,故无法保证严格避碰;仅增加避碰约束的优势是能保证严格避碰,不足是计算成本较高。本文采用第2种思路。
在DMPC方法中,对于编队内的单机而言,其在每个采样时刻控制量的求解一般需要用到本机和邻机的状态信息。DMPC的控制量求解方式可分为顺序式、同步式,信息交互方式可分为迭代式、非迭代式。考虑到无人机飞行速度快,对计算时间要求高,这里重点研究同步式、非迭代的DMPC方法,即在每个采样周期内,无人机间只交互一次信息,各无人机并行求解一次最优控制问题。
在同步式、非迭代式DMPC的研究中,Wang等[26]在考虑智能体间避碰的情况下,设计出一种能保证系统渐近稳定的控制算法,实现了编队的轨迹跟踪。Yang等[27]则在文献[26]的基础上研究了智能体与静止障碍间的避碰问题。Dai等[28]则在考虑智能体间避碰、智能体与静止障碍避碰的情况下,实现了多智能体定点编队控制。上述文献[26-28]通过引入终端集约束、相容性约束等,实现了在满足避碰条件下的系统渐近稳定,因为与系统稳定性有关的参数是离线整定的,所以上述文献要求障碍是预先已知的,且参考轨迹上不能有障碍。航空兵器
然而,在复杂空域中飞行的多无人机系统必然要面对预先未知的障碍,且无法确保参考轨迹上没有障碍。为此,在假设无人机具备实时探测能力的基础上,提出一种带有模式切换的DMPC算法。具体地,算法中以多四旋翼无人机为研究对象,以虚拟领航法为控制策略,通过实时探测无人机与障碍间的距离,判断有无碰撞风险,进而设计出两种控制模式: 跟踪模式和避碰模式,无人机可根据风险情况进行模式的切换。不同模式对应不同的DMPC控制器,其中,跟踪模式,即无人机在无碰撞风险时所采用的模式,是以实现轨迹跟踪为目标,相应控制算法能保证编队跟踪控制系统渐近稳定;避碰模式,是以保证无人机安全为首要目标,相应控制算法中去掉了终端代价、终端集约束,增加了避碰约束、位置相容性约束。在避碰时,通过暂时舍弃无人机跟踪误差的渐近收敛性来换取无人机的安全性。仿真结果表明,该算法能够实现多无人机系统的轨迹跟踪,并且具备无人机之间、无人机与预先未知障碍之间的避碰能力。
相比于文献[26-28],本文DMPC方法有以下优势:
(1) 使无人机不仅能够有效规避系统内部无人机、预先已知的障碍,也能够有效规避预先未知的静态/动态障碍,其中包括大型障碍;
(2) 采用切换控制的思路,根据有无碰撞风险选择合适的控制模式。相比于单一控制模式,降低了问题求解的保守性,减少了计算时间。
1 系统运动模型
本文重点研究多四旋翼系统的运动协调问题,且侧重其三维平移运动过程,因此,在系统建模时对四旋翼模型合理简化,重点描述其平移运动的运动学特征。
基于地球固连坐标系oexeyeze研究多无人机系统相对地面的运动状态。在地球固连坐标系中,将地球表面假设为平面,原点oe为地面上指定的一点,oexe轴指向地理东,oeye轴指向地理北,oeze轴垂直地面向上。
1.1 单机运动模型
假设编队中共有Nv(Nv={1, 2, …, Nv})架四旋翼无人机,无人机间动力学解耦,且忽略风的阻力。假设无人机配备了自动驾驶仪,该自动驾驶仪可实现无人机的速度控制,即把速度指令输入给自动驾驶仪后,它能够自动控制无人机跟踪给定的速度指令。在此基础上,第i架无人机的质心运动模型可以近似描述为如下连续时间线性时不变形式[29]:
p·i=vi
v·i=-lv(vi-vci) (1)
式中: i为无人机编号, i=1, 2, …, Nv;pi=[xi, yi, zi]T∈R3,vi=[vix, viy, viz]T∈R3分别为无人机在地球固连坐标系下的三维位置向量、速度向量,单位分别为m,m/s;vci=[vcix, vciy, vciz]T∈R3为速度指令;lv>0为控制增益,用于表征无人机速度响应的滞后效应。
取状态量xi=[(pi)T, (vi)T]T∈R6,控制输入量ui=vci∈R3, 则式(1)的状态空间形式为x·i=Axi+Bui, 即
p·i
v·i=
03I3
03-lvI3
pivi+03lvI3ui(2)
采用零阶保持法[30]对式(2)进行离散化,得到
xi(k+1)=Gxi(k)+Hui(k)(3)
其中,系数矩阵G=eAT=I3aI3
03bI3∈R6×6, H=∫0TeAtdtB=cI3dI3∈R6×3,In∈Rn×n表示n维单位矩阵,0n∈Rn×n表示n×n维零矩阵,a=-(e-lvT-1)/lv,b=e-lvT,c=(e-lvT+lvT-1)/lv,d=1-e-lvT;T为采样时间。
状态和控制输入满足如下约束:
xi∈Xi{xi∈R6Enxxi≤x-i, nx}(4)
ui∈Ui{ui∈R3Enuui≤u-i, nu}(5)
式中: nx=1, 2, …, 6;Enx∈R1×6表示第nx项为1,其余项为0的行向量;nu=1, 2, 3,Enu∈R1×3表示第nu项为1,其余项为0的行向量;式(4)和(5)分别表示对状态、输入向量的各个分量进行限制;x-i, nx,u-i, nu为各个分量绝对值的上限。
在虚拟领航策略中,虚拟领航机UAVr的作用是为所有真实无人机预先提供参考状态序列和参考输入,即真实无人机可根据UAVr的状态序列以及给定的期望相对状态,得到自身期望状态序列。UAVr具有与真实无人机相同的数学模型,即
xr(k+1)=Gxr(k)+Hur(k)(6)
式中: xr=[(pr)T, (vr)T]T;xr,ur需分别满足约束式(4)~(5)。
1.2 编队运动模型
将Nv架无人机构成的集合称为编队系统,定义编队系统的状态量x~=[(x1)T, …, (xNv)T]T,控制输入量u~=[(u1)T, …, (uNv)T]T,可得到线性时不变编队系统模型,其离散形式为
x~(k+1)=G~x~(k)+H~u~(k)(7)
式中: G~=INvG,H~=INvH, 符号表示Kronecker积。
2 问题描述
假设1: 有真实无人机预知虚拟领航机的状态信息、参考输入,以及期望的相对状态信息。
假设2: 无人机具备一定的探测能力和通信能力。在一个采样周期内,真实无人机能够实时获取进入其探测范围内的障碍物的当前位置、速度信息,能够实时获取进入其通信范围的无人机所发送的信息。
假设3: 不考虑外界干扰、噪声、空气阻力等对无人机动态的影响。
控制目标: 无人机编队系统在满足自身状态、输入约束的情况下,能够按照期望的相对位置和相对速度跟踪虚拟领航机,且具备与系统内部无人机、系统外部预先未知静态/动态障碍的避碰能力。
考虑到无人机计算资源有限,且并不是空域内所有障碍物都会给无人机带来威胁,只有当障碍物与无人机的距离较近时,才有发生碰撞的风险,因此,基于无人机能够实时探测障碍物的能力,根据有无碰撞风险,设计出跟踪、避碰两种控制模式及模式切换策略。
3 控制算法设计
图1是以双机为例的带有模式切换的DMPC控制结构图。控制算法的实现是同步的、非迭代的。
3.1 模式切换策略
模式切换策略是基于无人机有无碰撞风险设计的,有无碰撞风险的判别条件是无人机与障碍物间的距离远近。为更好地说明模式切换策略,首先引入几个以无人机几何中心为球心的半径,如图2所示。