基于矩阵博弈的近距空战自主机动决策方法
作者: 王芳杰 黄鹏 张子俊 孙冲
引用格式: 王芳杰,黄鹏,张子俊,等. 基于矩阵博弈的近距空战自主机动决策方法[ J]. 航空兵器,2023, 30( 6): 56-63.
Wang Fangjie,Huang Peng,Zhang Zijun,et al. A Decision Method for Autonomous Maneuver in Close Range Air Combat Based on Matrix Game Theory[ J]. Aero Weaponry,2023, 30( 6): 56-63.( in Chinese)
摘 要: 针对近距一对一场景下的无人机自主空战机动决策问题,提出了一种基于专家知识库和矩阵博弈方法的近距无人机一对一自主机动决策算法,能够在一对一近距空战中进行实时态势分析与机动决策并取得胜利。该算法构建了基于战术库的无人机自主空战触发机制,搭建了无人机动力学模型、导弹动力学模型,并基于典型空战因素与导弹攻击区分析构建了态势评价函数,将基于导弹攻击区的态势评价函数与矩阵博弈理论进行进一步的结合,构建出一套自主空战决策模型。在此基础上,设置典型场景下双方无人机均采用该算法进行博弈对抗仿真,多组仿真结果表明该算法能够有效进行实时机动决策博弈对抗,单机单步决策时间能够保持在80 ms以内。
关键词: 无人机;近距空战;自主决策;矩阵博弈; 对抗;专家知识库
中图分类号: TJ760
文献标识码: A
文章编号: 1673-5048(2023)06-0056-08
DOI: 10.12132/ISSN.1673-5048.2023.0053
收稿日期: 2023-03-27
*作者简介: 王芳杰(1984-),男,山西大同人,高级工程师。
0 引 言
当前,无人机越来越广泛的应用于各领域,世界各国都在积极研制无人机,无人机的出现也将改变未来的空战态势,成为决定战场的重要力量[1-2]。其中,无人机的智能化水平将是无人机技术发展的关键,如何使得无人机能够进行自主感知、决策进而完成任务,具有重要的研究价值[3]。
对于空战无人机自主决策的研究,前人主要从基于专家知识库、基于博弈论等方向进行了很多探索。在专家知识库方面,王锐平等[4]提出了一种基于知识库建立的空战仿真模型,该模型是一套基于机动动作库的快速响应自主空战机动决策系统模型,可以使无人机根据实时战场环境,实现快速自主决策空战模拟飞行;李维等[5]提出一种基于知识库的自主决策方法,通过动态贝叶斯网络模拟人对态势的认知,通过产生式规则进行决策。在博弈论方面,徐光达等[6]提出了一种基于双矩阵对策的空战自主机动决策算法,对传统的“二人零和有限对策”模型进行了一定的改进;李守义等[7]提出了一种非完备策略集下的博弈决策方法来解决无人机群的决策序列问题;赵明明等[8]提出一种采用量子粒子群算法在模糊策略下博弈的纳什均衡求解方法,通过求解模糊子集来获得博弈支付矩阵,进而获得最优选择策略;李亿俍等[9]针对固定翼无人机目标–攻击–防御三方集群对抗场景,提出了一种基于微分博弈的集群攻防决策算法,实现了包括目标-攻击-防御三种角色的三方集群攻防空战决策。
专家知识库是由专家根据实际空战中最常用的机动方式总结提出的,能够指导无人机进行有效的机动决策。同时,空战双方的对抗特性决定了其可以利用矩阵博弈的方法对空战机动决策问题求解。前人做的很多研究都对无人机的自主决策问题提出了针对性的解决方法,但无人机采取的机动动作往往是离散的,没有考虑成套的战术动作。为了提高算法的实用性与真实性,本文首先构建了无人机与导弹模型,将成套的机动决策动作纳入专家知识库中,并将矩阵博弈与构建的专家知识库系统相结合,通过态势函数对空战形式进行分析,为无人机提供了一套自主机动决策模型。
1 UCAV六自由度飞行动力学模型搭建
UCAV飞行动力学系统建模是智能空战研究的基础。UCAV飞行动力学系统仿真实际是对其空气动力特性进行仿真,计算UCAV的六自由度非线性全量运动方程,仿真UCAV远程对抗过程中的力和力矩,以及大气环境对飞行的影响,即建立飞行系统仿真数学模型。
令海平面标准大气参数为高度h=0 m,大气温度T0=288.15 K,g0=9.806 65 m/s2,大气密度1.225 kg/m3,大气压力101 325 N/m2,则温度随高度的变化为
T=T0-0.006 5hh≤11 000 T=211.65 h>11 000 (1)
当h>11 000 m时,进入同温层。
压力的计算公式为
P=p01-0.006 5hT0g00.006 5Rh≤11 000
ph=11 000e-g0RTh=11 000(h-11 000)h>11 000 (2)
航空兵器 2023年第30卷第6期
王芳杰,等: 基于矩阵博弈的近距空战自主机动决策方法
则密度、声速和重力加速度的计算公式为
ρ=PRT(3)
a=1.4RT(4)
g=g0R2e(Re+h)2(5)
式中: R=287.05为气体常数;Re=6 371 000 m为参考地球半径。
这里给出UCAV于机体坐标系下的运动学以及动力学模型:
UCAV机体轴系包含三个方向的位置、速度以及欧拉角的计算公式表示成矩阵形式为
·θ·ψ·=1tanθsintanθcos0cos-sin0sin/cosθcos/sinθpqr(6)
式中: , θ, ψ分别为滚转、俯仰、偏航角;p, q, r分别为绕机体轴三轴的角速度,定义式如下:
p·=(c1r+c2p)q+c3L-+c4(N-+qheng)
q·=c5pr-c6(p2-r2)+c7(M--rheng)
r·=(c8p-c2r)q+c4L-+c9(N-+qheng) (7)
沿机体坐标系三轴的速度u、v、w与滚转、俯仰、偏航角关系如下:
u·=rc-qw-gsinθ+1m(X-+T)
v·=pw-ru+gsincosθ+1mY-
w·=qu-pv+gcoscosθ+1mZ-(8)
UCAV于地面坐标系下的位置描述如下:
x·=ucosψcosθ+v(cosψsinθsin-sinψcos)+
w(cosψsinθcos+sinψsin)
y·=usinψcosθ+v(sinψsinθsin+cosψcos)+ w(sinψsinθcos-cosψsin)
z·=-usinθ+vcosθsin+wcosθcos(9)
2 导弹六自由度动力学模型搭建
2.1 弹体动力学方程
本节将进行未简化弹体动力学方程的相关模型搭建,包括:
(1) 气动力矩计算部分
Mx=(mδxxδx+mω-xxω-x)qSL+Δmx
My=(mδyyδy+mω-yyω-y+mβyβ)qSL+Δmy
Mz=(mδzzδz+mω-zzω-z+mαzα)qSL+Δmz(10)
(2) 姿态动力学部分
Jxω·x+(Jz-Jy)ωyωz=Mx
Jyω·y+(Jx-Jz)ωxωz=My
Jzω·z+(Jy-Jx)ωyωx=Mz(11)
(3) 姿态运动学部分
·=ωysinγ+ωzcosγ
ψ·=(ωycosγ-ωzsinγ)/cos
γ·=ωx-tan(ωvcosγ-ωzsinγ)(12)
(4) 气动力计算部分
X=CxqS
Y=CyqS=(Cαyα+Cδzyδz)qS+Δy
Z=CzqS=(Cβzβ+Cδyzδy)qS+Δz(13)
(5) 质心动力学部分
mV·=Pcosαcosβ-X-mgsinθ
mV
θ·=P(sinαcosγV+cosαsinβsinγV)+YcosγV-
ZsinγV-mgcosθ
-mVcosθψ·V=P(sinαsinγV-cosαsinβcosγV)+ YsinγV+ZcosγV (14)
(6) 角度几何关系补充方程
sinα={cosθ[sincosγcos(ψ-ψv)-sinγsin(ψ-
ψv)]-sinθcoscosγ}/cosβsinβ=cosθ[cosγsin(ψ-ψv)+sinsinγcos(ψ-
ψv)]-sinθcossinγsinγV=(cosαsinβsin-sinαsinβcosγcos+ cosβsinγcos)/cosθ (15)
特别说明,对于不同的导弹,其对应的气动参数方程解算部分将会出现不同结果。
2.2 导弹攻击区包络解算
目前大部分空战态势函数的构建单纯基于特定假设条件,存在定量分析的问题,为了使UCAV近距空战决策更具有客观性,考虑基于导弹攻击区的实时解算的空战态势评估方法。
导弹攻击区是以攻击机作为参考,在满足一定的攻击条件下,攻击机发射导弹能以一定的概率命中目标的目标初始位置的范围。按照目标运动方式的不同,导弹攻击区包络可以分为导弹可攻击区和导弹不可逃逸区。
影响导弹攻击区的因素主要有: 导弹的性能、载机和目标机的运动状态[10]。本文以导弹、载机、目标的动力学模型为基础,实时解算导弹攻击区包络。
2.2.1 导引率模型
采用比例导引法,即控制导弹在飞向目标的过程中,使导弹速度方向变化率与目标视线变化率成比例,其模型如下:
ε·=kq·(16)
式中: ε·为导弹速度方向变化率;q·为视线转率。
弹上导引头最大角速度限制为
ε·=ε·maxsgn(q·)ε·≥ε·max
ε·other (17)
2.2.2 导弹运动约束条件
导引头动态视场角限制为
β-ψm≤x, max
ε-γm≤z, max (18)
导弹飞行时间限制为t≤tmax,目标影像探测距离限制为
t-t0<δr≥Rmin (19)
引信最小遇靶相对接近速度限制为