考虑自动驾驶仪延迟的非线性最优末制导方法

考虑自动驾驶仪延迟的非线性最优末制导方法0

摘要：针对过载受限和自动驾驶仪延迟等条件下的非线性最优末制导指令在线生成方法进行研究。首先，基于庞特里亚金极大值原理，建立了目标静止的非线性最优末制导问题的最优性条件，并利用饱和函数将过载约束嵌入最优性条件。其次，应用参数化方法使得通过数值积分即可快速生成满足最优性条件的飞行轨迹数据集。然后，利用该数据集训练神经网络，使其拟合弹-目相对运动状态到最优制导指令的映射关系，实现过载约束下制导指令的毫秒量级在线生成。针对自动驾驶仪的延迟响应，通过微分补偿法估计神经网络下一时刻输出的制导指令以实现快速跟踪。最后，仿真结果表明，本文所提出方法针对静止目标与小机动目标都能够在线生成最优制导指令。

关键词：过载约束；自动驾驶仪延迟；非线性最优末制导；参数化方法；神经网络

中图分类号： TJ765； V448.2

文献标识码： A

文章编号：1673-5048（2024）04-0064-08

DOI： 10.12132/ISSN.1673-5048.2023.0250

0 引言

在精确制导打击中，零脱靶量不再是评估制导律性能的唯一指标［1］。新型作战任务对导弹提出了更高的要求，如满足过载约束、满足落角约束、考虑自动驾驶仪延迟、优化能量消耗等。然而，传统的基于线性化方法推导的制导律［2］在一定程度上会破坏约束或损失最优性［3］，影响导弹充分发挥打击能力。因此，研究如何在满足各种约束条件下在线求解非线性最优制导问题（Nonlinear Optimal Guidance， NOG）具有重要意义。

目前，在求解NOG问题时，通常采用半解析法、直接法和间接法等。半解析法的主要思路是通过各种近似或假设将问题进行简化处理，从而得到解析解或半解析解。文献［4］基于线性二次最优控制理论，针对具有时变加速度和高阶自动驾驶仪动力学约束的导弹，设计了满足落角约束的次优制导律。文献［5］对打击静止目标的NOG问题进行参数化处理，将问题简化为求实值函数零点的问题。由于设计了实值函数的半解析形式，并限制了其零点的区间，因此使用暴力搜索便可找到所有零点，从而快速得到非线性最优制导律。文献［6］基于小角度假设建立了线性化的弹-目相对运动学方程，应用Schwarz不等式，针对带落角约束的一般加权函数形式的最优制导律进行研究，得到最优制导律的一般表达式。

虽然将问题简化处理有可能得到解析/半解析形式的制导指令，满足在线生成制导指令的需求，但这种处理方式只适用于一些特殊场景，且非线性特征的缺失会损失一定的最优性。比较而言，直接法［7-8］和间接法［9-10］直接对NOG相关的最优控制问题进行求解，得到最优制导指令。但是，在高度非线性条件下，直接法和间接法存在收敛时间长，甚至不收敛的问题，难以满足在线生成制导指令的需求［11］。

为解决上述问题， Chen［12］提出一种哈密尔顿轨迹参数化方法，通过对最优控制问题的解空间进行参数化表征，将最优性条件嵌入一组微分方程，使得利用简单数值积分即可生成满足最优性条件的飞行轨迹。 Wang等［13］利用文献［12］中的参数化方法，研究了具有攻击时间约束的NOG问题，实现了时间约束下非线性最优制导指令毫秒量级在线生成。文献［14］进一步围绕过载、攻击时间等约束条件下的非线性最优制导指令在线生成问题进行研究。文献［15］直接利用文献［13］中提出的参数化方法研究了纵向平面内考虑落角约束的NOG问题。

上述文献在使用参数化方法解决NOG问题时，均未考虑自动驾驶仪延迟。导弹的制导控制系统如图1所示。实际上，在导弹执行机构工作过程中，制导系统与控制系统之间存在响应延迟，该延迟特性会影响导弹性能。文献［16］利用H∞控制理论，设计了考虑导弹自动驾驶仪动态特性的H∞鲁棒制导律。文献［17-18］在分析导弹自动驾驶仪动态特性的基础上，将其近似为一阶惯性环节，设计了自适应滑模制导律。文献［19］将导弹自动驾驶仪动态特性视为一阶惯性环节，并将目标加速度视为外界干扰，基于自抗扰理论设计了自抗扰制导律。文献［20-21］基于观测器和滑模控制理论，设计了考虑导弹一阶动态延迟特性的制导律，同时能够以期望的角度攻击目标。文献［22-23］在考虑角度约束和通讯延迟等情况下，设计了饱和制导律和控制器。

除了响应延迟外，导弹还存在过载受限的问题。若只是简单地通过控制器对过载指令进行限幅，必然会损失一定的最优性，甚至还可能导致系统不稳定［24］。所以，在研究制导方法时，加入过载约束才能够更好地发挥导弹的性能。目前，针对过载约束下的制导律进行了广泛研究。 Rusnak等［25-27］针对线性、时不变的导弹模型，以零脱靶量和控制能量最优为性能指标，在加速度受限条件下推导了最优制导律的显式解。文献［28］以弹-目相对距离和视线角速率为主要状态变量，采用指令滤波 backstepping 方法设计了一种过载约束下的导引律。 Hexner等［29］在考虑导弹加速度约束和制导增益最大值约束等情况下，使用线性二次随机高斯最优控制理论和随机输入描述函数（Random-Input Describing Function， RIDF）得到最优制导律。

虽然上述文献考虑了过载约束和自动驾驶仪延迟等问题，但基本上是采用线性化或者简化的处理方法。本文在同时考虑过载约束与自动驾驶仪延迟的情况下，完全基于非线性模型研究了最优末制导指令在线生成方法。首先，基于目标静止的导弹非线性模型，利用庞特里亚金极大值原理（Pontryagin’s Maximum Principle， PMP）建立了NOG问题的最优性条件，并利用饱和函数将过载约束嵌入最优性条件。其次，通过参数化方法［12］生成满足最优性条件的飞行轨迹簇，构建弹-目相对运动状态到最优制导指令映射关系的数据集。然后，利用该数据集训练神经网络，使其拟合上述映射关系，保证神经网络能够毫秒量级在线生成最优制导指令。最后，针对自动驾驶仪延迟问题，通过微分补偿方法对神经网络下一时刻输出的最优制导指令进行估计，从而实现快速跟踪。值得注意的是，本文所提方法能够实时更新状态信息，并将弹-目相对运动状态作为神经网络的输入在线生成制导指令。因此，该方法同样适用于拦截小机动目标的场景，并且无需事先得到目标的加速度信息。针对静止目标和小机动目标，分别采用本文所提方法与线性化方法进行仿真对比，验证了所提方法的有效性。

1 数学模型

1.1 导弹的运动模型

在二维平面内，弹-目相对运动的几何关系如图2所示。其中， OXY为惯性坐标系。为便于分析且不失一般性，将目标位置作为坐标系原点。 M表示导弹； V， a， θ分别表示导弹的速度、法向加速度、速度方向角； λ∈［0， 2π］表示弹-目视线角； σ∈［－π， π］表示前置角； r表示弹-目相对距离。

用（x， y）表示导弹在惯性坐标系中的位置，根据图2有如下关系式：

r=x2+y2

λ=arctanyx

σ=λ－θ（1）

假设导弹在末制导过程中常速运动，其非线性运动学模型可以表示为

x·（t）=Vcosθ（t）

y·（t）=Vsinθ（t）

θ·（t）=a（t）V（2）

式中： t为时间；上标“·”表示关于时间的导数。

过载n与法向加速度a之间满足：

n=ag（3）

式中： g为重力加速度常数。假设过载上限为nmax，则法向加速度上限amax=g·nmax。因此，法向加速度约束为

a≤amax（4）

针对自动驾驶仪跟踪制导指令时存在响应延迟的问题，采用一阶惯性环节来近似自动驾驶仪的动力学模型：

a·（t）=u（t）－a（t）τ（5）

式中： τ为导弹自动驾驶仪动态延迟的时间常数； u为制导环节输出的加速度指令，如图1所示。

1.2 最优制导问题描述

根据文献［5］，自由时间下控制效率最优的制导律无解。因此，选择将控制效率与攻击时间的权重相加作为性能指标，即

J=∫tft0κ+12（1－κ）a2dt（6）

式中： t0为初始时刻； tf为自由的终端时刻； κ∈［0， 1］为权重常数。

导弹的初始条件可以表示为

x（t0）=x0

y（t0）=y0

θ（t0）=θ0（7）

为满足零脱靶量要求，导弹最终应到达目标所在位置，即

x（tf）=xT

y（tf）=yT（8）

在定义坐标系时，将目标位置作为坐标系原点，因此有（xT， yT）=（0， 0）。

综上，当前的NOG问题可以描述为，在满足状态约束式（2）、法向加速度约束式（4）及边界条件式（7）～（8）下，求解使得性能指标J最小的法向加速度a。

2 最优性条件

将法向加速度a作为控制量，上述最优控制问题的Hamiltonian函数可以表示为

H=pxVcosθ+pyVsinθ+pθaV－κ+12（1－κ）a2（9）

式中： p=［px， py， pθ］T为z=［x， y， θ］T对应的伴随状态。根据PMP，有

z·=Hp

p·=－Hz（10）

其中， p·=－Hz可展开为

p·x=－Hx=0

p·y=－Hy=0

p·θ=－Hθ=pxVsinθ－pyVcosθ（11）

由于θ（tf）是自由的，有如下横截条件：

pθ（tf）=0（12）

通过式（11）中前两个等式可知， px和py为常数。考虑终端约束式（8）及横截条件式（12），对式（11）中第3个等式积分可得

pθ（t）=pxy（t）－pyx（t）（13）

由于终端时间tf自由，且Hamiltonian函数不显含t，有

H≡0（14）

根据PMP，当不考虑输入约束时，存在最优控制a（t）满足Ha=0，即

a（t）=pθ（t）V（1－κ）（15）

然而，由于存在过载约束，考虑法向加速度上限的最优控制a（t）为

a（t）=satpθ（t）V（1－κ）， amax，－amax（16）

式中： sat（·）表示饱和函数，定义为

sat（i， α， β）=α i>αi α≤i≤ββ i<β （17）

式中： i为饱和函数的输入； α为输入的上限； β为输入的下限。式（17）可改写为如下形式：

sat（i， α， β）=12（i－β）2－（i－α）2+α+β（18）

式（18）与式（17）的分段函数完全相同。为解决其在i=α和i=β处不可导的问题，根据文献［30］，采用如下公式进行修正：

sat（i， α， β， δ）=12（（i－α）2+δ－

（i－β）2+δ+α+β）（19）

式中： δ为保证饱和函数在i=α和i=β处可导的参数。参数δ的取值不同，修正后的饱和函数式（19）对式（18）的近似精度不同［31］。

利用饱和函数将过载约束嵌入最优性条件后，最优制导指令可以表示为

a（t， δ）=satpθ（t）V（1－κ）， amax，－amax， δ（20）

式中： δ>0越小，式（20）越逼近式（16）。

得到上述一阶必要条件后，仍然无法保证轨迹的最优性［32］，还需要建立附加的最优性条件。根据文献［13］，对于任意一条满足一阶必要条件的轨迹，若在某一时刻t-，速度方向与弹-目视线共线，则其不再满足最优性。因此，飞行轨迹必须满足以下附加最优性条件：

考虑自动驾驶仪延迟的非线性最优末制导方法

经典小说推荐

杂志订阅