基于GRU-KAN的高速飞行器轨迹预测方法

作者: 苏雨 张龙政腾 赵国宏 郭正玉 张科

基于GRU-KAN的高速飞行器轨迹预测方法0

摘 要:      高速飞行器具有飞行速度快、 机动范围大、 突防能力强等特点, 对防御系统具有较大威胁。 精准预测敌方高速飞行器在制导阶段的飞行轨迹, 可以提前掌握其飞行航迹, 为拦截敌方导弹提供有效的技术支持。 因此, 本文针对高速飞行器中制导阶段的轨迹预测问题, 提出一种基于门控循环单元与KAN网络架构(Gated Recurrent Unit - Kolmogorov-Arnold Network, GRU-KAN)的轨迹预测模型。 首先, 建立弹道坐标系下的高速飞行器运动模型, 通过纵向跳跃机动模型建立轨迹数据库。 随后, 利用滑动窗口对轨迹数据进行分割预处理, 得到轨迹数据集。 最后, 基于GRU和KAN架构设计轨迹预测网络, 以50 s轨迹数据为输入, 输出150 s预测得到的轨迹数据。 实验结果表明, 该模型具有更小的网络复杂度, 在经度、 纬度和高度方向的最大平均预测误差分别为7.58×10-2°、  9.48×10-3°和 7.51×101 m, 经纬度方向与传统智能时序预测模型的预测误差相差不大, 但在高度方向上, 预测结果相比传统的GRU预测模型提升了27.8%, 相比LSTM预测模型提升了70.5%。

关键词:     高速飞行器; GRU; KAN; 长时轨迹预测; 纵向跳跃机动

中图分类号:      TJ760

文献标识码:    A

文章编号:     1673-5048(2024)06-0044-06

DOI: 10.12132/ISSN.1673-5048.2024.0113

0 引  言

高速飞行器是指以高速(速度大于马赫数5)在临近空间飞行的飞行器[1, 是各国战略发展的关键武器。 美国将高速武器列为“第三次抵消战略”的核心能力之一, 并在重回大国竞争战略后, 将高速技术列为国防技术发展的最高优先级事项[2。 同时, 中、 俄、 印、 日、 英、 法等国也竞相启动高速飞行器技术验证和型号研制项目, 目前已初见成效, 例如俄罗斯的“匕首”和美国的“ARRW”。 高速武器作为一种新型的即时打击力量, 将成为未来战争的“游戏规则改变者”, 通过“空射快速响应武器”实现全球实时打击。 各国明确高速飞行器的发展战略地位, 增加相关项目经费, 加速研制并频繁进行飞行试验, 高速飞行器已然成为大国竞争博弈的焦点[2

由于高速飞行器飞行速度快、 机动范围大等特点[3, 为防御高速飞行器, 国内外学者针对基于轨迹预测的高速飞行器拦截进行了诸多研究。 传统的预测方法主要分为三类: 解析法、 几何法和数值积分法, 但应用于高速飞行器均存在比较明显的如目标参数未知、 没有足够先验信息、 预测精度低等缺陷[4。 当然也有曲线拟合方法[5进行预测, 但该方法受限于拟合基函数, 当目标机动较大时预测精度无法保障且无法保证实时性预测。

针对轨迹数据的研究多种多样, 如图 1所示主要包括数据管理与数据挖掘, 而轨迹预测是属于轨迹数据挖掘的一部分, 更加细分高速飞行器轨迹预测为预测中位置预测的回归问题[6。 当前, 主流轨迹预测方法多基于深度学习架构, 包括: 循环神经网络(RNN)、 卷积神经网络(CNN)、 生成对抗网络(GAN)以及Transformer等结构[7。 其中, 以RNN及其变体结构, 长短时记忆网络(LSTM)在时序序列预测领域应用最多, 效果最好[8。 杨春伟等[9利用基于注意力机制的 Seq2Seq 轨迹预测模型, 利用 LSTM 网络设计编码器和解码器, 同时利用注意力机制提取的信息进行解码预测, 但仅实现对未来几秒轨迹的短时预测。 Hu等[10提出一种结合时序的卷积神经网络进行单步预测, 利用迭代循环实现多步预测, 并利用LSTM网络对迭代预测的误差进行修正, 以进一步提升精度。 此外, 还有一些学者结合目标作战意图信息进行轨迹预测[11。 张凯等[12假定高速滑翔目标必定攻击某目标, 结合飞行意图合理构造意图代价函数, 借鉴贝叶斯理论迭代推导机动模式和运动状态递推公式并最终通过蒙特卡洛采样实现轨迹预测算法。

因此, 针对上述研究预测时间短, 预测精度低等问题, 本文提出一种基于GRU-KAN的轨迹预测模型进行高速飞行器长时轨迹预测。 首先, 建立弹道坐标系下的高速飞行器运动模型, 通过纵向跳跃机动模型建立轨迹数据库。 随后, 利用滑动窗口对轨迹数据进行分割预处理, 得到轨迹数据集。 最后, 基于GRU和KAN架构设计轨迹预测网络, 对目标轨迹进行预测。 引入KAN结构提高数据拟合效果从而提高模型的精度。

1 高速飞行器轨迹数据库建立

1.1 弹道坐标系下运动建模

设侧滑角为0, 忽略地球自转与扁率, 在弹道坐标系下以时间为自变量的高速滑翔飞行器质心运动方程[13

dVdt=-D-gsinθ

dθdt=LcosvV+1VV2r-gcosθ

dσdt=LsinvVcosθ+Vtan cosθsinσrcosθ

drdt=Vsinθ

dλdt=Vcosθsinσrcos

d dt=Vcosθcosσr (1)

式中: r, λ,  分别为经度、 纬度和高度; V, θ,  σ分别为速度、 速度倾角和速度偏角; v为倾侧角。 以此为模型建立高速飞行器纵向跳跃轨迹数据集。

1.2 机动模式分析

高速飞行器运动过程中纵向平面内受到升力分量、 离心力和引力的作用, 其运动模式可以分为平衡滑翔运动与纵向跳跃运动。 当飞行器在纵向平面内所受的合力为0时, 做平衡滑翔运动; 而当飞行器在纵向平面内所受的合力不为0时, 做纵向跳跃运动[13

飞行器纵向跳跃机动通用性描述为

S(t)=S0(t)+A(t)sin(ω(t)t+ω0(t))(2)

式中: S0(t)表示纵向跳跃机动的高度基准值, 可以设置为不同的形式, 包括抛物线、 直线等, 是关于时间t的函数; A(t)表示机动的幅值, 不同t时刻可以有不同的幅值; ω(t)表示机动的频率; ω0(t)代表机动的初始相位; t为机动动作的时间。

假设S0(t), A(t), ω(t)都是常数, 可以得到

ah=S¨(t)=-ω2Asin(ωt+ω0)(3)

1.3 建立轨迹数据集

1.3.1 数据预处理

为了降低神经网络的计算复杂度, 提高训练效率及改善训练结果, 高速滑翔飞行器的轨迹数据在输入之前要进行一系列处理。

(1) 野值剔除

野值指的是测量数据中的异常值, 实验前需要将这部分数据剔除, 不仅可以降低实验的难度, 还能提高网络识别准确率。

(2) 数据归一化

轨迹数据中所用到的实测数据往往数值较大, 且不同特征的数据量级会存在较大差异, 给实验造成了很大的计算负担。  因此需要对目标的距离实测信息进行归一化处理, 将神经网络的输入输出限制在[-1, 1]之间, 可以提高模型训练的收敛速度, 避免梯度爆炸和梯度消失, 增加模型的泛化能力和稳定性。 归一化公式如下:

xnormalization=x-xminxmax-xmin(4)

式中:x为样本值; xmin为样本值的最小值; xmax为样本的值最大值; xnormalization为归一化之后的样本值。

1.3.2 数据集划分

(1) 划分数据集

将基于高速飞行器运动模型与纵向跳跃机动模型仿真生成的4 000条600 s时间长度的轨迹数据进行随机打乱, 选取其中3 700条轨迹以9: 1的比例划分预测模型的训练集和测试集, 300条轨迹作为预测模型的验证集。

(2) “滑窗”切割数据

如图2所示, 在训练模型时, 通过在训练集轨迹数据上采用滑动窗口的形式切割数据, 从而增加输入数据的数量, 进一步提升训练集样本量。

2 高速飞行器轨迹预测模型构建

2.1 GRU网络

门控循环单元[14(Gate Recurrent Unit, GRU)是LSTM的变体结构, 可以极大地提升训练效率。 不同于LSTM三个门控结构, GRU有两个门控结构。 其将LSTM的输入门与遗忘门合并组成了更新门控制需要保留的前期记忆数据信息的比例, 而另一个门为重置门用于控制遗忘过去信息的比例。 并且GRU抛弃了LSTM的自更新记忆单元, 利用隐藏单元中的门控结构实现自更新。 GRU单元的基本网络结构如图 3所示, GRU单元内部的底层工作原理如下式所示:

rt=σ(Wr·[ht-1, xt])

zt=σ(Wz·[ht-1, xt])

h~t=tanh(Wh~·[rt ht-1, xt])

ht=(1-zt) ht-1+zt h~t

yt=σ(Wo·ht)(5)

式中: xt为t时刻的输入; ht为t时刻隐藏状态, h~t为t时刻候选隐藏状态; yt为t时刻的输出; rt代表更新门; zt代表重置门; Wr, Wz, Wh~, Wo分别代表对应的权重矩阵; σ为sigmoid激活函数, 可将数据激活到[0, 1]的范围, tanh为tanh激活函数, 可将数据激活到[-1, 1]的范围。

2.2 KANs网络

多层感知器(Multi-layer perceptrons, MLPs)也称为全连接前馈神经网络, 是当今深度学习模型最常用的基础构建模块。 多层感知机的全连接网络架构使得模型训练需要用到大量参数, 而其中许多参数使用效率极低。

KANs的数学理论基础源自Kolmogorov-Arnold表示定理, 该定理表明, 任何多变量连续函数都可以表示为单变量连续函数和加法运算的组合。 KANs的基本架构在网络边缘(即“权重”)上部署了可学习的激活函数, 这与MLPs中的线性权重矩阵不同。 具体来说, KANs用一个参数化的单变量函数(通常表示为样条函数)来替换每个权重参数。 这种设计使得KANs在数据拟合和偏微分方程求解任务中, 即使规模较小的KANs也能实现与规模更大的MLPs相当或更好的准确度[15

不同于多层感知机在神经元上放置固定的激活函数, KANs在权重上放置可学习的激活函数, 每个权重参数被一个可学习的一维函数替换为样条参数。 KANs的节点只需对输入信号进行简单的求和, 而不需要施加任何非线性。 如图 4所示为包含两个KAN层的KANs网络架构示意图。

上一篇 点击页面呼出菜单 下一篇