基于SDP的动态武器目标分配决策算法研究
作者: 李洋 刘耿 胡晓惠 樊垚 孔冠桥
摘 要:武器目标分配是水面舰艇防空反导作战指挥决策的核心环节,决策结果的优劣直接影响了防空反导作战的最终防御效果与水面舰艇的生存能力。针对当前武器目标分配算法较少考虑拦截结果的不确定性和多梯次拦截的序贯分配需求,难以适应战场动态变化的问题,设计一种基于随机动态规划的动态武器目标分配决策算法。通过进制变换编码并计算目标状态和武器状态的变化规律,基于战场态势转移概率采用逆向迭代算法生成序贯拦截方案。最终精确求解面向多梯次拦截的动态武器目标分配最优策略,回答“谁来打”“打多少”和“何时打”的水面舰艇防空反导作战决策问题。通过算例验证和数值仿真表明,使用该算法能够获得比静态武器目标分配算法更好的拦截效能,在最好情况下能够降低空中来袭目标72%的威胁期望。
关键词:水面舰艇; 防空作战; 动态武器目标分配; 随机动态规划
中图分类号:TJ760
文献标识码: A
文章编号:1673-5048(2023)05-0050-07
DOI: 10.12132/ISSN.1673-5048.2023.0093
0 引 言
世界范围内近几次高技术条件下的局部战争表明,水面舰艇防空反导作战是高烈度的体系对抗,“攻击体系”与“防御体系”的关系始终处于平衡-失衡-再平衡的螺旋型发展之中。1967年10月21日,第3次中东战争中以色列“埃拉特”驱逐舰被埃及“冥河”反舰导弹击沉。2022年4月13日,俄罗斯黑海舰队“莫斯科”巡洋舰被乌克兰“海王星”亚音速反舰导弹重创,反舰导弹等成为打击水面舰艇的主要兵器,并在体系对抗中占据优势,使得水面舰艇防空反导作战难度陡然突增。
水面舰艇防空反导作战决策是战术技术结合密切、不确定因素多、实时性高、对抗性强的复杂决策过程,需要经过早期目标预警、持续目标跟踪、多源目标识别、威胁判断排序、武器目标分配以及武器引导控制等过程才能最终对空中来袭目标进行有效拦截[1]。其中,武器目标分配(Weapon Target Assignment,WTA)决策是水面舰艇防空反导作战指挥与控制的核心环节,旨在求解最优武器目标分配方案,从而以最小的时间和资源代价,获取最大的防空反导作战效能。WTA决策的优劣直接影响了水面舰艇防空作战的最终防御效果与生存能力[2]。
按照是否考虑战场动态对抗的不确定性,可以将WTA决策分为两类[3]。一是静态WTA决策[4],主要求解每类拦截武器对每个来袭目标应该分配多少火力,回答“谁来打”“打多少”的问题。目前,WTA研究领域以静态WTA决策算法为主[5],Yucel等[6]采用分支界定算法,实现了以消耗资源最少为优化目标的WTA精确求解; 徐加强等[7]将遗传算法结合禁忌搜索的方法应用于常规导弹分配问题中,实现了全局与局部搜索能力的融合,在较短时间内获得了最优解; 唐苏妍等[8]基于扩展合约网络的动态目标分配算法,提升传统合约网络性能,解决了网络化防空体系中的目标分配问题。然而,静态WTA决策没有考虑拦截失败、多次拦截等不确定性和动态性,难以适应战场的复杂变化。二是动态WTA决策[9],考虑战场演进引起杀伤概率、来袭目标数量等决策要素的持续变化,不仅回答“谁来打”“打多少”,还需要进一步解决“何时打”的决策时机问题[10]。由于建模和求解的困难,当前针对动态WTA决策的研究较少,文献[11-12]提出了基于马尔科夫决策过程的动态目标分配
算法,通过转移概率刻画拦截过程的动态变化。但是,算法对目标来袭间隔、武器射击时刻等有较为严苛的假设,因此适用场景较为有限。
为充分考虑水面舰艇防空反导作战过程中的不确定性与动态变化,显著提升对抗场景下的临机决策质量,本文首先将动态WTA决策建模为序贯决策问题,然后基于随机动态规划(Stochastic Dynamic Programming,SDP)[13],设计针对动态WTA的精确求解算法,最后通过算例对比动态与静态WTA算法的求解质量。
2.2 基于SDP的动态WTA决策算法设计
状态转移概率是描述多次拦截过程中战场态势演进趋势的核心参数。针对m个来袭目标使用n个可用武器共进行s次拦截的场景,为了能够应对不同拦截结果,实现动态生成分配方案的最优策略,首先要解决2(m+n)种不同战场状态之间状态转移概率的计算,算法流程见图4。首先,根据BSA编码机制依次确定从当前战场状态x能够转移到的每一个可能的后续战场状态x′,并将转移概率矩阵T中对应从x至x′的转移概率txux′标记为合法转移; 然后,通过位运算检查转移前目标状态z到转移后目标状态z′发生的变化,其中令⊕代表二进制按位逻辑异或操作; 最后,根据目标状态变化情况和目标存活概率矩阵Q,完成转移概率计算。
基于战场状态转移概率矩阵,基于随机动态规划理论,采用逆向迭代算法[15-16],从末次拦截开始求解面向s次拦截的分配方案最优策略,算法流程见图5。
该算法的时间复杂度为O(2(m+n)·mn·s),每次拦截分配方案的可选择性和拦截结果的不确定性是导致时间复杂度提升的最主要原因; 空间复杂度为O(4m+n·mn),主要用于存储状态转移矩阵。
3 动态WTA决策算法分析
3.1 基本算例
以1.1节的场景为例,算法运行过程如图6所示。其中,加粗圆形表示的根节点代表函数Qk(xk, Uk),即在战场状态xk下采用分配方案Uk后最终能获得的最小目标剩余威胁期望; 圆角矩形表示的中间节点代表分配方案矩阵Uk; 正常圆形表示的叶节点代表函数J*k-1(xk-1),即在战场态势xk-1下采取最优分配策略后最终能获得的最小目标剩余威胁期望。根节点与中间节点连线权重代表Qk(xk, Uk)的函数值,其中加粗连线代表在战场状态xk下,使得Qk(xk, Uk)取得最小目标剩余威胁期望的分配方案,即U*k=argminUk∈U(xk)Q(xk, Uk)。中间节点与叶节点连线权重代表在分配方案Uk执行后,战场状态从xk转移至xk-1的概率,即函数P(xk-1|xk, Uk)。算法从第二次拦截的叶节点开始计算,逆向获取根节点的目标剩余威胁期望; 第二次拦截的根节点最小期望值,又成为了第一次拦截的叶节点,进入新一轮逆向迭代计算。
“尽早拦截、尽远拦截”的作战原则要求,应当在第1次拦截机会时就使用所有舰空导弹,在该原则下最优分配方案即是静态WTA决策代表的最优决策,即图中分配方案U2。但是根据动态WTA决策计算显示,当敌方采用不同杀伤能力的反舰导弹搭配协同进攻的作战样式时,我方应该预留部分舰空导弹,针对可能在第1次拦截时突防的高杀伤目标进行二次拦截,从而达到更好的拦截效果。此时,动态WTA决策算法就能够量化地解决资源应该在哪次拦截时使用,应该用多少舰空导弹打击哪个目标等目标分配决策问题。
3.2 动态与静态WTA决策算法对比
为了分析动态WTA决策算法解的质量,通过构造随机样本测试比较动态WTA决策算法和静态WTA决策算法效果上的差别,其中杀伤概率随机取值范围为pij∈[0.6, 0.9],目标威胁随机取值范围为li∈[25, 100]。两种算法对比结果如表1所示。表中m表示目标数量,n表示武器数量; us表示静态WTA算法求解结果,u(2)d表示动态WTA算法针对两次拦截机会的求解结果,u(3)d表示动态WTA算法针对三次拦截机会的求解结果; 后四列给出了不同攻击次数下,动态WTA决策算法和静态WTA决策算法效果的变化值以及变化率。
对表1数值仿真数据进行分析,首先,在给定目标数量和拦截次数的情况下,不论是静态还是动态分配算法,随着武器数量的增多目标剩余威胁期望均随之下降;动态WTA算法下降幅度显著高于静态算法。如在3个来袭目标即m=3的条件下,当武器数量由1增加至5时,静态WTA算法us使目标剩余威胁期望从87.37下降至15.55,而动态WTA算法u(2)d和u(3)d使目标剩余威胁期望下降至7.01和5.8。
其次,在给定武器数量和拦截次数的情况下,随着目标数量的增加,动态WTA算法能够更好的抑制目标剩余威胁期望的增长。如在使用4个武器进行2次拦截即n=4, s=2的情况下,当目标数量由1增加至5时,使用静态WTA算法us时目标剩余威胁期望由0.56增长至90.18,而使用动态WTA算法u(2)d仅增长至72.5。
最后,在给定目标数量和武器数量的情况下,随着拦截次数的增加,使用动态WTA算法能够更有效地降低目标剩余威胁期望。如在使用2个目标和5个武器的情况即m=2, n=5,使用动态WTA算法进行2次拦截即u(2)d时,目标剩余威胁期望比静态WTA算法下降64%,当进行3次拦截即u(3)d时,进一步下降至72%。
综上所述,使用动态WTA算法的拦截效能显著优于静态WTA算法。根据数值仿真反映的规律,在防空反导作战过程中,当舰空导弹数量多于目标数量时,使用动态WTA算法能够获得更好的拦截效能; 当舰空导弹数量少于目标数量时,使用动态WTA算法能够更好地降低目标剩余威胁。同时,如果能够尽可能增加拦截次数,则动态WTA算法能够更好地提升水面舰艇的生存能力。
4 结 论
本文针对动态武器目标分配问题,在考虑拦截结果的不确定性和拦截过程的动态性的基础上,设计了基于随机动态规划的动态武器目标分配决策算法,并通过BSA编码机制简化了对分配方案多样性和拦截结果随机性的处理。通过算例验证以及与动态武器目标分配决策算法进行比较,可以发现在多数场景下,特别是在武器较充足或者拦截机会较多的情况下动态分配的对敌拦截效果显著好于静态分配。对比分析证明了动态武器分配算法的潜在实用价值和优势,为水面舰艇防空作战决策辅助系统提供了新的决策算法。当然,目前该算法为了精确求解最优方案,仍然面临求解时间复杂度随着武器数量、目标数量以及拦截次数的增长而陷入“维度爆炸”的问题。有待在未来的研究工作中进一步分析和解决。
参考文献:
[1] 李勇君, 黄卓, 郭波. 武器-目标分配问题综述[J]. 兵工自动化, 2009, 28(11): 1-4.
Li Yongjun, Huang Zhuo, Guo Bo. Review of Weapon-Target Assignment Problem[J]. Ordnance Industry Automation, 2009, 28(11): 1-4.(in Chinese)
[2] 刘传波, 邱志明, 吴玲, 等. 动态武器目标分配问题的研究现状与展望[J]. 电光与控制, 2010, 17(11): 43-48.
Liu Chuanbo, Qiu Zhiming, Wu Ling, et al. Review on Current Status and Prospect of Researches on Dynamic Weapon Target Assignment[J]. Electronics Optics & Control, 2010, 17(11): 43-48.(in Chinese)
[3] 杨进帅, 李进, 王毅. 武器-目标分配问题研究[J]. 火力与指挥控制, 2019, 44(5): 6-11.
Yang Jinshuai, Li Jin, Wang Yi. Study of Weapon Target Assignment Problem[J]. Fire Control & Command Control, 2019, 44(5): 6-11.(in Chinese)
[4] Ahuja R K, Kumar A, Jha K C, et al. Exact and Heuristic Algorithms for the Weapon-Target Assignment Problem[J]. Operations Research, 2007, 55(6): 1136-1146.