防空反导战术级指挥控制目标分配发展研究

作者: 刘祥雨 王刚 李腾达 夏智权

防空反导战术级指挥控制目标分配发展研究0

摘要:      目标分配是指挥控制决策阶段的核心。 许多学者对目标分配问题进行了大量研究, 在目标分配模型和算法方面取得了较大进展, 但随着马赛克战、 分布式作战、 网络中心战等新型作战样式的演变和发展, 现代防空作战复杂度空前提升。 针对防空反导战术级指挥控制目标分配暴露出不同作战场景适应能力弱、 博弈对抗性和鲁棒性不足等问题, 通过总结梳理目标分配研究现状, 从攻防体系的发展角度深入探讨了目标分配理论研究在防空反导实际应用过程中所面临的挑战, 剖析了目前防空反导战术级指挥控制目标分配存在诸多问题的根本原因, 并针对不足提出了防空反导目标分配智能化、 网络化、 实战化的发展需求。

关键词:     目标分配; 防空反导; 人机交互; 杀伤网; 战术级; 指挥控制系统

中图分类号:      TJ760    文章编号:     1673-5048(2023)04-0067-11

文献标识码:    A    DOI: 10.12132/ISSN.1673-5048.2022.0273

0引言

随着现代战争的飞速发展, 战争方式快速更迭。 进入信息时代, 信息高度集中、 数据量激增的作战体系已成为主要的作战系统。 面对复杂多变的战场环境, 仅仅依靠指挥者的指挥能力难以驾驭现代战争, 必须要通过计算机技术、 自动化控制技术、 通信技术、 感知技术等对战场态势进行信息收集和融合, 指挥控制系统根据融合后的信息进行辅助决策, 从而对战场态势做出快速、 合理的判断, 为指挥员做出决策提供可行依据[1]。

战术级防空反导指挥控制决策阶段研究的主要问题是目标分配问题。 在新型作战样式的挑战下, 防空反导战术指挥控制目标分配也不断发展, 但是诸多模型和算法难以应用实际作战。 针对此问题, 本文以防空反导战术级指挥控制目标分配为切入点, 分析目标分配模型及算法在实际作战过程中存在的问题, 在此基础上提出目标分配的发展需求, 为目标分配研究发展提供方向。

1基本内容

1.1目标分配概念及分类

目标分配(Target Assignment), 也叫武器-目标分配(Weapon-Target Assignment, WTA), 是指挥控制系统根据目标运动参数、 数量和地空导弹火力单元数量、 性能、 弹药资源等, 将目标分配给不同火力单元拦截, 自动完成目标和火力单元的最优配对关系并实现作战效能最大化的过程[2]。

目标分配的分类如图1所示。 从系统的指挥方式分析, 目标分配分为集中式分配和分布式分配, 集中式分配是一种上级指令式的分配方式, 便于统一协调武器资源, 发挥武器系统的整体威力;  分布式分配是同等级的分配方式, 交互关系是双向的。 从判定目标是否具有威胁的角度, 可以分为广义的目标分配和狭义的目标分配。 广义的目标分配指目标既包含有攻击力和不确定是否有攻击力的目标, 狭义的目标分配是只包含攻击能力的目标。 从作战双方的对抗方式, 可以分为直接对抗式和间接对抗式, 两种类型的主要区别是来袭方攻击对象不同[3]。

1.2WTA建立的基本模型与算法研究

WTA问题的研究主要集中在目标分配模型和算法研究两方面, 常见的建模方法主要有两类:

(1) 基于复杂适应系统理论的建模方法。 该方法具备自适应性主体, 能够与环境进行交互学习, 在复杂系统中具备适应性主体和解决非线性问题等特征, 采用的技术包括Agent建模方法(Agent-Based Modeling, ABM)及通用的可视化建模语言等。

(2) 基于严格数学理论的建模方法。 通过具备一致性、 独立性和完备性的数学公理系统, 抽象化和逻辑推理地对数学模型进行分析描述, 以解决现实问题, 如整数规划、 马尔可夫决策过程、 图论、 Petri网等, 这些理论方法可以从数学的角度定量分析模型的可行性、 合理性、 有效性[4]。

模型的研究主要包括模型假设、 目标函数的选择、 约束条件和时间因素[5], 其中动态模型与静态模型的主要标志指是否考虑时间因素。 以简单的静态目标分配模型为例, 其模型如图2所示。 防御方和来袭目标的武器状态固定, 所有参数公开且不会变化, 防御武器与对应拦截目标的杀伤概率已知, 防御方的作战目的是分配拦截武器去拦截目标, 使来袭目标的总威胁度最小。

在静态的目标分配中, 有两个假设:

(1) 同时对火力平台分配目标, 且防御武器发射拦截弹后可获得目标状态。

(2) 武器-目标分配关系之间相互独立。

在一场防空作战中, 袭击方派出n个来袭目标B1, B2, …, Bn, 防御方有m个火力平台A1, A2, …, Am。 第i(i=1, 2, …, m)个火力平台最多可使用Ti个武器, 对目标Bj( j=1, 2, …, n)最多可以使用Cj个武器, 第j个威胁目标的威胁度为Vj, 第i个火力平台Ai成功击毁目标Bj的概率为qij, 武器最佳分配以使最终的来袭目标总体威胁度最小为目标。

若分配武器平台Ai迎击目标Bj, 目标选择的决策变量xij=1, 否则xij=0。 优化目标函数:

(4)同一火力平台不能同时攻击两个或两个以上目标, 即

xij=0或1(5)

以上为简单的WTA数学模型构建过程, 即便构建静态模型, 也要考虑众多约束条件, 如果构建基础的动态目标分配数学模型, 则要考虑更多的动态因素, 因此, 目标分配的理论求解与实际应用都是极为复杂的, 需要不断发展研究。

关于目标分配算法上的研究总体上可以分为两类: 集中式求解和分布式求解。

(1) 集中式求解方法

集中式求解方法主要集中在两个方向: ①多阶段匹配优化算法, 如动态规划、 整数规划等; ②智能算法, 如遗传算法、 免疫算法、 粒子群算法等。

(2) 分布式求解方法

分布式求解方法主要集中在两个方向: ①基于市场机制的求解算法, 如拍卖算法、 合同网等; ②群智能算法, 如人工鱼群算法、 蚁群算法等[4]。

1.3WTA模型与算法的国内外发展状况

1.3.1WTA模型发展情况

在20世纪, 导弹技术不断发展, 使得进攻方可以利用导弹从远距离攻击防守方的保护资源。 为了消除这种空袭威胁, 防空概念应运而生, 防空武器装备性能也不断提高, 从最初的单通道武器系统逐渐演变为多通道武器系统, 可分配的导弹资源数量也随之提高, 对有效分配防空资源使得资源利用最大化的研究也随之出现和发展。 WTA早期的研究主要集中在导弹防空等特定领域, 随后不断丰富发展。

(1)  整数规划模型

整数规划是指规划中的变量限制为整数, 常见的有纯整数规划、 混合整数规划、 0-1规划等。 其模型多样, 数学逻辑严谨, 有很大的应用领域。 WTA问题最初建立的数学模型为非线性整数规划模型, 开始于Manne的开创性工作, 在随后的几年里, 改进模型得到发展, 包括假设条件较少的模型和以时间为参数的模型。 Kline等通过传统的数学规划模型对武器目标分配问题进行求解[6]; 和传统的非线性模型不同, 陆一平等在不丧失模型最优解的前提下, 通过限定对目标分配武器的数量降低线性整数规划(ILP)模型维数, 将WTA问题建模为线性整数规划模型[7]; Li等通过验证传感器和武器的协同作战能力取决于SWTA方案, 在SWTA问题综合框架的基础上, 建立传感器和武器协同交战模式的整数规划模型[8]。

(2)  基于马尔可夫决策模型

为解决静态目标分配模型的适用性差等问题, 动态目标分配(Dynamic Target Assignment Weapon, DWTA)模型被广泛研究。 韩松臣等较早对此模型进行研究, 将马尔可夫决策过程应用于目标分配决策中, 考虑作战的多阶段特点, 追求决策的长期效益[9]; 张庆波等分析防空系统的作战特点, 将马尔可夫决策过程应用于防空系统目标分配中[10]; 蔡怀平等运用随机过程理论证明了动态WTA过程的马尔可夫性, 并且给出了决策过程的状态转移概率的解析表达式, 对于在目标分配问题中应用马尔可夫决策过程提供了理论依据[11]。

(3)  图论

作为运筹学的一个分支, 图论是一种研究节点和边组成的图形的数学理论和方法, 在目标分配问题中, 与其紧密联系的是匈牙利算法。 柳毅等运用此方法从单目标分配推广至多目标分配, 并验证此方法的有效性[12]; 黄力伟等利用匈牙利算法求解目标分配问题, 方法简单, 具有应用价值[13]; 殷红运用模糊匈牙利算法在决策过程中将主客观因素有机地结合起来, 有效解决炮兵火力单元的分配最优化问题[14]; 周洪喜等利用改进的匈牙利算法求解多导弹阵地协同拦截多目标模型, 有较快的求解速度[15]; 张进等提出统一效率矩阵, 在匈牙利算法耗时短、 求解稳定的基础上提高了算法的优越性, 进一步丰富了此方法在武器-目标分配问题中的运用[16]; 常雪凝等将匈牙利算法和模拟退火进行混合, 在求解多阶段武器目标分配问题方面较变邻域搜索算法减少了计算时间[17]。

(4) Agent建模方法

随着人工智能技术在军事领域中的应用, 对Agent建模方法的研究逐渐深入。 利用Agent技术的智能性和代理能力, 可以将目标分配这样庞大复杂的问题分解为许多较小、 较简单的问题, 使问题得以简化。 由于单个Agent解算能力有限, 难以完成复杂系统中的问题, 随后多智能体技术不断发展, 李伟等利用智能体技术在已有研究基础之上做出改进, 缩短决策时间, 相较于数学理论建模方法有较好的动态性[18]; 刘家义等利用多智能体系统(MAS)结合分布式多约束优化的思想解决了WTA的优化问题, 结合防空反导信息主导、 组网作战的特点, 创新性地将防空作战体系中各个作战实体设计为决策智能体、 武器智能体、 传感器智能体和拦截器智能体, 并改进加速梯队下降(Accelerated Gradient Descent, AGD)算法进行求解, 对于防空反导智能目标分配的发展研究起到促进作用[19]; 马悦等构建多智能体强化学习的协同目标分配模型, 聚焦于顶层分配策略的学习, 并采用Advantage Actor-Critic算法进行优化, 通过实验验证该方法能够实现大规模协同目标分配方案的动态生成[20]; 张杰等为解决分布式环境下多智能体系统的交互模型效率低、 局部冲突消解困难等问题, 设计了多主多从Stackelberg博弈的多智能体系统, 从多角度验证了模型的高效性和鲁棒性[21]; 赵鹏程针对空间众包中任务分配构建模型的局限性, 提出基于多智能体深度强化学习的模型来解决任务分配问题, 对武器目标分配有借鉴意义[22]。

通过分析, 目标分配模型由最初的静态模型逐渐向动态模型发展, 模型不断丰富, 但由于作战样式的快速发展, 模型研究的进展不能满足新型作战的需求, 主要表现在以下几个方面:

(1) 模型相对固化、 过度简化问题。 武器目标分配模型不是简单的数学模型, 而是借助数学手段构建的军事模型。 现有研究往往将此问题过度抽象简化为数学模型。 缺少对交战规则、 作战原则、 武器性能等约束条件的考虑, 导致模型的适用性差, 无法应对各种作战冲突。

上一篇 点击页面呼出菜单 下一篇