基于优化随机森林的对地攻击无人机自主作战效能评估

作者: 邵明军 刘树光 李姗姗

基于优化随机森林的对地攻击无人机自主作战效能评估0

引用格式: 邵明军,刘树光,李姗姗. 基于优化随机森林的对地攻击无人机自主作战效能评估[ J]. 航空兵器,2023,  30( 6): 81-88.

Shao Mingjun,  Liu Shuguang,Li Shanshan. Assessment of Autonomous Combat Effectiveness of Ground-Attack UAV Based on Optimized Random Forest [ J]. Aero Weaponry,2023,  30( 6): 81-88.( in Chinese)

摘  要:      为实现高效、快速、客观地对对地攻击无人机自主作战效能进行评估,文中引入向量加权平均算法(Weighed  Mean of Vectors Algorithm, INFO)和K折交叉验证方法对随机森林算法(Random Forest, RF)进行优化寻找最优参数组合,提出了基于优化随机森林的对地攻击无人机自主作战效能评估方法。首先, 基于向量加权平均优化算法理论, 对随机森林决策树模型数量以及最大深度两项超参数进行寻优。其次,结合对地攻击无人机作战任务,对自主作战效能评估的主要作战因素进行分析,归纳总结了对地攻击无人机自主作战效能评估指标体系,并建立了基于INFO-RF的无人机自主作战效能评估模型。最后,通过对评估模型进行实例验证并与其他方法进行对比分析,结果表明,相较于传统RF模型、GA-RF模型和SVM模型,INFO-RF模型输出结果具有较高的拟合度和更为精确的评估值,实例结果有效验证了所提方法的合理性和优化模型的可靠性。

关键词:     对地攻击无人机;作战效能;评估指标;随机森林;向量加权平均算法

中图分类号:      TJ760;V279

文献标识码:    A

文章编号:     1673-5048(2023)06-0081-08

DOI: 10.12132/ISSN.1673-5048.2023.0136

收稿日期: 2023-07-05

基金项目: 国家自然科学基金项目(72271243);国家社会科学基金重点项目(21AGL030);研究生创新实践基金项目(CXJ2022045)

作者简介: 邵明军(1990-),男,山东滕州人,硕士生。

*通信作者: 刘树光(1981-),男,山西怀仁人,副教授,博士。

0  引  言

随着信息技术、智能技术、无人技术的迅速发展与大量应用,无人机作为集成多种先进技术于一体的空中作战平台得到了飞跃式发展,并在世界各国军事领域得到广泛应用。同时,依托各类先进技术催生出无人机新的作战形态,也在各种作战、演训任务中发挥着至关重要的作用。当前,如何衡量无人机装备对作战态势的影响程度以及把握无人机自主作战性能强弱,是研究无人机技术发展与实际作战运用相结合的迫切需要。建立科学合理的无人机自主效能试验评估方法是全面清晰了解无人机装备性能、优化调整参数以提高作战能力的有效途径,也是综合评估无人机技术和自主作战能力的关键措施。

近年来,不少学者基于机器学习算法对无人机自主作战效能进行评估研究,并取得丰硕成果。文献[1]基于自适应粒子群算法优化反向传播神经网络,建立了无人机空地作战效能评估模型,有效避免了无人机作战效能评估的主观性和系统的不确定性,实现了无人机作战效能的快速、高精度评估。文献[2]结合无人机作战使用过程,提出了基于动态贝叶斯网络方法的无人机作战效能评估模型,并利用Netica工具对无人机作战效能进行动态评估仿真,验证了模型的可行性。文献[3]为获得精确的无人机作战效能评估结果,利用混沌粒子群算法对支持向量机超参数进行优选处理,构建了混沌粒子群-支持向量机的作战效能评估模型,其评估结果表明模型具有较好的计算精度和较高的评估效率。然而,在实际应用过程中,以上模型也存在较多不足,如神经网络模型训练所需时间较长存在多个极值点、容易陷入局部极小值等问题,贝叶斯网络模型处理高维数据、非线性问题较为困难且计算复杂度较高,支持向量机模型也存在超参数选取、调节较为困难等问题。

随机森林算法作为一种机器学习算法,目前已有较多的研究表明,其具有训练速度快、预测精度高、泛化能力强、不易过/欠拟合等优点,能够很好处理多参数之间的非线性映射问题,并在医学、材料学、地质学等[4-6]众多领域得到了广泛应用。近年来也逐渐应用到装备效能评估方面,文献[7]基于随机森林算法构建了作战效能评估模型,实现了真实作战条件下运用机器学习方法对反舰导弹武器系统作战效能进行评估的目的。文献[8]面向系统指标体系与评估结果值构建随机森林模型,设计系统效能指标贡献率评估方法,实现了评价指标的重要度排序。然而,以上基于随机森林算法构建评估模型时,没有充分考虑模型本身对性能参数的要求,仅依靠系统自身随机或者主观设置参数,势必会引起模型效率低下无法发挥出最佳性能,进而影响效能评估结果。因此,为解决随机森林超参数选择主观性强、泛化能力差、评估效率低下等问题,本文引入了向量加权平均算法对随机森林模型参数进行寻优,通过向量的不同加权平均规则,来达到快速寻优目的,最终建立基于向量加权平均算法优化随机森林的无人机自主作战效能评估模型,通过实际算例,与其他机器学习方法对比,验证了该模型的有效性和实用性。航空兵器  2023年第30卷第6期

邵明军,等: 基于优化随机森林的对地攻击无人机自主作战效能评估

1  基于随机森林算法的理论基础

1.1  随机森林(RF)算法原理

随机森林算法是2001年由Leo Breiman提出的一种基于决策树算法和Bagging算法结合而形成的机器学习算法[9],同时也是一种现代分类和回归技术。其核心内容为集成学习,实质是由若干决策树组成的分类器,通过组合多棵随机形成的决策树,形成一个预测性能更加稳定的强分类器,最终由所有决策树的预测结果决定模型的输出值[10]。

1.1.1  决策树算法

决策树是一类常见的机器学习算法,是基于树的结构来进行决策的一种算法,可以用于解决分类或回归问题。典型的决策树是由根节点、中间节点和叶子节点构建而成,根节点是所有样本数据的集合,以此为起点自顶向下递归构建,并按照一定规则对样本特征提取、分类划分形成中间节点,继续递归构建,最终形成具有相似特征的数据子集,称为叶子节点。

在决策树的构建过程中,如何确定节点的最优分裂准则,是构建随机森林模型是否可靠的关键,当前关于节点分裂法则在分类问题中主要使用信息增益、信息熵、Gini系数;在回归问题中主要使用均方误差、平均绝对误差准则等[8]。由于对作战效能的评估结果需要所有决策树共同决定,本质上为回归预测问题,因此,根据最小均方误差准则,可以实现决策树节点的分裂,即在分裂样本的对应节点处按照最小均方差准则,采用二元递归分裂方法将样本划分为2个样本集,求出同时满足2个样本集均方误差最小以及均方误差之和最小条件下的特征及特征值划分点。损失函数为

minA, smin∑xi∈D1(A, s)(yi-c1)2+min∑xi∈D2(A, s)(yi-c2)2(1)

式中: A为随机抽样样本;s为对应的划分节点;xi为对应样本集中的特征值;yi为对应样本集中的目标值;c1和c2分别为2个样本集D1和D2的输出均值。

依据式(1),继续对已划分的每个样本集再次进行划分,重复操作直到满足停止条件为止,最后将样本空间划分为D1, D2, …,Dm。则生成的决策树数学表达式为

f(x)=∑mi=1ciI(x∈Di)(2)

式中: I(x∈Di)为示性函数(当x∈Di时取1,反之取0)。

1.1.2  Bagging算法

Bagging算法是一种并行结构的集成学习方法,其通过Bootstrap采样法对样本实行有放回采样,不断地提取样本直到构建出多组不同的训练样本集合,这些样本集合分别用来训练不同的弱分类器模型,然后将这些弱分类器模型经过一定的结合策略形成一个强分类器模型,这个过程中弱分类器之间是相互独立的,方法原理如图1所示。

1.1.3  随机森林模型

随机森林是一个由多棵决策树而形成的综合学习模型,结合了Bagging和决策树算法,其不仅对样本集进行随机取样,同时对于当中的特征属性也随机选取,从而构建出大量相互独立的决策树,并利用每棵树对特征和样本采样的差异性,有效降低过拟合,提升整体泛化能力[11],其模型表达式为

fRF(x)=1N∑N1h(x, ai)(3)

式中: N为决策树的数量;h(x, ai)为单棵决策树预测结果;fRF(x)为随机森林预测值的输出。

随机森林模型的构建主要过程为

(1) 从原始数据中采用Bootstrap抽样法随机有放回的抽取n个新的训练样本集,并且每个样本之间相互独立,通常每个样本集只包含原始训练集2/3的样本,剩下1/3未被抽取的数据被称为袋外数据(Out of Bag,OOB)[12]。

(2) 对每个通过Bootstrap抽样法构建的样本集建立决策树模型,在每个中间节点选择属性时,从样本集的所有属性中随机抽取若干属性作为该节点的属性集,并以最小均方误差MSE准则选取最优属性进行分裂,直到决策树生长完全从而形成“森林”。

(3) 输入测试集样本,每棵决策树计算生成一个预测值。在综合所有预测值的基础上,通过加权得出最终结果。对于回归预测问题,取所有决策树预测值的加权平均值作为最终预测值。

1.2  INFO优化算法

向量加权平均算法是由Ahmadianfar等于2022年提出的一种基于种群的新型智能优化算法[13],该算法通过改进加权平均方法和更新向量来实现寻求最优解的目的,其中更新规则、向量组合和局部搜索是INFO算法的3个核心过程。

在INFO算法中,通过更新规则算子可以增加最优解搜索过程中种群的多样性,这也是区别于其他算法的本质特征,主要由两部分组成: 一是从一组随机向量的加权均值中提取基于均值的规则并生成新的向量;二是加入了收敛加速部分以提高全局搜索能力。更新规则主要公式如下:

z1gl=xgl+σ×MeanRule+randn×

xbs-xga1f(xbs)-f(xga1)+1, rand<0.5

xga1+σ×MeanRule+randn×

xga2-xga3f(xga2)-f(xga3)+1, rand≥0.5 (4)

z2gl=xbs+σ×MeanRule+randn×

xga1-xga2f(xga1)-f(xga2)+1, rand<0.5

xbt+σ×MeanRule+randn×

xga1-xga2f(xga1)-f(xga2)+1, rand≥0.5 (5)

式中: z1gl和z2gl分别为第g次迭代的2个新向量; xga1, xga2, xga3, xgl为迭代g次后的向量,a1≠a2≠a3≠l为从[1, Np]中随机选择的不同整数,Np为向量种群个数;xbs,xbt分别为第g代种群中最优、次优的解向量;f(x)为目标函数;randn为一个标准正态分布随机值;rand为[0, 1]之间的随机数;σ为向量缩放比例因子;MeanRule为向量规则,具体公式如下:

上一篇 点击页面呼出菜单 下一篇