基于眼动追踪的指挥控制系统人机交互效能评估方法
作者: 田晨智 宋敏 田继伟 邢清华 梁文洋
摘要: 指挥控制系统是信息化作战体系的核心支撑, 其操作使用的便捷性、 准确性等人机交互效能直接影响着作战指挥控制效率。 为持续优化指挥控制系统人机交互效能, 需要建立科学合理的评估方法。 本文引入眼动追踪技术, 使用瞳孔直径、 眼跳次数、 注视点数量等眼动数据, 构建指挥控制系统人机交互搜索效率、 操作效率、 认知负荷、 设计复杂性和吸引性等指标的量化评估模型, 利用熵权-变异系数法对各眼动数据组合赋权, 形成指挥控制系统人机交互效能的综合评估结果。 基于该方法对指挥控制系统和指挥信息系统进行对比实验, 并利用SUS系统可用性量表和NASA-TLX认知负荷量表的调查结果进行对照分析, 结果验证了评估方法的有效性和准确性。
关键词: 指挥控制系统; 人机交互; 眼动; 熵权-变异系数法; NASA-TLX; SUS
中图分类号: TJ760 文章编号: 1673-5048(2023)04-0057-10
文献标识码: A DOI: 10.12132/ISSN.1673-5048.2023.0008
0引言
空中作战是现代战争的主要作战样式, 是夺取未来战争胜利的重要保证, 而指挥控制则是空中作战的基础与核心。 高效的指挥控制离不开先进的指挥控制系统(下文简称“指控系统”)与优秀的指挥控制人员(下文简称“指控人员”)。 在空中作战时, 指控人员要在时间紧、 压力大、 强度高的情况下迅速完成目标航迹识别、 空战指挥引导、 突发情况处置、 兵力动态调度等一系列任务, 这对指控系统的人机交互效能提出了十分严苛的要求。 和谐的人机交互设计不仅能够降低指控人员的认知负荷, 极大提升任务完成效率, 还可以最大限度地激发指控人员的潜力与指控系统的效能, 达到“人在回路”[1]的作战目标。
目前, 对于指控系统人机交互效能的评估大多采用专家打分、 问卷调查等方法, 评估结果主观性强、 缺乏科学依据, 且没有统一的衡量标准。 Lorenz等[2]通过主任务测试、 NASA-TLX、 SUS量表问卷调查等方法对挖掘机控制系统人机交互效能进行评估。 Liu等[3]将指控系统人机交互效能划分为126个可用性指标, 根据德尔菲法对人机交互效能进行评估。 Joseph等[4]研究了人机交互中产生的认知负荷与眼动指标间的关系。 高俊云等[5]使用灰色层次分析法评估舰炮武器系统的人机交互效能。 王颖等[6]运用GOMS模型对机载指控系统人机界面的任务操作流程进行优化。 王崴等[7]基于脑电和眼动信号识别人机交互意图。 通过上述研究不难发现, 相较于传统评估方式, 生理指标测量法具有采集数据科学、 客观, 计算结果可信度高等优点。 因此, 本文引入眼动追踪技术, 构建了较为完善的基于眼动指标的指控系统人机交互效能评估模型, 通过对比分析实验中采集的相关眼动数据, 使用熵权-变异系数法对其客观赋权以计算综合得分, 实现对人机交互效能的科学评估。
1基于眼动追踪的指控系统人机交互指标体系构建
1.1指标体系
参考软件质量评估模型[8], 将指控系统人机交互效能划分为人、 机、 人-机三部分, 分别从绩效、 设计、 协同三方面进行评估。 其中, 绩效评估可分为指控人员的搜索效率和操作效率; 设计评估可分为指控系统的复杂性和吸引性; 协同评估对应人机交互中产生的认知负荷。 经查阅大量资料[9-19], 同相关领域专家进行深入探讨, 结合指控人员的指挥控制流程以及指控系统的运行原理, 在综合考虑任务完成时间和准确率等要素的基础上, 基于眼动指标建立了指控系统人机交互效能评估模型, 如图1所示。
(1) 绩效评估: 从指控人员任务完成绩效的角度, 对指控系统人机交互效能进行评估, 包括指控人员的搜索效率与操作效率。 其中, 眼跳次数越少、 扫描路径长度和扫描持续时间越短, 则搜索效率越高, 反之越低[9-13]; 操作准确率越高、 任务完成时间越短, 则操作效率越高, 反之越低[14]。
(2) 设计评估: 从指控系统设计构造的角度, 对指控系统人机交互效能进行评估, 包括指控系统的设计复杂性和设计吸引性。 其中, 注视点数量和回视次数越多, 则设计复杂性越高, 反之越低[15-16]; 首次注视前时间越短、 首次注视时间和累计注视时间越长, 则设计吸引性越强, 反之越弱[9, 16]。
(3) 协同评估: 从指控人员与指控系统相交互的角度, 对指控系统人机交互效能进行评估, 主要由指控人员与指控系统在交互过程中所产生的认知负荷来衡量。 其中, 眨眼率越高、 眨眼时间越短、 瞳孔直径越大, 则认知负荷越高, 反之越低[17-19]。
1.2眼动评估指标
由于采集数据科学、 客观、 精准等特点, 眼动追踪技术已经成为一种广泛使用的效能评估方法, 眼动指标不仅能够用来测评产品设计的优劣, 还能够反映人们的思维方式以及心理特征。
本文通过眼动追踪技术对指控系统人机交互效能进行评估, 有效克服了专家打分等评估方法主观性强、 计算结果说服力差等缺点。 根据本文建立的指控系统人机交互效能评估指标体系对所涉及的相关眼动指标进行简要介绍, 如表1所示。
2指控系统人机交互效能评估方法
2.1评估流程
本文具体评估流程如图2所示。 利用眼动追踪系统记录被试在A系统和B系统中完成指挥控制任务的全过程, 测量相关眼动指标。 对其进行归一化处理, 并分别使用熵权法和变异系数法计算权重, 进行组合赋权, 得出眼动综合评分。
此外, 利用SUS系统可用性评估量表和NASA-TLX认知负荷评估量表对被试进行问卷调查, 从人和系统两方面验证了指控系统人机交互效能眼动评估结果的准确性。
2.2熵权-变异系数法组合赋权
由于眼动指标的特殊性, 德尔菲法、 层次分析法、 环比评分法等主观评估方法[20-22]不能精准衡量其重要程度, 故引入熵权-变异系数法对眼动指标进行组合赋权[23]。 熵权法[24]是一种客观赋权方法, 利用指标的信息熵判断其离散程度, 进而计算其所占权重, 然而通过熵权法获得的指标权重分布可能出现平衡缺陷。 变异系数法[25]能够有效克服异常值的不利影响, 还可以直接利用指标所包含的信息, 常用于两个总体均值不等的离散总体的比较。 因此, 将两种方法相结合能够有效弥补各自缺陷, 发挥更大优势。 具体计算步骤如下:
(1) 形成指标评价矩阵。 初始指标评价矩阵为
式中: xij(i=1, 2, …, n; j=1, 2, …, m)表示第i个方案中第j个指标的数值。
(2) 对初始数据进行归一化处理。
正向(效益型)指标处理公式为
逆向(成本型)指标处理公式为
式中: max(xj)和min(xj)分别表示同指标下所有样本的最大值和最小值。
(3)熵权法
计算第i个方案中第j个指标的特征比重, 即
(4)变异系数法
计算第j项指标的均值和标准差, 即
(5)熵权法和变异系数法组合赋权的结果为
ωj=λwj+(1-λ)δj(11)
式中: λ为偏好系数, 且λ∈(0, 1), 通常取λ=0.5。
2.3NASA-TLX指控人员认知负荷评估
NASA-TLX(National Aeronautics and Space Administration-Task Load Index)认知负荷评估量表[26]由美国航空航天局(NASA)开发, 是使用最广泛的主观心理负荷评估工具之一, 不仅被试间变异最小, 而且使用者接受程度最高。 该量表从6个维度划分了人的心理负荷因素, 其中每个维度均由一条20等分的直线表示, 如图3所示。
具体计算过程如下:
式中: F为认知负荷评估总分; Mi为被试在第i条直线上所选分数; Pi为15个对子中第i个项目被选中的次数。 NASA-TLX权重测试表如图4所示。
2.4SUS指控系统可用性评估
SUS(System Usability Scale)系统可用性量表[27]由Brooke于1986年编制, 共包含10道题目, 由奇数项的积极描述和偶数项的消极描述组成, 彼此间具有高度的相关性。 该量表具有简洁、 准确、 可靠等优点, 广泛应用于产品的可用性评估中。 因此, 在主观评估阶段, 以SUS系统可用性量表为基础, 结合指控系统人机交互的特点, 对该量表进行了改进, 如图5所示。
具体计算过程如下:
G=2.5×(S奇-S偶+20)(13)
式中: G为可用性评估总分; S奇为奇数项总分; S偶为偶数项总分。
3实验设计
3.1实验设置
实验对象为10名经过初始资格认证的指控人员, 平均年龄25岁, 双眼视力在1.0以上, 均接受过正规的指挥控制训练, 具备一定的指挥控制基础。 任务开始前, 首先向被试进行实验介绍, 然后被试佩戴眼动仪进行校准, 校准完成后先进行2 min的测试, 让被试熟悉眼动仪的使用方法, 之后正式开始实验。 每名被试在实验开始前都应重复上述过程。 本实验基于指挥信息系统和指挥控制系统, 被试在两套系统中完成相同的3项任务, 通过实验中测量的相关眼动数据, 结合上述模型, 对2套系统的人机交互效能进行评估。
3.2实验设备
实验设备包括指挥控制系统(A系统)、 指挥信息系统(B系统)和眼动追踪系统。 A系统(如图6所示)是保障指挥员和指挥机关对空中作战人员和武器系统实施指挥和控制的信息系统, 该系统以通信、 计算机等信息网络为主要依托, 具有文电处理、 指令传输、 态势分析和辅助决策等功能。 B系统(如图7所示)能够基于雷达情报显示当前空中敌我态势, 为指控人员进行空战控制提供实时信息支撑; 同时, 亦可生成模拟作战想定, 辅助指控人员进行训练。 其中, A系统和B系统都具有空战指挥控制功能, 但A系统的功能相对专一, 属于专业性系统, B系统的功能覆盖范围较广, 属于综合性系统。 眼动数据的测量采集使用Tobii Pro Glasses 3眼动测量系统, 可提供各种视角下的全方位眼动追踪数据, 如图8所示。