基于眼动特征的驾驶疲劳个体差异性研究
作者: 孙茜 徐军
关键词:个体差异;个体敏感度;眼动特征;疲劳驾驶
目前,疲劳驾驶引发的交通事故占总交通事故比例已达到15%~20% [1]。为了降低因疲劳引发的交通事故,研究者们采用了多种方法来检测驾驶员的疲劳状态。由于疲劳发生时,驾驶员会出现持续睁眼时间缩短、眨眼频率变快等现象 [2],因此,研究者们常采用眼部特征来进行疲劳检测。例如,牛清宁等人利用眨眼频率、Perclos、注视方向和注视时间来建立疲劳检测模型,其检测率达到83.84% [3];刘志强等人采用Per⁃clos 和眼睛焦点位置构建疲劳检测模型,检测率为83.92% [4]。这些研究结果表明,利用眼部特征可以有效进行疲劳检测。
查阅基于眼动特征的疲劳检测相关文献发现,单位时间内眼睛闭合的百分比Perclos(Percentage of Eye⁃lid Closure over the Pupil over Time) 、眨眼时间均值、眨眼频率、瞳孔直径是研究者常用的眼动特征指标。在疲劳检测研究中,研究者发现,个体差异对疲劳特征指标的选取和疲劳检测精度存在显著影响。胥川等人发现,考虑个体差异可以提高疲劳模型的检测精度[5];吴超仲等人发现,疲劳指标的有效性会受到个体差异的影响[6]。
为了降低个体差异对疲劳检测率的影响,研究者们从优化检测模型和选取有效疲劳特征两方面进行尝试。方法包括:建立小样本个性化驾驶疲劳检测模型[7];利用个性参数构建自适应检测模型[8];对聚类后的驾驶人群建立各自疲劳识别模型,再将各模型加权得到最终疲劳识别模型[9];以及构建与注视分布变异系数有线性关系的驾驶疲劳度作为疲劳检测指标[10]。这些研究在一定程度上解决了个体差异对疲劳检测模型的影响,但有些研究由于实验人数的增多变得过于复杂,有的则遗漏了常用的眼动疲劳特征。
本文借鉴了研究者在驾驶行为和脑电信号中关于个体差异性的研究成果,参考吴超仲等人提出的基于汽车转向特征指标的个体差异敏感度,首先选取常用的眼动疲劳特征,然后计算这些眼动疲劳特征的个体差异敏感度,筛选出个体差异敏感度最小的眼动特征以建立疲劳检测模型;然后通过模型的检测率和稳定性来分析模型性能与眼动特征的个体差异敏感度之间的关系。
1 疲劳驾驶实验
1.1 实验平台和实验过程
实验的目的是采集受试者在模拟驾驶时,处于清醒和疲劳两种状态下的眼动数据。按照实验要求,实验选择了23名年龄在21~23岁且具有合法驾照的大学生作为受试者。受试者头戴眼球追踪仪在模拟驾驶器上进行模拟驾驶。图1(a) 显示了受试者头戴眼球追踪仪正在驾驶汽车模拟器,该模拟器由北京中商联合教学设备有限公司研制。图1(b) 显示了Er⁃goneers公司的Dikablis头戴式眼球追踪仪。其中,B 摄像头负责获取受试者左眼的眼动数据,A摄像头负责获取受试者正前方显示屏上的视频数据,C点放置在驾驶员的鼻梁上。获取的眼动数据及视频数据传输到D-lab软件,由D-lab软件计算Perclos、扫视长度等眼动指标数据。为了让受试者快速进入疲劳状态,实验的模拟驾驶环境选择了高速公路。实验时间设置在下午2:00。实验开始前,受试者试驾5分钟。5分钟后,实验员开始采集眼动数据,采集时间为60分钟。实验结束后,将前10分钟的眼动数据定为清醒状态数据,最后10分钟定为疲劳状态数据。
1.2 眼动特征指标的选取
本文参考了其他研究者及作者以往的研究[11-12],选取了Perclos、瞳孔直径以及眨眼时间均值(zy_time) 这三个常用的眼动特征指标。考虑到每个人的瞳孔大小差异较大,本文选用瞳孔直径变异系数(CVPLD,Coeffi⁃cient of Variation of Pupil Diameter) 作为眼动特征指标。瞳孔直径变异系数CVPLD的计算公式如下:
其中,PLD_std为瞳孔直径的标准差,PLD_mean 为瞳孔直径的平均值。由于实验中个别驾驶员的数据存在缺失和偏差的问题,本文选取了19个受试者的驾驶实验数据。为了判断这19个受试者的数据在统计分析结果上是否具有可靠性和代表性,本文采用了Python的statsmodels库来计算实验所需的样本量。分别设置效应量为0.8,显著性水平为0.05,统计功效参数为0.8,计算结果表明所需样本量为14人。因此,本实验的样本人数在统计上可以保证结果的可靠性和代表性。本文设置各眼动特征指标的分段周期为1分钟,因此,获取的各眼动特征样本数为380个。其中,清醒状态样本190个,疲劳状态样本190个。
2 方法
2.1 Kruskal-Wallis 检验
Kruskal-Wallis (KW) 检验是一种用于比较三个或更多独立样本的非参数检验方法。该检验基于对所有样本的秩次进行比较,而不是直接对原始数据进行比较。它不需要假定数据来自正态分布,因此适用于非正态分布的数据。KW检验采用H 统计量,其定义如下:
式中,k 是组数,N 是总样本数,Rj是第j 个样本的秩和,nj是第j 个样本的样本值。假设有k 个相互独立的简单随机样本(X1,...,Xni) (i=1,...,k),对k 组样本进行KW检验的步骤如下:
1) 确定假设。零假设H0:k做独立样本的分布是相同的。备择假设H1:至少有一个独立样本的分布与其他样本不同。
2) 将k 组样本的所有观测值合并为一个组合样本,然后按递增顺序排列。
3) 排序后的值用秩次替代。将最小值的秩次设置为1,第二小的值的秩次设置为2,依此类推。
4) 计算各组的秩和,继而计算H值。
5) 根据样本量和显著性水平(一般α= 0.05)确定临界值。如果H>临界值,则拒绝零假设H0,即各组的分布不完全相同;如果H≤临界值,则不能拒绝零假设H0。
2.2 个体差异敏感度计算
本文通过个体敏感度来量化眼动特征的个体差异性大小。为了区分单个受试者和双受试组合的H统计量,将单个受试者进行Kruskal-Wallis(KW) 检验的H统计量标记为Hd,双受试组合进行KW检验的H 统计量标记为Hs。眼动特征的个体敏感度计算过程如下:
1) 逐一对每个受试者在清醒和疲劳驾驶状态下的眼动数据进行KW检验,得到每个受试者的P 值和H 统计量Hd。在所有P<0.05的受试者中,选择Hd最大的受试者(Hdmax) 作为指标最优受试者。
2) 将最优受试者逐一与其他受试者组成双受试组合,计算两受试指标个体差异度Cy。Cy的公式为:
式中:Stm和 Stf分别为清醒和疲劳时两受试间秩的总方差;Sam和 Saf分别为清醒和疲劳时两受试间秩的组间方差;Mz和Mq分别为最优受试者和某一其他受试者在两种驾驶状态下指标中位数的差值;Hdz和 Hdq分别为最优受试和某一其他受试的H 统计量。
3) 对双受试组合两种驾驶状态下的眼动数据进行KW检验,计算双受试组合H 统计量(Hs)。
4) 为了分析双受试指标计算出来的多组H 统计量Hs和相对应的Cy,值的关系,这里采用加权最小二乘法拟合直线进行线性拟合,拟合方程为Hs=kCy+b。其中,k 的绝对值表示指标个体差异敏感度。
3 结果与分析
3.1 不同状态下的眼动指标的个体差异性
首先,对受试者在清醒状态和疲劳状态下的眼动特征数据的均值进行比较,比较结果如图2所示。
从图2中可以看出,大部分受试者在疲劳状态下的眼动特征均值都大于在清醒状态下的眼动特征均值。然而,每个受试者的眼动指标均值变化幅度是有差异的。例如,在两种状态下,Perclos均值变化幅度最大的是编号为9的受试者,而zy_time均值变化幅度最大的是编号为7的受试者。这说明受试者的眼动指标均值变化存在个体差异性。
为了进一步分析眼动指标在不同驾驶状态下的具体差异程度,本文对每个受试者在清醒和疲劳状态下的三个眼动特征数据进行了KW检验,检验结果如表1所示。
表1显示,不同状态下同一眼动特征的差异性因人而异,存在个体差异。例如,对于Perclos指标,只有9个受试者在不同状态下的数据存在明显差异,并且H统计值也是不同的。其中编号为9的受试者的H值最大。在计算个体敏感度时,该受试者被指定为Per⁃clos指标的最优受试者。同理,表1中zy_time指标的最优受试者为编号16的受试者,CVPLD指标的最优受试者为编号12的受试者。
由于指标在不同受试者之间的一致性是评估指标有效性的一个因素,因此本文对清醒(疲劳)状态下所有受试者的同一眼动特征数据进行了KW 检验。如果p<0.05,则表示不同受试者的特征数据存在较明显差异,总体分布不同;反之,则表示不同受试者的特征数据不存在明显差异,总体分布相同。表2显示了所有受试者在清醒(疲劳)状态下眼动特征数据的KW 检验结果。
表2中,两种状态下每个眼动特征的p 值都小于0.05。因此,不同受试者各眼动特征的总体分布均不同,存在明显的差异,并且统计量H 越大,说明指标的差异越大;H 越小,指标的差异越小,指标的一致性就越好,指标的有效性受个体差异影响就越小。表2结果显示,在清醒(疲劳)状态下的眼动指标Perclos的H值都是最小的,因此Perclos指标的差异也是最小的。这与胥川等人的研究结果[5]一致。
3.2 各指标的个体差异敏感度分析
分别计算Perclos、zy_time以及CVPLD三个眼动特征的个体差异敏感度。此处采用加权最小二乘法进行线性拟合。为了优化直线的拟合效果,本文通过最小二乘回归获取权重矩阵。首先,通过最小二乘估计得到随机误差项的近似估计量,将随机误差项平方的倒数作为权重,这样可以降低误差较大样本对估计的影响。三个眼动特征的个体差异敏感度直线拟合效果如图3所示。
图3中每个子图的横坐标都为Cy,纵坐标都为Hs。可以看出,图中每个子图中的Cy和Hs都是负相关的,Hs值随Cy值的增大(减小)而减小(增大)。但每个子图中的Hs随Cy变化的速度不同。这一点与吴超仲等人的研究结果[6]吻合。表3显示了各眼动特征的拟合直线方程及直线的线性拟合度,其中拟合直线斜率的绝对值即为眼动特征的个体敏感度。
直线斜率绝对值越小,个体差异敏感度越小,Hs随个体差异Cy增加下降的速度越慢,Hs受个体差异Cy变化的影响就越小。即指标的有效性受到个体差异的影响越小。表3中显示,直线斜率绝对值从小到大的顺序依次为:Perclos、CVPLD、zy_time。因此,Per⁃clos的个体差异敏感度最小,其识别有效性受个体差异的影响最小。
3.3 疲劳检测模型的性能分析
为了检验基于眼动特征的疲劳检测模型性能是否与眼动特征个体差异敏感度有关,本文采用了SVM 分类算法建立了7个检测模型。这些模型的疲劳特征依次为单特征Perclos,zy_time,CVPLD;双特征(两个特征的组合)per_zy,per_CVPLD,zy_CVPLD;三特征(三个特征的组合)per_zy_CVPLD。为了检测各模型的检测稳定性,受试者人数依次从1逐步增加到19 个。图4显示了各检测模型的识别率均值及模型检测率的方差分析情况。
其中,模型检测率的方差代表模型检测率的变化幅度,方差越小则模型的检测稳定性越好。从图4中可以看出,为了分析双受试指标计算出来的多组H统计量Hs和相对应的Cy值的关系,这里采用加权最小二乘法拟合直线进行线性拟合,因此,眼动特征的个体差异敏感度可以作为选择疲劳特征的参考。本文的研究结果为Perclos指标的有效性提供了一定的理论依据。
4 结论
在研究眼动疲劳特征的选取问题时,研究者发现个体差异对疲劳检测具有一定的影响。为了减少个体差异对疲劳检测模型的影响,本文采用个体差异敏感度来量化眼动特征受个体差异影响的大小,并从检测模型的检测率和稳定性来评估参考个体差异敏感度选择眼动特征建立的检测模型性能。首先,本文研究发现眼动指标的数据不仅在同一驾驶状态下存在个体差异性,而且从清醒到疲劳状态的变化过程中也存在个体差异性。其次,通过个体敏感度量化眼动特征受个体差异的影响大小,并比较不同个体敏感度的眼动指标建立的检测模型的检测率均值和检测稳定性,发现选择个体敏感度较小的眼动指标有可能建立一个较稳定且检测率较高的疲劳检测模型。
当然,本文仅考虑了常用的三个眼动指标,未来还将对更多眼动指标进行类似的研究,以便量化更多眼动指标受个体差异的影响大小,从而进一步为眼动指标的有效性提供理论依据。