基于无线电陆空通话的飞行员情绪识别模型研究
作者: 王艾 林孟阳
摘要:情绪会影响包括解释、判断、推理以及决策等高级认知过程。随着人工智能技术的发展,自动化的情绪识别成为可能。利用人工智能技术识别飞行员的情绪状态,对其负面情绪进行干预,并对飞行员进行情绪自控力的训练,将极大地促进民航安全。通过对现有情绪识别技术的对比,以及无线电陆空通话与普通英语的差异性分析,并结合飞行员的职业特点,提出了一种基于无线电陆空通话的飞行员情绪识别模型。该模型包括语音数据的收集、声学特征提取、情绪特征提取、情绪识别与分类、动态数据分析等功能模块。该模型可为飞行员提供一种切实可行的情绪识别解决方案,对提高飞行安全具有十分重要的意义。
关键词:无线电陆空通话;语音情绪识别;情绪自控力;情绪识别模型;民航飞行安全
中图分类号:V328.1;TN912.34 文献标识码:A
文章编号:1009-3044(2023)27-0005-04
0 引言
无线电陆空通话是指飞行员与空中交通管制员在无线电频率上进行的以信息传递为目的的口语语言[1]。语言是人类传递情绪信息的工具。语音不仅包含说话人所要表达的语义信息,还蕴含说话人所要表达的情绪信息[2]。民航英语作为一门专门用途的语言,具备语言的社会性功能,也会传递情绪。
在民航飞行的过程中,可能遭遇如火灾、劫机、恶劣气象、鸟击、发动机失效、起落架故障等各种险情。当面对险情时,飞行员的不同情绪状态会在无线电陆空通话这一载体中显现出来。从2009年1月15日遭遇黑雁撞击、双发熄火,飞机失去动力后成功迫降哈德逊河的全美航空1549航班萨利机长,到2018年5月14日川航3U8633飞机驾驶舱副驾驶席风挡玻璃突然炸裂,驾驶舱严重失压情况下成功返航的刘传建机长,以及2019年8月15日遭遇鸟击、飞机双发失效,成功迫降玉米地的俄罗斯机长达米尔·尤苏波夫的通话录音中可以看出,三位机长均具备一个共同的特点,即情绪稳定,思维清晰。他们的无线电陆空通话符合通话规范,其语速平稳,内容较清晰(川航通讯失效后除外)。因此,稳定的情绪对民航飞行安全至关重要。面向飞行员的情绪识别是保证民航安全的重要一环。
1 情绪的分类
情绪是一种复杂的心理状态,会影响人的高级认知过程,包括解释、判断、推理以及决策[3]。按照其特性和对个体的影响,分为积极情绪、消极情绪和中性情绪。积极情绪即正性情绪,是指个体由于体内外刺激、事件满足个体需要而产生的伴有愉悦感受的情绪,包括快乐、满意、兴趣、自豪、感激等[4]。消极情绪指一种心情低落和陷于不愉快境况的基本主观体验,包括抑郁、焦虑、愤怒、悲伤等情绪状态[5]。中性情绪指既不明显积极也不明显消极的情绪状态,是一种介于积极情绪与消极情绪之间的一种情绪状态,如平静、冷静。
当面临特情时,积极稳定的情绪是飞行员正确操纵飞机安全着陆的保障。积极的情绪可以让飞行员集中精力记忆重要信息,正确流畅地进行陆空通话,并根据飞机的情况寻求最佳解决方案。而负面情绪则会影响飞行员的注意力、记忆力以及逻辑思维能力,进而影响空管人员对陆空通话的理解,进而对飞机状态和飞行员意图做出错误的判断,失去对飞机的控制,让险情雪上加霜。飞行员的情绪稳定性与飞行的安全绩效息息相关[6]。保持积极稳定的情绪对飞行安全具有重要意义。因此,识别飞行员的情绪状态,对其负面情绪进行干预,并对情绪不稳定的飞行员进行情绪自控力的训练,将极大地促进民航安全。
本文拟根据飞行员的工作特点,结合人工智能技术,提出一种基于无线电陆空通话的民航飞行员的语音情绪识别模型,可对飞行员的情绪进行识别和监控,并对频繁出现沮丧、焦虑、紧张等负面情绪的飞行员及时采取干预措施,进行情绪自控力的训练,以确保飞行安全。
2 面向飞行员的情绪识别技术
情绪识别是指计算机通过对采集的信号进行分析,自动识别人的情绪状态的技术。随着人工智能的快速发展,情绪识别技术得到广泛的应用。目前,人的情绪可以通过四种模式进行识别。第一种是通过对心率、皮肤电、脑电等生理信号的情绪检测。第二种是通过对眼睛、嘴角、眉毛等面部肌肉的运动进行面部情绪识别。第三种是文本情绪识别,即通过情绪词典以及深度学习的方法,提取单词、句子中的情绪特征进行识别。第四种是语音情绪识别,利用计算机分析语音信息,提取情绪特征,将特征值与情绪进行匹配,然后对情绪信息分类,进而推断出情绪状态的过程[7]。每种情绪识别方式因其不同的特点,均有其相应的应用场景。如果条件允许,也可以进行多模态的情绪识别,以提高其识别的准确性。
由于飞行员特殊的工作环境和工作性质,无论是通过佩戴脑电图帽进行脑电测试,还是在手上固定电极进行皮肤电测试,对飞行员都是一种入侵式的检测方式,会干扰其正常的操作。同时,由于这些设备的不舒适性、不便携等缺陷,基于生理信号的情绪识别并不适用于民航飞行员。对于面部情绪识别技术,一方面由于白天驾驶舱的紫外线较强,飞行员佩戴的太阳镜遮挡了面部,另一方面由于夜间驾驶舱的光线较暗,采集面部特征较难,所以飞行员的面部情绪识别较难实现。此外,在飞行过程中,飞行员与空中交通管制员及机组人员均是语音的交流,基本没有文本信息的交流,因此文本情绪识别同样不适用。
通过上述分析,基于生理信号、面部情绪或文本的情绪检测方法均不适用于飞行员。在整个执飞过程中,飞行员需要与空中交通管理员进行关于航路、高度、航行速度等信息的无线电陆空通话。因此,在无线电通信系统中融入语音情绪识别技术,从中提取出语音信号特征,包括音量、音调等,即可实现情绪状态分析。因此,语音情绪识别是面向飞行员特殊工作环境的最佳情绪识别形式。
3 无线电陆空通话与普通英语的差异性分析
无线电陆空通话是一种高度限制的英语,要求最大限度地提高准确性、简明性和清晰度,从而有助于航空安全[1] 。这种高度限制的英语与普通英语在语音特征、使用场景、语言风格等方面均存在不同。
1)语音特征的差异:由于飞机驾驶舱较大的背景噪音,无线电陆空通话可能存在信号失真、噪音干扰等问题,导致语音质量下降,从而对语音的声调、语速和音色等关键声学特征产生影响。而普通英语通话在日常生活场景中发生,语音较自然和清晰,质量相对更好。
2)语言内容和语言使用规范的特殊性:无线电陆空通话是一种在特定环境下交流的语言,其包含很多民航专业术语和特殊的语言使用规范。因此在进行飞行员情绪识别时,有必要针对这些特点进行相应的语料库构建和情感分析模型的训练,以确保准确地捕捉和识别情绪信号。
3)语言风格的差异:为避免歧义和提高通讯效率,飞行员和空中交通管制员需要使用简短、清晰和直接的语言。因此,无线电陆空通话较普通英语相比,更加规范、简洁和明了。这种语言风格可能会使情绪识别的难度较普通英语更难。
无线电陆空通话和普通英语存在着语音特征、语境和语言风格等方面的差异。因此,基于无线电陆空通话的情绪识别,需要充分考虑其特殊的语音特征、语言内容和语言使用规范以及语言风格的差异,进行定制化的情感分析模型训练和情绪分类,以便更好地捕捉飞行员的情绪,为飞行员自我情绪调节管理提供依据。