概率密度函数信息融合概述
作者: 李建勋 于兴凯
摘 要:概率密度函数不仅包含了一阶、 二阶统计量信息, 还包含高阶统计量及更为复杂的特征信息。 多传感器的概率密度函数信息融合是信号处理领域一个复杂待解决的难题, 尤其是随着自动驾驶、 无人系统等领域对于多传感器多尺度信息融合的需求, 该问题的重要性逐渐凸显, 如何设计融合准则、 如何形成统一的融合框架是科学家和工程师们一直致力于解决的课题。 本文针对随机变量的多传感器获得的多概率密度函数融合问题, 调研了现有的融合理论和方法, 提供了一些融合设计规则、 准则、 原理和定理等, 如公理化方法、 优化方法和超贝叶斯方法, 期望能够为该问题的有效解决提供一定的方向性指导。
关键词:概率密度函数; 信息融合; 公理化; 池化函数; 超贝叶斯; 机器学习; 目标跟踪
中图分类号: TJ760文献标识码:A文章编号: 1673-5048(2023)03-0001-10
DOI: 10.12132/ISSN.1673-5048.2022.0205
0 引言
目前, 针对状态信息的信息融合表达较多是以变量(标量、 向量、 矩阵)及随机变量的形式表示。 通过对变量的加权平均求融合中心或者通过对随机变量的均值和方差进行加权平均, 从而实现对多状态信息的融合。 然而, 均值和方差仅仅代表随机变量的一阶和二阶统计量信息, 高阶统计量信息及其内在的概率分布形态特征等信息, 在现实中大多被忽略, 进而导致融合效果欠佳。 典型的例子是非线性滤波问题。 通过泰勒展开得到的扩展卡尔曼滤波精度低, 而无迹卡尔曼滤波和粒子滤波通过估计状态的概率密度函数, 结合贝叶斯推理, 得到更为精确的状态估计值。 因而, 通过将不同传感器的状态和观测量等特征信息统一到概率密度函数上进行求解与融合, 是一条实现多尺度融合的有效之路。
多传感器概率密度函数信息融合是一项富有挑战的技术难题, 并且在众多领域展示出较高的应用价值, 如航空航天[1-4]、 多传感器信息处理[5]、 机器人[6]、 环境感知[7]、 自动驾驶[8]、 经济与金融工程等[9-10]。 该难题在过去几十年中引起广泛的重视, 然而针对该问题的研究仍处于起步阶段, 有很多的障碍需要去跨越, 难以形成统一的融合框架[11]。 基于应用需求及理论难度, 本文从现有文献方法综述的角度, 简述现有思路与方法, 希望能抛砖引玉, 给广大科研工作者与工程师们以启示, 期许能够最终解决该问题, 形成一套完美的融合理论框架, 并能在工程中得到广泛应用。
1 概率密度函数
连续型随机变量的概率密度函数是一个描述该随机变量输出值, 在某个确定取值点附近的可能性函数。 相较于随机变量的一阶二阶统计量(均值和方差), 随机变量的概率密度函数也包含高阶信息及整个特征信息[12-15], 主要表现在以下几方面:
(1) 概率密度函数构成了针对随机变量完整的概率描述。 除了可以表述一阶统计量(均值)和二阶统计量(方差), 还包括其他高阶统计量等重要特征信息, 如有效规模、 多模态、 尾部衰减、 重尾[16], 及其在均值周围的“离散”特征。
(2) 概率密度函数提供了传感器状态信息的标准化和“无关来源”描述, 即它是来自于传感器对原始数据复杂处理的抽象。 这种特性使得异类传感器、 不同感知方式以及不同类型数据之间能够进行融合[17]。 另外, 在具有高度隐私的工程应用中, 保密性是一个理想的特性, 也是概率密度函数能够提供的。
(3) 因概率密度函数提供了一种标准化、 与起源无关的描述, 所以其融合非常适合分布式(点对点)网络拓扑。 在分布式、 可自组网络中, 通常一个智能体只与其邻居节点进行通信, 非邻居节点的特征信息无法获得。 另外, 概率密度函数信息便于通过网络进行信息传播。
(4) 基于参数化表示的概率密度函数融合算法计算效率更高。 例如, 高斯分布的融合可退化到融合相应的均值和协方差矩阵; 高斯混合的概率密度函数融合能够表示为任意概率分布[15]。 在分布式的实现方式下, 参数化概率密度函数的描述能够以较低或中等通信成本实现概率密度函数信息融合, 因而概率密度函数信息融合以其较为适中的计算代价和通信复杂度成为关注的焦点。
以信号处理中的噪声参数采用概率密度函数进行刻画处理为实例, 分析采用概率密度函数进行信息处理的研究进展。
利用概率密度函数刻画噪声方差的动态特征, 进而对其与状态联合估计, 是近年来解决滤波噪声方差未知问题的有效手段, 并发表了大量的研究成果。 针对加性观测噪声未知的情形, Simo 等采用逆伽马分布(Inverse-Gamma)[18] 和逆威沙特分布(Inverse-Wishart) [19] 来刻画动态时变的加性观测噪声方差, 并利用变分贝叶斯推理对其进行估计。 针对状态噪声和观测噪声方差均未知的情形, Huang等采用逆威沙特分布刻画, 基于变分贝叶斯推理, 可对其进行迭代估计[20]。 针对状态噪声和观测噪声为重尾非高斯的情形, Huang等用学生t (Student’s t)分布对其进行刻画, 并推导出相应的线性及非线性滤波器和平滑器[21-22]。 另外, 针对非平稳重尾状态和观测噪声情形, Zhu等通过对观测似然函数和一步预测建模为两个高斯分布的混合形式, 对其进行估计[23]。 针对非高斯噪声所表现的重尾或偏态分布特性, Huang等利用广义高斯尺度混合分布对其进行刻画, 提出鲁棒Rauch-Tung-Striebel平滑器框架[16]。 之后基于统计相似性度量, 又提出重尾鲁棒卡尔曼滤波框架[24]。 针对非稳态高斯分布具有强不确定性噪声方差阵的情形, Huang等利用Gaussian-Inverse-Wishart 混合分布对其进行刻画, 并提出相应的变分自适应滤波器[25]。 针对观测噪声非高斯且统计量未知的情形, Zhu等利用高斯混合概率模型对其进行刻画, 结合变分贝叶斯推理对其与状态进行联合估计[26]。 针对乘性噪声的方差估计问题, Yu等用概率密度函数对其进行刻画, 结合卡尔曼滤波及变分贝叶斯推理, 对方差与状态进行联合迭代估计[27], 并扩展到加性噪声与乘性噪声方差皆未知的情形[28]。 针对目标跟踪系统中的观测噪声方差未知且含有不确定性参数的估计问题, Yu等基于概率密度函数刻画未知变量, 联合状态对其进行迭代估计[29-31]。
另外在红外目标跟踪、 图像处理[32-37]、 天气预测[38-43]、 概率机器学习[44-47]等领域, 用概率密度函数对目标状态进行处理也是极为常见的。
2 融合规则与方法
概率密度函数信息融合规则有很多, 现有融合方法都是基于各自领域、 特定对象进行考量, 选取的融合规则和差异度量取决于场景和应用对象, 并未形成统一有效的方案。 由于不同融合规则在不同场景对象下可能导致差异性很大, 因而形成统一或多元化的方案迫在眉睫。
区别于融合(非随机)变量(标量、 向量、 矩阵), 概率密度函数信息融合是直接对随机变量的概率密度函数进行融合, 而不是它的点估计。 该融合问题目标是为了寻找融合规则或者池化函数(Pooling Function)。 为此, 研究者提出各类型池化函数, 典型的有线性池化函数(加权算数平均, 也即算术平均密度)[48]、 对数线性池化函数(加权几何平均值, 也称为切尔诺夫融合或几何平均密度)等[49-50]。 需注意的一个特例: 对于高斯概率分布, 方差交叉融合技术是对数线性池化函数的一种特例[51]。 尽管有众多类型池化函数, 但仍没有一个被广泛认可。 现有池化函数主要概括为以下几类[10]: (1)线性池化函数(Linear Pooling); (2)广义线性池化函数(Generalized Linear Pooling); (3)对数线性化池化函数(Log-Linear Pooling); (4)广义对数线性化池化函数(Generalized Log-Linear Pooling); (5) Holder池化函数(Holder Pooling); (6) 逆线性池化函数(Inverse-Linear Pooling); (7)乘性池化函数(Multiplicative Pooling); (8)广义乘性池化函数(Generalized Multiplicative Pooling); (9) Dictatorship 池化函数(Dictatorship Pooling); (10)教条池化函数(Dogmatic Pooling)。
基于现有文献调研, 设计概率密度函数信息融合池化函数需要遵循以下准则: 公理化方法、 优化方法和超贝叶斯方法。
2.1 公理化方法
公理化方法就是要设计符合各种公理性质的融合规则(池化函数), 并期望池化函数能够使各传感器概率密度函数信息遵循这些基本公理。 这是概率池化函数所必备的性质, 融合的目的也是寻求满足一定期望属性(公理)的池化函数。
2.1.1 公理(Axiom)
(1) 公理1: 对称性(Symmetry)。 基本属性为对称性, 池化函数是一个对称函数。 由于融合中心的所有个体概率密度函数是平等的, 没有位次排序, 因而一个对称的池化函数是极其自然合理的。
(2) 公理2: 零保性能(Zero Preservation)。 如果每个传感器都认为某个事件是一个空事件, 即所有传感器都认为该事件的概率为0, 那么该事件的融合概率密度函数也应该是0, 此属性称为零保存属性。
(3) 公理3: 一致性(Unanimity Preservation)。 池化函数的另一个基本属性是保持个体间的一致性。 如果个体间的意见相同(即每个传感器对同一个事件的概率相同), 则融合后的概率密度函数应一致符合该意见。
(4) 公理4: 强集合函数性(Strong Set-Wise Function Property, SSFP)。 一个池化函数需具备的一个特性是强集合函数性, 即根据融合概率密度函数, 一个事件的概率可以表示为基于每个个体事件概率的函数形式。
(5) 公理5: 弱集合函数性(Weak Set-Wise Function Property)。 相较于SSFP, 一个更宽松的标准为弱集合函数性, 根据融合概率密度函数, 一个事件的概率是一个关于每个个体事件和事件自身的概率函数。
(6) 公理6: 似然准则(Likelihood Principle)。 另一个SSFP的宽松条件为似然准则, 即融合概率密度函数在一些随机变量上的值, 是基于所有个体概率密度函数在同一随机变量上的值的一个标准化常数, 该常数取决于判定标准。
(7) 公理7: 弱似然准则(Weak Likelihood Principle)。 一个似然准则弱化版是融合概率密度函数关于随机变量独立。
(8) 公理8: 独立性(Independence Preservation)。 池化函数另一个需要确保的特性是独立性, 即所有个体皆认可两个事件是独立的, 那么融合概率密度函数也应认为这两个事件独立。
(9) 公理9: 因式分解(Factorization Preservation)。 两个独立事件的融合概率密度函数可在形式上分解为各自概率密度函数的乘积。
(10) 公理10: 外部贝叶斯特性(External Bayesianity)。 基于概率的贝叶斯更新, 假设所有的概率密度函数是正数, 外部贝叶斯特性描述了概率的更新和融合是交换运算。 该特性可满足当个体之间虽具有不同先验分布但仍共享相同数据(即全局似然函数)。
(11) 公理 11: 个性化贝叶斯特性(Individualized Bayesianity)。 该公理基于融合后验概率的思想, 即每个个体的后验概率基于各自数据(局部似然函数), 而不是所有个体共享的相同数据。 个性化贝叶斯特性表示为在单个个体上概率密度函数的更新以及融合是交换运算。
(12) 公理12: 广义贝叶斯特性(Generalized Bayesianity)。 该公理表示概率密度函数的融合等价为融合似然函数。