基于鹰视顶盖响应和对比度感应机制的海上目标检测算法

作者: 胡爽 邓亦敏

基于鹰视顶盖响应和对比度感应机制的海上目标检测算法0

摘 要:针对海上目标检测任务场景,通过参考鹰眼双中央凹生理结构构建对比度感应机制及模拟鹰脑神经响应,提出了一种基于鹰视顶盖响应和对比度感应机制的海上目标检测算法,对海上目标进行显著性检测。该算法在不同颜色空间通道中利用对比度感应机制对图像进行处理,得到初步预处理结果后输入到仿鹰视顶盖感受野中计算响应结果,统计得到感受野响应,将各通道进行融合得到最终的显著图及目标的显著性检测结果。在ECSSD公开图库、实地海上目标图库及unity虚拟环境图库中的对比实验证明,该算法有效提高了对于海上目标显著性检测的能力。

关键词:目标识别;显著性检测;鹰眼;视顶盖响应;对比度感应;目标检测;海上目标

中图分类号:TJ765

文献标识码:A

文章编号:1673-5048(2022)06-0089-06

DOI:10.12132/ISSN.1673-5048.2022.0035

0 引 言

海上目标的检测识别是计算机视觉领域关注的一个重要课题,其技术被应用于水文信息采集、遥感测绘、海事救援、海洋渔业等诸多领域。随着相关成像技术的发展成熟,面对未来水上环境的立体化、多样化、复杂化,基于图像处理、计算机视觉技术的海上目标检测与识别成为当前研究的热点,具有广阔的应用场景[1

当前海上目标检测研究的主要对象是水面舰船,海上目标的背景一般为颜色纹理较为单一的海面环境,与海上目标的相关特征反差较大,故现有检测算法主要针对海上目标的颜色、轮廓、形状以及纹理等特征进行检测,常见的有阈值分割法、边缘检测法以及基于显著性的检测方法。阈值分割法对目标、背景有一定的要求,分离精度高,同时通用性较低;目标与背景颜色差异不大、边缘特征不明显时,边缘检测法效果不佳;基于显著性的检测方法实现较为简单,在目标特征较为明显且背景较为单一时效果较好,这与海上目标检测的任务环境是相契合的。

近年来,针对海上目标显著性检测,郭少军等[2提出一种基于颜色图像块聚类的舰船显著性检测方法,该方法对颜色相似区域做聚类处理,对其边缘进行背景索引标记获得显著度,最终获得显著性目标。余东行等[3将显著性检测和深度学习结合,对舰船目标进行定位和分类。刘伟建[4将局部方向特征和颜色特征相融合,进行舰船显著性检测,有效抑制了孤立噪声点的干扰,施天俊等[5结合了帧间差分特征对红外弱小目标进行显著性检测,抑制了背景虚警,提高了检测准确率。

对于目标检测这一课题,文献[6]通过模拟鹰眼视觉机制,建立了一种着陆目标特征提取方法,应用在无人机自主着陆的视觉测量系统中,并通过实验验证了该方法的准确性、速度和鲁棒性。文献[7]提出一种基于鹰眼视觉自适应机制的无人机海上小目标检测方法,将鹰眼视觉自适应机制引入到目标检测方法中,建立了针对高照度条件、低照度条件等情况下的自适应模型,有效抑制了背景干扰,突出了目标信息。文献[8]基于鹰眼的结构和特性,提出一种新的目标检测方法,同时提出一种模拟水面场景的方法并进行实验,对不同场景下的目标均有不错的检测效果。

本文参考鹰眼双中央凹结构[9提出一种基于鹰视顶盖响应和对比度感应机制的海上目标检测算法(Maritime  Detection Based on Eagle-Eye-Tectum Response and Contrast, MDERC),对目标进行显著性检测。主要工作和贡献有:

(1) 针对海上目标进行显著性检测,使用基于鹰视顶盖响应和对比度感应机制的海上目标检测算法对目标区域进行显著性提取。对原始图像利用感应对比度机制进行处理,在多个颜色空间的通道中减少目标周边区域中离散杂点的影响,降低虚警率,再使用仿鹰视顶盖感受野响应的显著图提取方法进行显著图提取。

(2) 实验证明本文算法提高了显著图提取的准确性,与其他方法相比可得到更好的显著性提取结果。

1 鹰眼机制

在生物视觉机理和仿生方面,具有不同构造生物的眼睛拥有不同的特点。鹰眼与其他生物的眼睛相比,同时拥有高视觉敏锐度和大视场范围,这两大特点使得鹰眼在目标检测等领域具有非常大的优势[10,而这种优势就来源于鹰眼独特的双中央凹结构。本文参考这种结构设计算法,以达到任务需求。鹰眼视网膜具有独特的双中央凹结构,分为正中央凹区和侧中央凹区,如图1所示。中央凹是视网膜中视觉最敏锐的区域,视觉细胞在此处斜向周围排列,光敏感器非常密集,具有更高的图像质量。根据鹰眼视网膜不同区域电子显微成像可以看出,中央凹区视觉细胞密集而周边稀疏,正中央凹和侧中央凹处为局部最大值。由于中央凹区的视觉细胞密度最高,因此鹰眼对于视觉信息的获取是非均匀的[11。这样非均匀的信息获取特点可以支持鹰眼更好地适应高空捕食活动,在捕获猎物和识别时可以自主切换策略[12,在对疑似的任务目标保持高分辨率观测的同时,又能对视野其他部分保持警戒,从而可以较好地平衡目标检测识别时的视场、分辨率间的关系。

另外在鹰脑视觉系统中存在离顶盖通路,是最为重要的一条视觉通路,如图2所示,由视网膜、视顶盖、圆核、外纹体构成,在离顶盖通路中又以中脑区域中的视顶盖最为重要[13,其神经元感知机制与视觉显著性间的关系已有诸多研究,Zahar等通过设计电生理学实验研究了仓鸮视顶盖区域的神经元响应与目标凸显感知机制之间的关系[14。学者从中研究建立仿鹰眼机制的算法,以应对不同场景下的任务需求。

2 检测算法

2.1 算法总体框图

算法总体框架如图3所示。首先,针对海上目标采图时的噪声干扰,通过仿鹰眼对比度感应机制对各颜色空间进行预处理,遍历各像素位置,记录中央区域最大值和中值,以及周边区域的均值,计算得到各像素位置的对比度感应值,调整图像各颜色通道抑制干扰;其次, 进行仿鹰视顶盖响应显著度提取,由事先训练集训练得到的视顶盖神经元模型,得到神经元响应,进一步计算得到显著度值,通过计算各通道的信息熵对显著图进行线性加权,得到最终的显著图及显著度检测的结果。

2.2 仿鹰眼对比度感应机制预处理

根据鹰眼视觉系统本身视觉细胞在视网膜上分布的差异性,对鹰眼视网膜中央凹和周边视觉细胞的不均匀分布特点进行模拟,构建出中央凹周边结构的局部区域[13,以达到图像增强的目的。以HSI空间中的I(亮度通道)为例,如图4所示,图中的环形区域为周边区域,dT和dB分别为中央区域和周边区域的直径,IT和IB分别为中央区域和周边区域的亮度平均值。对周边区域进行采样,进行计算,如图4(b)所示,定义第n个局部区域的中央区域为Vn0,周边区域分为6个子区域Vni(i=0, 1, …, 6)。取中央区域的亮度最大值表示为Ln,周边区域的亮度均值可表示为[9

式中:NV为周边子区域数量,NV=6;mni为各子区域的亮度中值。

根据中间区域的最大值和周边区域的信息,局部对比度函数定义为[9

从该定义可以看出,当中间区域的中值mn0大于周边区域均值m-n时,经过局部对比度函数计算,中间区域将得到增强,因此,局部对比度函数计算有利于显著度检测。

当周边区域中出现尖峰脉冲以及单像素噪声等离散杂点时,其亮度值不利于目标的检测。局部对比度函数中使用了中值进行计算,可以有效避免离散杂点的干扰作用。分析可知,有效减少目标周边区域中离散杂点的影响,降低虚警率,更有利于后续的显著图提取。

2.3 仿鹰视顶盖响应显著度提取

得到图像的初步处理结果后,通过对鹰脑视顶盖的浅层神经元感受野进行模拟,根据神经元感受野的响应大小进行统计,进一步生成得到显著度图。

将图像进行对比度感应处理后,输入到训练完成后的神经元感受野集合中,得到一个对应神经元响应的集合。由于训练完成后的神经元具有各向不一致性,对于相同的图像刺激,不同感受野会产生相同的神经元响应,反之则会产生不同的神经元响应,故对于背景的神经元响应会较平稳,而在目标区域则会出现较大差异。根据不同响应的最终统计结果,就可以得到图像中不同位置的显著值。下面对鹰视顶盖神经元进行模拟建立。

本文使用基于线性生成模型对鹰视顶盖神经元的响应特性进行模拟,将自然图像数据看作由基函数线性组合而成:

式中:x为观测数据向量,对应输入图像;A为混合矩阵,每列称为基函数;s为基函数稀疏向量。使用Sparsenet模型[15对鹰脑视顶盖浅层神经元的响应计算进行模拟,从10幅灰度化训练集图像提取图像块进行训练,通过学习得到感受野描述子,即基函数A。本文使用64个感受野对图像输入产生的响应进行描述,感受野如图5所示。

然后对输入图像的神经元响应进行求取,对图像按照感受野大小进行无重叠采样。根据无重叠采样得到的图像块计算得到对应的神经元响应,即已知采样结果x和训练得到的A阵得到采样结果对应的式(3)中的s阵,输入图像所对应的各组神经元响应,大致符合广义高斯分布[16,其方程如下:

式中:β=σΓ1αΓ3α,σ>0;μ和σ2分别为广义高斯分布的均值和方差。

如上所述,输入图像的神经元响应符合广义高斯分布,神经元响应大多集中在零附近。目标区域的响应较为特殊,而背景区域的响应较为一致。由此可得,目标区域对应响应出现概率较小,背景区域对应响应出现概率较大,与其相对应,出现概率较大响应的对应区域显著值较小,即背景区域的显著值较小,出现概率较小响应的对应区域显著值较大,即目标区域的显著值较大。

由上述结论可以建立由神经元响应求得图像显著值的计算方法,对四个颜色空间的各通道进行显著值计算,分别为RGB,LMS,HSI和YIQ颜色空间。第一步, 针对四个颜色空间的部分通道进行对比度感应机制计算,对LMS和YIQ中的各通道、HSI中的I通道,以及灰度图进行对比度感应机制计算;第二步, 求得图像对应的各组神经元响应,计算四个颜色空间的各通道及灰度图的显著值:

式中:S(x,  y)为单个通道中(x,  y)处的显著值;Rk为(x, y)处的神经元响应;rk(x,  y)为单个颜色通道或灰度图中(x,  y)像素处对应第k维神经元响应。

求得单通道的显著图后,根据各通道信息熵的计算结果对各通道显著图结果进行线性加权,根据信息论中熵的定义,计算每个通道的显著图的信息熵[6

式中:对应显著图中所有的显著值, i∈{1, 2, …, m}; m为对应通道显著图中的最大值; pi为在该通道显著图对应显著值i的出现概率。这样的定义与上面推论相对应,即当显著值均匀分布时图像熵最大,而当显著值集中在某几个数值附近时,熵会大大减少,直到全局显著值均相等的最极端情况,此时熵为0。因此,计算不同颜色通道时可以按照信息熵的大小对颜色通道进行选择,得到最合适的显著图。

上一篇 点击页面呼出菜单 下一篇