面向铁路遥感影像的自动化处理技术研究与应用
作者: 杨茜 赵红涛 麻克君 王和强 姜帅民
摘要:针对铁路遥感影像处理流程复杂、效率低下的问题,文章提出一种基于Python的自动化处理技术。该技术利用GDAL等开源图形库,实现了影像预处理、裁剪、配准、增强和切片等功能的自动化,有效提升了处理效率,并快速构建了目标检测算法所需的影像数据集。实验结果表明,该技术能够为铁路外部环境安全监测提供高质量的数据支撑。
关键词:遥感影像;目标检测;自动化处理;铁路外部环境监测
中图分类号:TP751.1 文献标识码:A
文章编号:1009-3044(2024)31-0112-04
开放科学(资源服务)标识码(OSID):
0 引言
近年来,随着我国铁路客运、货运业务的快速发展,铁路运营里程持续增长,发送旅客人次和货运量不断攀升,保障铁路运输安全成为一项至关重要的课题。铁路沿线两侧外部环境状况直接关系到行车安全,确保铁路外部环境安全、清除外部环境隐患尤为重要。
然而,铁路外部环境空间跨度大、环境多样性显著、隐患类型繁杂,传统的依靠人工巡检的方式存在着效率低下、成本高昂、易受主观因素影响等诸多不足,难以满足日益增长的铁路安全保障需求。为此,铁路行业开始使用高分辨率光学遥感影像[1],结合计算机视觉、人工智能等技术进行隐患目标检测与分割[2],以期提高排查效率,降低排查成本。
相较于人工排查,基于遥感影像目标检测的隐患排查方式,具有检测范围广、检测效率高、影像拍摄角度相对固定、便于对比不同时间数据等优点。铁路线路通常跨越多个城市甚至省份,覆盖全线所需遥感影像数据量巨大。遥感影像数据处理作为检测过程中的重要环节之一,存在着处理时间过长、处理过程烦琐的问题。面向深度学习应用的遥感影像处理包含预处理、裁剪、增强、切片等多个过程,然而市面上现有的软件或技术只能实现预处理、图像增强等部分功能,且往往需要依赖ENVI等商业软件[3],这在灵活性和经济性上难以满足实际应用的需求。
本文提出一种面向铁路遥感影像的自动化处理技术。以郑州铁路局管辖范围内京广高速为研究对象,采用高分二号遥感影像为数据源,利用Python语言和图形处理类库GDAL、geopandas等工具,开展自动化影像处理研究,提高铁路外部环境目标检测数据集的构建效率,并将最终产出的数据集应用于基于YOLOv8模型实现的彩钢瓦目标检测算法。
1 研究区概况与数据源
1.1 研究区概况
京广高速铁路连接北京和广州,是《中长期铁路网规划》中“八纵八横”高速铁路主通道之一,在郑州局管内由南向北跨越许昌、郑州、新乡、鹤壁及安阳五市,全长二百余公里,区间经过城市、乡村、城乡接合处,地貌以平原为主,并有少量丘陵。线路形式包含桥梁、路基,线路两侧分布城市建筑群、厂房、村庄、农田等,沿线隐患种类复杂多样,包括但不限于堆放隐患类(如杂物、建筑垃圾)、硬漂浮物类(如广告牌、彩钢瓦)、轻漂浮物类(如风筝、气球)等、树植隐患类。相较于普速铁路,高速铁路沿线巡检的作业范围有更高的要求,从线路两侧廊道扩展至两侧500米或1 000 米范围。作为我国高铁的大动脉,京广高速运营时间长、巡检频率高,积累了大量遥感影像数据及隐患信息数据,为研究提供了丰富的数据支撑。研究区地理位置如图1所示。
1.2 铁路遥感影像数据源
亚米级分辨率使光学遥感影像在目标检测领域得到越来越广泛的应用[4]。高分二号是我国首颗空间分辨率优于1米的民用光学遥感卫星,重访周期为5 天[5],影像空间分辨率及时间分辨率高,且易于从公开平台获取,因此选择高分二号PMS传感器L1A级影像作为数据源。
L1A级影像多光谱影像空间分辨率为3.2米,全色影像空间分辨率为0.8米,发布时已经过均一化辐射校正、去噪、MTFC、CCD拼接、波段配准等处理,但无法直接应用。制作满足训练、检测标准的数据集,还需进行影像预处理、研究区裁剪、地理配准、影像增强、切片等处理步骤。
处理后的数据集应达到以下要求:空间分辨率约1米,宽高均为640像素,真彩色合成,格式为无损的PNG,以最大程度保留影像细节,从而全面满足后续深度学习模型训练与检测应用中的各项需求。
2 影像自动化处理
遥感影像自动化处理总体流程如图2所示。
2.1 影像预处理
影像预处理过程包括辐射定标、大气校正、正射校正及图像融合,将L1A级多光谱、全色影像预处理后,可得到Tiff格式四波段影像。目前,高分系列卫星遥感影像预处理主要依赖于ENVI等商业软件平台,需要手动完成多个步骤,处理效率较低,单景影像处理时间约为40分钟。
本文在Windows 11操作系统环境下,使用Python 语言,结合GDAL、geopandas等开源处理类库,开发预处理工具,实现影像自动化预处理,一景影像处理时间压缩至13分钟左右,且程序运行过程中无须人工介入。
2.1.1 辐射定标
辐射定标是将影像各像元灰度值DN转换为实际物理量如辐射亮度、反射率等的过程。这一步骤中,将多光谱影像DN值转换为表观辐射亮度值,将全色影像DN值转换为表观反射率。
表观辐射亮度值一般采取线性公式计算,公式如下:
Lλ = gain × DN + bias (1)
式中:Lλ 为辐射亮度值,gain 为定标系数增益,bias为偏移量。gain与bias数据来自使用中国资源卫星应用中心发布的2024年国产陆地观测卫星外场绝对辐射定标系数。
表观反射率计算公式如下:
式中:Lλ 为公式(1)中计算获得,d为日地天文距离,通常值设为1。ESUNλ 为太阳辐照度,数据来自生态环境部卫星环境应用中心发布的高分二号各波段太阳辐照度。θ 为太阳天顶角度数,数据从影像元信息文件xml中读取获得。
2.1.2 大气校正
大气校正使用6S(Second Simulation of the Satel⁃lite Signal in the Solar Spectrum)模型,在针对国产高分卫星影像进行大气校正的过程中,6S模型与FLAASH 模型能够保持较好的一致性[6],消除一定大气影响。
6S模型所需参数主要包括气溶胶参数、传感器参数、大气模型参数等[7]。
气溶胶参数中气溶胶光学厚度参考河南气溶胶年平均值;气溶胶类型参数包含大陆、海洋、城市、沙漠、生物质燃烧等,根据研究区特性默认值设置为城市,并可通过传入参数方式修改。传感器参数包括影像拍摄时卫星和太阳的几何参数、光谱响应函数及波段信息等,几何参数从影像元信息文件xml中读取;光谱响应函数和波段信息则从中国资源卫星应用中心官方网站获取,并以步长0.002 5微米做重采样。大气模型参数根据中央经纬度和月份计算获得,并可通过传入参数方式修改。
2.1.3 正射校正
影像地理坐标系均为WGS84坐标系,投影坐标系使用通用横轴墨卡托(UTM)投影,正射校正使用GDAL类库,利用RPC(Rational Polynomial Coefficient)模型实现影像几何校正。实现步骤如下:
1)读取影像自带.rpc文件,向Tiff格式影像文件头中写入RPC几何校正模型参数。
2)计算研究区所在UTM分度带号,郑州局管内京广高速沿线通常为49N或50N,并使用GDAL的Warp 函数,实现正射校正。
2.1.4 影像融合
将高分辨率的全色影像与低分辨率的多光谱影像融合,可生成高分辨率多光谱影像,获得更好的视觉效果。本文使用GDAL类库的pansharpen函数实现影像融合功能。
预处理前后影像如图3所示。
2.2 影像裁剪
高分二号一景影像幅宽45千米,而实际应用时只需要铁路两侧500米或1 000米范围的影像。为提高后续处理效率,需要对预处理后的影像进行裁剪,去除无关区域影像。通常影像需要进行双重裁剪工作,初次裁剪时,铁路两侧预留部分冗余宽度以应对潜在的配准误差,地理配准后,影像会有所偏移,此时再进行精确裁剪,可精确界定影像边界。
裁剪功能需要提前准备铁路线路两侧指定范围缓冲区矢量文件作为裁剪标准,首先根据影像元信息生成矢量文件,再将该文件与缓冲区文件进行交集计算,以交集矢量文件为基础,使用shapefile、geopandas 及GDAL等类库实现Tiff格式影像的裁剪功能,功能流程图如图4所示。
2.3 地理配准
地理配准的目的是保证不同时期拍摄影像空间位置精确,尽量消除拍摄时卫星角度变化、几何校正误差等的影响。本文使用人工目视选取特征点的方式进行配准。
2.4 影像增强
遥感影像增强后能获得更好的视觉效果,突出地物特征[8]。直方图均衡化增强,可以使影像对比度提高,提升深度学习中目标检测的效率。
本文采用自适应直方图均衡化算法实现影像增强功能,主要步骤如下:
1)创建影像非空像素点的掩膜矩阵,用于区分影像前景和背景。
2)使用numpy类库对各波段进行均一化处理。
3)使用skimage类库对各波段均一化数据进行自适应均衡化拉伸。
4)将拉伸后的影像矩阵逆归一化,并利用掩膜矩阵去除背景,保留前景。
5)使用GDAL类库输出增强后的影像文件。
2.5 影像切片
影像切片是遥感影像流程的最后步骤。隐患治理工作需要累积与保留长期数据,为建立完善的、易于检索的长时序影像数据库,将遥感影像分割为尺寸标准化、编码规范化的单层级瓦片数据,切片规则及功能设计思路如下:
1)影像重采样。不同批次影像在经过一系列处理工作后,像素分辨率存在一定差异,因此首先对影像进行固定分辨率重采样,保证影像分辨率一致。
2)影像切片及编号。影像编号为“x_y”形式,x代表横向编号,y代表纵向编号。影像分辨率和宽高确定后,以西经180度,北纬90度为原点,使用滑动窗口方式进行切片。切片宽高均为640 像素,同时保留100像素重叠区域,以保证影像中地物完整性。利用影像左上角经纬度,可计算出每个切片影像的编号,不同时期同一区域影像切片后编号保持一致。
3)格式转换。目标检测模型训练数据集通常采用png或jpeg格式的图片,因此将切片后的影像转为png格式。图5为切片前后数据,图6中为不同时期同一编号的两幅影像。
3 遥感影像在铁路目标检测上的应用
选取2023年至2024年高分二号遥感影像132景,使用本文自动化处理技术处理后,获得铁路沿线图像数据8 120张,标注彩钢瓦目标21 000余个,对标注好的图像数据以8∶2的比例划分训练集和测试集。本文选择准确率(Accuracy)和召回率(Recall)两个指标评价算法性能。准确率表示模型检测正确的彩钢瓦数量,占所有检测到的彩钢瓦数量的比例;召回率表示模型检测正确的彩钢瓦数量,占图像中实际存在的所有彩钢瓦数量的比例。
实验采用深度学习框架PyTorch1.12,CUDA 版本选择11.3,在Ubuntu18.04操作系统上,利用NVIDIA GeForceRTX 3070显卡训练YOLOv8模型,训练过程如图7所示。
实验结果表明,模型检测准确率为84.44%,召回率为78.95%,实际识别效果如图8所示。当前模型能够初步满足铁路两侧彩钢瓦隐患目标检测的要求,但仍存在优化潜力,为了进一步提升识别的精准度,减少误检率,未来考虑引入注意力机制等技术,提升模型检测能力。
4 结论与展望
本文针对铁路遥感影像自动化处理需求,利用Python语言和GDAL等开源图形库,开发了一套完整的遥感影像自动化处理流程,实现了从数据预处理、铁路沿线信息提取到目标检测数据集构建的全过程。这一流程提升了遥感数据处理的效率和准确性,减少人工操作带来的误差,并有优良的可移植性和可拓展性。最终产出的数据集,在彩钢瓦隐患目标识别模型上取得较好的效果,未来考虑将该技术应用到更多类别的隐患检测中,持续提升铁路外部环境隐患监测的智能化水平。
此外,目前的预处理流程中,配准阶段仍需人工介入,未实现全自动处理。下一步需要对自动化配准方式进行研究,进一步提升遥感影像处理速度。
参考文献:
[1] 任晓春,李伟,王玮.高分光学遥感影像在铁路勘察中的应用及展望[J].测绘通报,2019(5):44-47.
[2] 袁慕策.基于遥感技术的铁路外部环境安全隐患监测[J].铁道建筑,2023,63(4):114-118.
[3] 王威,杨芳,张鹏,等.基于ENVI/IDL的高分遥感数据自动预处理及植被提取方法:以湖南林业为例[J].湖南城市学院学报(自然科学版),2020,29(2):45-50.
[4] 袁一钦,李浪,姚西文,等.光学遥感图像目标检测数据集综述[J].遥感学报,2023,27(12):2671-2687.
[5] 潘腾.高分二号卫星的技术特点[J].中国航天,2015(1):3-9.
[6] 商子健,金建文,许振峰,等.高分一号多光谱影像6S大气校正研究[J].无线电工程,2021,51(8):705-710.
[7] 郑尧,靳竺霖.基于6S-GDAL大气校正软件的实现与应用[J].城市勘测,2018(6):49-53.
[8] 廖聪,郭凰,赵茂军,等.基于图像增强和SKNet的交通标志识别[J].计算机与现代化,2023(3):23-28.
【通联编辑:谢媛媛】
基金项目:中国铁路郑州局集团有限公司科技研究开发计划一般课题(项目编号:2024S08)