基于深度学习的大青山地质灾害识别技术研究
作者: 王莉莉 黄铎 王伟 巧云 张晓东
摘要:地质灾害的发生不仅会给国家或个人带来不可估量的经济损失,也会影响一个地区的生态安全。如何准确有效地对地质灾害进行分类识别,显得尤为重要。该项目以内蒙古大青山地区突发性地质灾害为研究对象,重点研究崩塌、滑坡、泥石流、地面塌陷四种常见灾害的分类识别,利用卷积神经网络框架VGG-16构建模型进行训练、验证和测试,并对其进行优化。结果表明,该模型对大青山地质灾害的分类识别准确率为92%。从而探索出一种基于深度学习的大青山地质灾害识别方法,为祖国北疆地质灾害的自动化监测提供技术基础。
关键词:深度学习;卷积神经网络;地质灾害;识别
中图分类号:TP3 文献标识码:A文章编号:1009-3044(2023)28-0034-03
0 引言
地质灾害属于自然灾害,它的发生不仅会给一个国家或个人的经济带来不可估量的损失,也会极大地破坏人们的稳定生活。近年来,深度学习技术广泛应用于图像视觉领域,它可以自主学习图像特征,不用人工构建,无须进行复杂的图像特征提取,从而可以得到更高的分类准确率。
因此,本文选取深度学习中的CNN模型应用于地质灾害分类识别中,重点研究崩塌、滑坡、泥石流、地面塌陷四种大青山地区常见的地质灾害分类,利用深度学习框架VGG-16构建模型,提出一种基于CNN的地质灾害图像智能分类识别的方法,解决目前灾害分类的准确度和时效性不足的问题,从而提高大青山地区地质灾害监测技术的智能化。
1 数据与方法
1.1 研究对象
大青山坐落于阴山山脉中段,东起呼和浩特大黑河上游,西至包头昆都仑河。东西长约240公里,海拔2000米左右,是祖国北疆安全稳定屏障。一直以来,大青山山脉呼和浩特市和包头市境内矿山企业开发频繁,造成严重的生态环境问题。因此,保护大青山,研究大青山地区地质灾害识别方法,对降低大青山地质灾害的发生具有重要作用。
1.1.1 数据的搜集
本实验选取内蒙古大青山地区常见的四种地质灾害崩塌、滑坡、泥石流、地面塌陷构建数据集。数据来源包括人工采集、无人机采集、互联网Python爬取、雷达图像等。
1.1.2 数据处理的方法
为了能满足VGG-16模型对训练数据的要求,原始数据需要首先进行预处理,本项目利用Python中的Pandas、CV2和PIL库对自然灾害图像进行预处理,包括使用库中的方法对图像进行缩放、裁剪、旋转等处理,将图像转换为模型训练需要的格式[1],使数据标准统一化,进一步扩充数据集,为VGG-16模型的训练提供支持。
1.2 研究方法
1.2.1 深度学习
深度学习的本质就是一个深层神经网络。神经网络一般分为三层,分别是输入层、隐含层和输出层。神经网络进行学习的本质是根据输入的数据和结果之间的差异来动态地调整神经元间连接的权重值。当训练开始时,训练数据会依托正向传播算法、反向传播算法和梯度下降法,通过调整各层之间的激活值和神经元之间的连接权重值,实现对神经网络的训练。
对于本文研究的四类地质灾害图像,神经网络需要计算其属于某个类别的概率,再将神经网络给出的概率搜集起来,找出其中概率的最大值即作为网络分类识别的结果。
1.2.2 卷积神经网络
CNN主要用于图像分类识别与目标定位。CNN主要由卷积、激活函数、池化、分类器组成。其中卷积的功能就是特征提取,把图像中符合条件的特征筛选出来。激活函数的存在主要是提升网络表达能力。
池化又被称为下采样,其作用是将卷积层提取的特征图进行降维。在深度学习中,分类器用来判别一个新样本所属类别。
卷积神经网络具有三大核心思想:局部感知、权值共享以及下采样[2]。局部感知通过改变神经元的连接来实现。权值共享是用一个卷积核去扫描输入图片,卷积核里面的数称为权重,这张图每个位置是被同样的卷积核扫描的,所以权重是一样的,也就是共享[2]。下采样主要通过池化技术对图像进行缩小,减少图像像素,减少计算量[2],加快运算速度,从而减少卷积神经网络在训练阶段出现过拟合的可能性。
1.2.3 VGG-16网络模型
本研究使用的CNN 模型为VGG-16 和Tensor⁃Flow 2.0框架。VGG-16是一个卷积神经网络框架,如图1所示。TensorFlow 2.0则是由Google公司开发的一种通用的神经网络框架。