三维点云分割方法综述

三维点云分割方法综述0

关键词：三维点云；点云分割；数据处理

中图分类号：TP3 文献标识码：A

文章编号：1009-3044（2023）08-0026-03

0 引言

3D点云的分割任务常用来理解三维环境，对于自动驾驶、机器人、虚拟现实等人工智能方向领域的应用有着重要的意义。而充分探索点云中点之间的相关性是对点云特征建模的基础。现如今，三维点云语义分割方法可被分为两类：传统点云分割方法和深度学习点云分割方法。传统方法主要通过探索点的坐标、颜色等信息来进行类别判断[1]。但传统方法过于依赖人工来设计特征，计算成本较大，且传统卷积方式无法直接对3D点云数据进行处理，在深度学习技术引入之后便逐渐淡出学者的研究视线。深度学习点云分割方法是将三维点云数据转换成适合卷积神经网络处理的序列从而对每个点赋予对应的语义属性。随着2015年基于多视图的深度学习模型[2]和基于体素化的3D卷积神经网络[3]被提出，深度学习开始广泛应用于3D点云数据的处理中，并显示出了良好的分割效果，所以基于深度学习框架下的三维点云分割是未来点云分割领域发展的大方向。

1 传统点云分割算法

根据分割计算方式的差异，分割算法大致分为以下几类：基于边缘检测算法、基于区域增长分割算法、基于特征聚类分割算法。

1.1 基于边缘检测方法

基于边缘检测算法在三维图像的应用可以大致分为两种：（1）直接法[4]。该方法直接对三维点云中的物体进行辨别，对其边缘进行提取完成分割工作。（2）间接法[5]。该方法是将三维点云映射到二维图像进行分割后再将边缘点再映射至三维图像，完成分割工作。两种方法的代表作、优劣性以及适用场合如表1所示。

1.2 基于区域增长分割方法

基于区域增长分割方法是将点之间的差异通过相应的数学准则进行判别，从而归类相应属性的点。大致分为两种：（1）种子点区域增长法；（2）非种子点区域增长法。种子点区域增长与非种子点区域增长算法的算法描述、代表作、优劣性、适用场合如表2所示。

基于区域增长算法能对所有三维点云数据进行处理，从而保证有用数据不丢失。在分割精度上高于边缘检测算法，优势在于可以对场景内的小型目标物体进行较精确分割，劣势在于其算法过于依赖人工，对分割结果有严重影响。

1.3 基于特征聚类分割方法

基于特征聚类分割方法是通过点云中各点的特征向量计算出不同属性的特征值，利用特征值对点云数据进行聚类算法（如K均值算法、模糊算法、最大模糊算法等[8]），聚类后得到各点形成的点集，即为分割区域。其中以2002年Filin[9]提出一种基于七点参数空间和模式搜索算法来提取点云表面类型为开山之作。此外，Hao等人[10]使用一种新的聚类方法对城市点云数据进行分割，该方法不需要预先估计聚类数，有效减少了算法的复杂度。

基于特征聚类算法主要计算特征空间中距离，法线等特征向量所包含的信息的属性。该方法能有效避免点云密度、噪声点等所带来影响分割结果的因素，但在大型密集点云中，计算点的特征信息具有相当大的复杂度，所以时间成本会明显增大。

1.4 基于模型拟合分割方法

基于模型的点云分割方法是通过数学模型中已知的几何形状，将点云数据中的各点与其进行匹配，从而分割出点云的几何模型。其中Fischer[11]提出的随机样本一致性算法（RANSAC）成了后续大多基于模型拟合分割算法的基础，利用数学模型中已知的基础图形（如直线，圆形等）的数学特征属性对目标点进行分割。

基于模型算法利用已知的数学几何模型进行点云分割极大地提高了计算效率，同时降低了噪声点的不利影响。但该算法限制于场景中存在明确物理形状的条件中，所以普适性方面较差。

1.5 传统方法评价

传统方法应用于三维点云分割的主要优势在于保持分割效果优良的同时，在时间成本上具有一定优势。传统分割算法在三维点云处理任务中已经相对比较成熟，特别对小型稀疏场景下的小目标物体分割效果较优，能明显区分于其他目标物体。

2 深度学习点云分割算法

随着深度学习技术的快速发展，研究学者开始对点云数据处理方法深入开发，成功地将应用于2D图像分割任务中的卷积神经网络效仿应用至3D点云分割任务中进行处理。然而，与2D图像中像素的排列方式不同，由于3D点云自身无序性的限制，使得它难以直接应用深度卷积神经网络来获取点与点之间的局部上下文信息。具体来说，对一堆无序不规则的3D空间点进行分类分割等任务时，难以保证将其输入至卷积神经网络时输入点的顺序是有序一致的，在对网络多次输入点云数据训练时，容易对相同类别的点云进行误判。因此，一些专门针对于3D点云分割设计的深度学习框架被提出，其所对应的分割方法在定量和定性分析中显示出良好的效果。为了更好地描述近年来基于深度学习的3D点云分割任务，根据当前点云深度学习网络的输入形式不同，将其分为两大类：规则三维点云深度学习网络和无规则三维点云深度学习网络。

2.1 规则点云深度学习网络

为解决点的不规则问题，研究者提出将3D点云数据转换为体素网格或2D图像等其他的规则格式，之后在二维卷积神经网络中进行处理。大致可分为以下两类：基于3D体积网络、基于多视角网络。其中，基于3D体积网络方法是将3D点云数据表示为体积像素网格的形式后使用卷积神经网络进行特征的提取[3]。但依据体素网格形式将输入的点云分割为相同的网格大小无疑增加了不必要的计算成本，且当输入稀疏点云时该方法不占优势。基于多视角网络[2]方法的核心思想是利用物体在不同角度下的多张2D图片来表示三维物体表面特征，之后使用二维卷积算子来完成3D点云分割等任务。该方法采用最大池化将多角度图片下的图形特征进行提取容易造成信息重叠，普适性较差，且将3D点云从高维空间转换至低维空间，容易丢失点中的信息。基于3D体积网络是通过将三维点云体素化为体积网格，再利用3D卷积对体素点云进行处理[3]。该方法受限于存储空间和3D卷积计算成本的约束，使得分割后的三维体积空间分辨率较差。

2.2 无规则点云深度学习网络

无规则三维点云深度学习网络是直接将无序不规则的点云作为网络输入，对每个点学习空间特征，之后将空间特征聚拢形成全局特征。2017年Qi 等人[12]提出的PointNet 为直接处理3D 点云开了先河。虽然该方法相比多视图方法和体素化方法在尽可能不丢失几何信息的同时解决了点云的旋转和平移不变性问题，对于场景的分割性能也有很大的提升，但该方法仅具备对全局特征进行预测的能力，缺乏对局部特征的预测能力，且没有充分探索点与点之间的相互关系，使得网络无法很好地表征上下文。为了克服这些劣势，随后该团队提出PointNet++，以分层局部特征提取的思想将共享的MLP获取的局部特征通过跳跃连接和线性插值进行特征传播，从而解决了Point⁃Net对局部特征提取不利的问题[13]。为了学习丰富的局部信息，有许多基于PointNet++的深度神经网络迅速衍生出来。这些方法可以大致包括为基于点卷积[14-15]、基于图的方法[16-18]、基于注意力的方法[19-20]等，这些方法在点云识别和语义分割方面取得了惊人的结果。

3 结束语

目前，基于深度学习框架的点云分割方法在分割精度方面远超传统方法，成为未来点云分割领域发展的主流方向。但深度学习方法受限于计算机算力和时间成本，阻碍了在复杂大规模场景下进行点云分割以及实时分割。针对现今分割方法多是监督分割网络的大环境下，发展弱监督或者无监督性网络[21]来处理大场景的点云数据将会是未来的一大发展趋势。

三维点云分割方法综述

经典小说推荐

杂志订阅