论文部分内容阅读
激光点云的语义分割是实现三维场景理解的基础,特别是在大范围室外环境中,实现大规模点云的实时语义分割对于自动驾驶、智慧交通、虚拟现实等领域的应用具有重要的理论价值和现实意义。基于人工特征的点云语义分割方法依赖人工特征的设计与选取,其分割结果受研究人员的经验影响较大。目前基于深度学习的方法在语义分割结果的准确度方面有了很大的提升,但三维深度学习模型的计算效率通常较低,大量研究只能应用于离线的点云分析。本文围绕大范围室外场景的实时点云语义分割开展了相关研究,考虑到点云的数据表述方法会直接影响后续语义分割的计算效率和分割结果的准确性,本文首先对点云的数据表述方法进行了对比研究,然后研究了实时点云语义分割模型的设计、实现以及应用等,具体包括以下几方面内容:1.针对稀疏激光点云的实时语义分割问题,提出了一种基于八叉树森林的三维稀疏卷积神经网络。采用八叉树森林表述方法,通过减小八叉树的深度,提高数据访问的效率;设计了最小非平凡-不重叠卷积核,使得三维卷积能够直接在八叉树结构上进行稀疏计算,并进行了模型结构设计,给出了所提模型在CPU环境下的基于八叉树搜索的实现算法。实验结果表明,虽然所提方法的语义分割结果精度略低于基于密集栅格的深度学习方法,但其计算效率相比提高了一个数量级,即使在无GPU加速的情况下,也能满足实时应用的要求。2.针对高分辨率激光点云的实时语义分割问题,提出了一种基于稀疏张量的端到端深度学习模型。采用稀疏张量作为点云的数据表述方式,通过仅存储栅格的坐标和属性信息,进一步降低了数据存储与处理过程中的内存消耗;给出了基于稀疏张量的深度学习常见层结构的实现算法,设计了一种稀疏-跨步运算以提高三维卷积运算的计算效率,并对端到端语义分割模型的结构进行设计,给出了所提模型的一种并行实现方法。实验结果表明,对于高分辨的激光点云数据,所提方法的计算效率基本能够满足实时应用的需要。凭借对高分辨数据的处理能力,所提方法降低了栅格化造成的数据平滑影响,其语义分割结果精度优于基于密集栅格的深度学习方法。3.将实时点云语义分割与SLAM相结合,提出了一个语义增强型激光里程计与地图构建系统。利用实时获取的点云语义信息以及几何特征进行点云配准,再根据估计出的位姿将点云及其语义信息不断更新到全局地图中,实现了在线语义地图构建。实验结果表明,引入本文所提实时点云语义分割方法能够提高位姿估计的精度,同时也能在一定程度上提高系统整体的计算效率。针对实际应用中,人工标注数据成本高、难度大的问题,提出并开源了一种从仿真环境中自动采集大量带标注点云数据的方法,实验结果表明该方法能够大大降低模型训练对人工标注数据的依赖。