论文部分内容阅读
二维图像的分类作为计算机视觉与图像处理领域的基础和核心,近年来随着深度学习的不断进步实现了长足的发展。我们生活在三维立体空间中,每时每刻都在感受和触碰着周围的立体物体。三维物体相对于二维图像增加了一个维度,带来的是更多的视觉信息、几何信息、位置信息。但是又正是多出的这一个维度,使得卷积神经网络应用在三维领域当中时网络的体积会成倍增长,无论是存储量还是计算量都不是现有的硬件设备可以承受的。而且在现实生活中,不像手机可以随时拍摄二维图片,获取三维数据的设备还没有得到普及,得到的三维数据存在着数量少、质量差的特点,显然对其直接使用卷积神经网络分类是无法实现的。本文以实现用深度学习的方法解决三维点云物体的识别问题为目的,提出了一种将孪生网络框架运用于解决点云识别的网络,它可以解决在研究过程出现的识别真实场景下获取的点云数据出现的过拟合问题,以及小规模数据集下堆叠式的卷积神经网络性能不佳的问题。本文主要工作如下:(1)对比了不同数据集下堆叠式的卷积神经网络与验证式的孪生网络在图像分类领域的效果,展示出孪生网络在样本总量少、样本类别多而每个类别中样本数量少、不同类别样本间的差异小等多种情况下的优越性。孪生网络是一种度量两个样本间相似性的网络框架,不同于堆叠式的卷积神经网络需要大规模的训练数据集和堆积出的网络深度,而在规模小、类间差异小的数据集样本情况下,依然可以在同类别样本之间做出更精准的匹配。(2)使用数据归一化和数据增强的方式来提升PointNet对真实场景下点云数据分类的准确率。PointNet将卷积神经网络直接作用在点云上实现三维物体的分类,解决了点云在数量上和点的顺序上不固定以及一些点的缺失和噪声问题。而对于真实场景下拍摄得到的点云样本,PointNet对其识别效果不佳。本文通过对比实验分析出了其中的原因,并经过对输入点云归一化和利用模拟的真实场景点云样本扩充数据集的方法对PointNet在真实场景下的分类性能进行了改进。(3)提出了基于孪生网络的3D点云分类识别算法。由于获取三维数据的硬件设备还不够成熟,在现实中能获取的点云样本数量很少,甚至无法满足正常卷积神经网络的训练。本文设计了一种将能够解决小规模样本训练的孪生网络与进行3D点云分类的PointNet结合的网络,即PointNet based on SiameseNet,实现优势互补,作为小规模点云样本识别问题的解决方案,进一步提高了真实场景下点云识别的准确率。