论文部分内容阅读
从运动中恢复结构(Structure from Motion)和vSLAM算法可以恢复出大场景稀疏点云的三维结构,同时能够准确估计出相机位置和姿态。这些方法通过跟踪一系列的相关图像的特征点,结合多视图几何的约束条件,最后利用非线性最优化算法,优化场景三维结构和相机位姿,这个非线性最优化问题通常是通过捆集调整(Bundle Adjustment)解决的。然而,稀疏点云模型并不能提供足够多的细节来呈现场景的基础结构。近年来,人们在自动获取场景稠密点云三维结构方面做了很多努力。三维场景稠密点云的自动重建有利于场景结构的获取,而且在许多其他领域也有应用,比如增强现实,历史文物保护,自主驾驶技术和机器人学等领域。本文首先对基于图像的稀疏点云三维重建进行了深入的研究,设计了基于图像的稀疏点云重建算法,得到场景的稀疏点云模型。这方面工作主要有:第一,研究针孔摄像机模型和图像的投影关系。第二,研究图像的特征提取和匹配算法,利用ASIFT算法对图像特征点进行跟踪,提取密集、鲁棒的特征点。第三,对多视图几何理论进行了研究,阐述了对极几何、本质矩阵等相关概念。第四,对基于图像的稀疏点云重建算法进行了详细设计,研究了场景结构和相机位姿的优化算法。基于精确的场景稀疏点云,本文继续进行稠密点云重建工作。本文综合对比各种稠密重建算法的优劣,采用目前效果最好的PMVS算法。随后,为了使PMVS算法更好地适用于本文的环境,将原始的算法进行了改进。由于原始的PMVS算法计算量非常大,虽然本文做了一些改进,但是算法的执行效率仍然很低。为了达到快速重建场景稠密点云的目的,本文提出了基于视图聚类的稠密重建算法,将原始输入图像进行分组,并去除冗余的图像,然后利用改进的PMVS算法对每一个分类集群进行单独重建,并且为了最终得到较好的重建效果和提高算法效率,视图聚类算法要求每个分类集群同时满足重建覆盖率和集群大小约束的要求。在完成各个集群的重建后本文将重建的MVS点融合到一起,得到完整的场景模型。然而,直接融合是有问题的,本文随后介绍一些后处理步骤,剔除重建错误的点。最后,由于各个集群之间的独立性,本文可以把它们在多个核里面并发地执行,提高重建的效率。