论文部分内容阅读
基于视觉的导航与三维重建是计算机视觉研究领域的重点.立体视觉的原理是利用双目或者多目摄像机的视差信息以及相机外参数从二维图像中恢复场景的三维坐标.基于立体视觉导航与三维重建技术的精度较高,对技术设备要求也较高,另外还有些不足之处,例如成本高,灵活性不足,计算量大,高精度图像配准,而且如果当某一采集设备出现故障时会导致整个系统无法工作等等的缺陷.本文研究的是基于特征点匹配的单目视觉序列图像第三维重建的障碍物检测,算法的原理是根据单目摄像机的运动造成的图像视差,恢复其运动信息,进而从二维图像恢复场景中特征点的深度信息和相对深度,将特征点的三维信息进行聚类,分割出立体障碍物,达到障碍物检测的目的,具有运算量较小,成本较低,较灵活等的特点.基于已标定的图像序列三维重建研究涉及的关键技术有:特征检测及匹配、基础短阵估计、摄像机自运动参数估计,三维坐标重建等.在三维重建中,特征点匹配和基础矩阵和是两个核心概念,摄像机自运动参数参数估计和三维重建的实现是主要研内容,本文要从以下几个方面研究了基于单目视觉三维重建的障碍物检测:(1)介绍了对极几何,基础矩阵的原理及其在视觉导航及三维重建的重要性.(2)研究了特征点检测及匹配算法,重点讨论了基于梯度的Lucas-Kanade特征点跟踪算法,并提出了在此基础上的改进算法,针对道路图像结果有较好的改善.(3)研究了求解基础矩阵的经典解法以及鲁棒性解法,如随机采样一性算法等,并给出了针对道路图像的RANSAC方法的改进,使得求解基础矩阵的精确性有所提高.(4)恢复J’单目视觉序列图像摄像机的实际运动参数,包括摄像机的旋转矩阵R和平移向量T,并在此基础上基于两幅图像特征点的三维坐标还原.(5)研究了点集的聚类算法,提出了网格聚类和层次聚类融合方法聚类三维空间点,给出了一定的障碍物判定准则,最终检测到障碍物.论文最后给出了基于图像序列的三维重建障碍物检测实验分析,指出了单目三维重建检测障碍物设计中应注意的问题,展示了部分真实场景的三维重建障碍物检测的结果.