论文部分内容阅读
实时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是一个在实时构建的地图上定位传感器的问题。SLAM技术能够使得机器人不依赖于外部基础设施,在未知环境中构建、更新地图的同时,利用构建的地图来进行相机的定位。SLAM技术是实现机器人自主定位和导航,以及智能化应用的前提条件,在移动机器人、无人驾驶、虚拟现实/增强现实等相关领域中起着至关重要的作用。视觉实时定位与地图构建(visual SLAM,vSLAM)主要利用视觉相机作为主要的传感器进行机器人位姿的估计以及地图的构建,相对于激光等传统传感器,相机具有成本低、体积小、信息丰富等优点。通常的vSLAM框架主要包括视觉里程计前端和数据优化后端两个部分。视觉里程计的主要任务是建立帧与帧(或者帧与地图)间的数据关联,包括特征提取、特征匹配以及初始位姿的估计。而后端主要包括地图点、相机位姿的全局优化以及当前帧场景的回环检测。后端优化的目的是为了一定程度上降低累积误差对位姿估计带来的影响。目前,有很多vSLAM系统主要通过高鲁棒性的视觉特征,例如SIFT、SURF等进行特征的提取和匹配,从而提高算法的定位性能,但是这些高鲁棒性的视觉特征在提取和匹配过程特别耗时。而本文则是通过使用简单的二值描述符ORB(Oriented FAST and Rotated BRIEF)进行特征点的检测和筛选,使其均匀地分布在图片上,通过严格的双向验证提高特征匹配的准确性,从而提高算法的定位性能。本文提出了一种基于均匀化的特征选择与严格特征匹配的SLAM框架。首先,读取相机上获取的图像,并根据图像的纹理分布,动态调整特征点的阈值,检测特征点。然后,根据特征点的分布进行特征点的选择,使其均匀地分布在整个图像上。接着,进行特征点的匹配,根据恒速运动模型的假设,对特征点的匹配关系进行严格的双向验证。最后,利用特征匹配阶段得到的匹配关系,计算相机的初始位姿。实验数据显示,我们的方法在KITTI数据集上的所有序列上都能够实现稳定的位姿估计,并且在普通笔记本电脑下(不借助任何硬件加速)达到15Hz的实时处理效率。