论文部分内容阅读
在机器人学的领域中,视觉同步定位与地图构建技术(VSLAM)应用于室内外机器人定位、机器人导航与避障、机器人人机交互等领域。特征点法VSLAM由于其定位精度好的特点得到广泛应用,但是由于摄像头拍摄光照变化、视角变化、噪声干扰等因素,导致所提取的特征点位置漂移和匹配错误,使得VSLAM在摄像头拍摄条件复杂的室内环境和室外环境下定位精度降低甚至跟踪丢失。为了解决VSLAM鲁棒性不足这一问题,本课题从特征检测角度入手,使用自监督学习方法,设计并训练特征检测网络对特征点进行定位及描述,以此搭建自监督特征VSLAM,提高VSLAM系统在复杂环境下的鲁棒性和定位准确性。本课题主要工作如下:首先,本课题以特征检测算法为切入点对VSLAM系统的鲁棒性提升方法进行研究。基于VSLAM相关理论及问题,本课题通过对VSLAM不同部分的分析和对国内外研究现状的了解,发现特征检测算法对于特征点法VSLAM系统有重要意义。因此,本课题提出使用具有高鲁棒性的深度卷积神经网络作为特征检测算法,从而有效提升VSLAM系统在复杂视觉环境下的性能。其次,本课题设计自监督学习策略训练特征检测网络对图像特征点进行提取。该特征检测网络基于深度卷积神经网络构建而成,由共享特征提取层、关键点网络层和描述子网络层组成,同步提取输入图像的关键点和32维Float型描述子。为避免监督学习数据标定的繁复,本课题设计并实现了一种针对特征检测网络的自监督学习方法,运用人工合成数据集、2D图像变换数据增强、同步训练与数据挖掘等方法,实现特征检测网络的迭代训练,从而提取重复性高、鲁棒性好的图像特征。最后,本课题搭建具有高鲁棒性和高定位精度的自监督特征VSLAM系统。该系统以自监督特征检测网络作为前端视觉里程计的特征检测算法,并基于帧间匹配和运动BA优化实现运动估计。所述VSLAM以BA算法实现后端非线性优化,并使用特征检测网络训练词袋模型实现闭环检测和重定位。为防止特征检测网络所输出的特征描述子内存占用过大,本课题使用量化方法在保持其精度的前提下大大降低其存储空间,从而实现VSLAM特征路标点的高匹配性和轻量性。为了验证所述自监督特征VSLAM的鲁棒性,本课题进行了自监督学习特征检测网络重复性和投影估计实验、VSLAM数据集实验和VSLAM现实场景实验。实验中特征检测网络能够检测具有高重复性的关键点,并在描述子内存用量较小的前提下展现了优秀的匹配性能。自监督特征VSLAM则在数据集实验和现实场景实验中展现了其高鲁棒性高精度的特点,证明了使用自监督学习特征有效提升了特征点法VSLAM在光照变化、视角变化、噪声干扰等因素下的鲁棒性和定位准确性,使得VSLAM在运行过程中能够更为稳定地实现摄像头或移动机器人的跟踪和定位。