论文部分内容阅读
同时定位与地图构建(Simultaneous Localization And Mapping,SLAM)是计算机视觉和机器人的交叉领域中的一个非常重要的部分,SLAM的目标是相机的定位以及场景地图的构建,这使得机器具有感知场景的能力,这种能力在机器人的导航、增强现实和虚拟现实、工业的自动化、人机交互等领域都发挥着重要的作用。现今已有许多的研究者提出了各种优秀的SLAM系统,通过对这些系统的研究分析我们发现几个普遍存在的现象:第一,现有的视觉SLAM系统不能够自主完成初始化,其初始化需要人为刻意平移相机才能成功,实际应用中,由于许多非SLAM研究人员的使用者不清楚这一要求,因而会出现系统不能成功初始化的问题;第二,现有的SLAM系统构建的场景模型为点云模型或者缺乏纹理的表面模型,点云模型或者缺乏纹理的表面模型所能表达的真实场景信息有限,它们都不能满足实际应用的需求,例如点云模型无法应用于机器人自主导航,以及缺乏纹理的表面模型不能满足3D游戏的需求;第三,现有SLAM系统构建的场景模型不包含场景的结构信息,如平面结构,室内场景中平面是普遍存在的一种结构,并且平面结构具有“支撑”意义在AR等应用中具有重要作用。针对上述几个问题,本文先采用一种抖动重建的方法用于替代传统视觉SLAM的初始化模块,这使得我们的SLAM系统能够自主完成初始化,不再需要人为刻意地平移相机;其次,本文基于SLAM类方法构建场景的点云模型,采用TSDF方法对场景的点云模型做融合优化,本文使用Marching Cubes算法提取场景的Mesh表面模型,与已有方法不同的是本文给出一种基于TSDF方法的纹理计算方法并用于计算Mesh模型的纹理贴图;第三,本文将对场景结构进行抽象,构建场景的抽象平面模型,为此,本文给出帧内平面检测的方法,并且提出不同帧之间平面匹配以及帧与模型之间平面匹配的策略,同时给出包括模型的增长和优化策略。以上是本文的主要工作内容,我们给出一种能够让SLAM系统自主初始化的方法,其次我们构建了具有丰富纹理信息且更符合实际应用需求的场景表面模型,以及构建具有场景结构信息的抽象平面模型。