论文部分内容阅读
随着人工智能的蓬勃发展,计算机视觉作为目前人工智能中一个不可或缺的一部分受到越来越多研究者的密切关注,而三维重建又是计算机视觉中相当热门的研究点。三维重建主要研究的是根据相机得到的图像恢复出周围环境的三维信息。本课题针对目前基于单目相机进行稠密三维重建方法的不足,从基于直接法的稠密三维重建和基于特征点法的稠密三维重建两方面展开研究,具体完成的工作如下:1、铺垫了课题中需要的技术原理比如三维空间的刚体运动、欧式变换、对极约束、本质矩阵、单应矩阵以及基于特征法和直接法视觉里程计的算法基础。2、在基于直接法的稠密重建算法中,着重介绍了整个流程,包括了全局相机的光度标定,视觉里程计前端,数据桥接,稠密三维重建后端四个主要部分。针对视觉里程计提供的半稠密点云、相机位姿结合图优化分割算法实现对环境平面估计,使用稠密建图算法优化稠密点云的结果。本文提出了数据点云选择策略,相机坐标系统一策略以及数据交换容纳池从而更好的实现数据融合,提高重建效率,降低资源消耗。并对SLAM公共数据集进行多次实验测试,算法结果表明该三维重建算法高效鲁棒实用。3、在基于特征法的稠密重建算法中,首先介绍了结合深度学习的边缘检测流程,然后在基于特征点的SLAM系统获取的关键帧中融合边缘检测和基于图的分割结果,提出了一种新的融合算法,计算得到更为鲁棒、效果更为明显的轮廓图。通过此图,再结合稀疏点云可以实现稠密重建。对于重复点云的显示来说,我们采用了一个基于字典相似度计算的稠密点云融合算法,减小了点云存储空间,提高了重建显示效果。实验中,我们使用了公共的数据集,达到了比较不错的重建结果和效率。本文使用的数据集均为公共数据集,我们的算法均能够很好的完成视频帧的跟踪以及对周围环境的实时三维重建,实验结果表明了我们的算法具有相当的高效性和实用价值。