双目视觉下的SLAM三维场景建图及物体识别研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tywuyaohuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视觉SLAM领域,三维重建一直是一个颇有前景的研究方向。其目的是旨在建立空间场景以及基础设施的三维模型。鉴于三维模型是VR/AR应用的重要基础之一,因而如何尽可能提高三维建模的精度和拓展建模的应用场景是研究者们迫切面临的问题之一。此外,当今3D视觉感知技术正在经历一场巨大的变革,并已经催生了许多创新的应用,诸如自动驾驶技术、自动场景建图和使用消费级传感器的高质量物体扫描等。其中物体扫描的核心技术也就是三维重建,这些消费级传感器一般包括Microsoft Kinect,Leap Motion,ZED Stereo Camera,Asus Xtion,Intel Real Sense等。无可否认,机器视觉技术包括SLAM的终极目标是让机器人看到并理解真实世界,这可以让机器人做出自主决策和行动规划。而本文的主要工作是实现了这一目标的一个子集。使用ZED立体相机捕获双目图像作为重建系统的输入,然后利用不同的立体匹配算法来生成视差图,并比较它们的优劣,从而创建单视图下的3D点云。在这里,为了增强全局一致性并减少重构点云模型的整体误差,通过训练一个数据驱动的局部几何特征来匹配具有噪声和低分辨率特征的点云数据。在实时重建算法的后端优化部分,整个系统使用了较为成熟的Elastic Fusion优化模块。最终在单视图点云的基础上获得了多视图全局一致的室内重建地图。由于机器视觉的终极目标是帮助机器人学习观察并理解真实世界,仅仅获得三维点云表达是远远不够的。因此,尝试将点云以语义形式进行表达是实现场景理解的关键。因为语义信息可以让机器人具备感知周遭环境,认知物体的能力。为了达到这个目的,本文实现了点云的语义分割。算法采用了斯坦福大学的室内大型语义分割数据库S3DIS Dataset对定制化的神经网络模型进行训练。该深度学习网络架构充分考虑了3D点云的特性:(1)无序性,输入数据之间顺序变化对结果没有影响;(2)相邻点之间具有结构关联信息;(3)网络应具备对各种几何变换(平移、拉伸、翻转等)的不变性。通过深度网络构造一个通用对称函数,网络学习模型最终从双目立体相机重建的原始点云模型中实现了室内三维场景的语义分割,以此建立了一个较为完整的室内环境语义地图。
其他文献
纤维长度分布是影响纺纱过程和纱线性质的重要因素之一。通过对纤维长度分布影响的研究对于从理论上认识这种影响的作用机理,对于改进纺纱工艺、提高纱线质量具有重要的指导
<正> 第八讲设备经济管理的指标体系设备经济管理的指标体系指的是评价设备经济管理效果的一整套指标,它是设备管理整个指标体系的一个重要组成部分。设备经济管理的指标体系
驻马店市自2014年10月被确定为河南省“公交优先”示范城市创建市以来,市委、市政府高度重视创建工作,认真落实优先发展城市公共交通的决策部署,大力推进“公交优先”示范工
智能家庭(Smart Home)的概念要求下一代家用器具具备高度的通信能力,成为信息家电(IA).如何提供连接这些信息家电的网络基础设施是一个关键问题.对几种备选家庭联网技术的性
党支部是把党的路线方针政策落实到基层的战斗堡垒,是党团结和联系广大职工群众的桥梁纽带,是推动企业各项工作稳步向前的重要支撑。郑州公交一公司党委以建设过硬党支部为主
化工企业网络舆情危机事件对化工企业形象和公信力影响很大,想要减轻化工企业网络舆情危机事件对化工企业的负面影响,就需要化工企业做出对危机事件的回应,所以本文构建回应
我们厂在对齿轮零件进行滚削时,一般分粗滚和精滚两步进行,且在一次装夹中粗滚后紧接着精滚。由于机床性能的限制,当粗滚完毕后,机床停机,操作者必须将刀架下降,手动工作台到
在纤维素水解液发酵生产乙醇的过程中,发酵液中存在多种可挥发性底物和产物(比如糠醛、乙酸),它们会对酿酒酵母产生毒害作用,从而抑制发酵过程。反复间歇真空发酵法能够有效
自组装(self-assembly)是一种普遍存在于生命体系中的现象。相较于DNA和多肽类物质,蛋白质大分子因其空间的结构复杂性,以及受非共价键大量性和无序性分布的影响,自组装研究
<正>心理健康直接关系国民素质的健全和提高,更多地通过疏导、交流的方式进行排解。学生是处于人格养成期的特殊群体,除了科学文化知识的学习以外,心理健康教育显得尤为重要