基于深度学习的相机相对姿态估计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ivyJZ2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过视觉来获取相机姿态的问题通常被称为视觉里程计(Visual odometry,VO)。在最近二十多年时间里,VO已经广泛应用于各类机器人的导航定位中。传统解决VO的方法是基于几何运动约束来求解,涉及到特征提取、特征匹配、运动估计等繁琐过程,每次更换平台都需要重新进行相机标定、整合各个模块才能达到较好的结果。而且在雾天雨天或者场景中出现动态物体时会影响特征匹配过程,导致姿态估计效果受到极大影响。近几年深度学习发展迅速,出现了一些基于深度学习方法研究VO的工作,可以端到端进行相机姿态的估计,完全摒弃几何法的繁琐过程,直接基于给定的RGB图片得到相机姿态。本论文提出了基于卷积神经网络(Convolutional neural network,CNN)和循环卷积神经网络(Recurrent convolutional neural network,RCNN)的两种 VO 估计的方法,在 KITTI VO 标准数据集上训练测试,与传统几何法进行对比,取得了较好的实验结果。主要创新点如下:1.提出了数据集标签的生成方法,在KITTIVO标准数据集上进行姿态解算,实现了场景中单张图片的绝对姿态的求解,包括旋转矩阵、欧拉角、四元数这三种表示方法。并利用求解的绝对姿态实现两两相邻图片之间的相对姿态求解,包括正向图片对、隔帧图片对、逆向图片对的相对位姿。最后将求取的姿态用于后续深度学习的训练过程,为训练提供数据标签。2.提出了 CNN-VO方法,实现了相邻两帧图片之间的相对姿态估计。输入两张RGB图片,端到端输出图片之间的相对位姿,包括三维位移和三维欧拉角。完全摒弃传统方法中的特征提取、特征匹配、相机标定、图优化等步骤。同时通过逆序输入图片对来增大样本空间,提高网络的泛化能力,实现更高精度的姿态估计。3.提出了 CNN-LSTM-VO方法,实现了连续多帧图片之间的相对姿态估计。输入多帧RGB图片,输出两两相邻图片之间的相对姿态。该方法利用循环神经网络处理时序信号的优势,可以同时估计多帧图片的相对位姿,相比于纯粹的卷积神经网络,增加了多帧图片之间的约束关系,达到更好的效果。同时还在该方法基础上通过逆序输入图片序列实现更精确的姿态估计。
其他文献
由于在电子与磁记录器件,生物医学治疗,微波吸收等各种领域有着不可替代的作用,磁性团簇一直是团簇科学中重要的研究对象。磁性团簇点阵的磁性被团簇的结构,多相的组成和团簇间的各种磁耦合作用所影响,磁性团簇间的磁交换耦合可以导致各种各样的磁序现象,这些性质对下一代纳米磁性和自旋电子器件的研发至关重要。另外,库仑阻塞磁电阻效应的研究也有广阔的应用前景,例如其所导致的极高的磁电阻对于磁记录器件磁头的开发意义重
<正> WHO有关SARS监测定义为高热(>38℃);一种或以上呼吸道症状,包括咳嗽、呼吸短促和呼吸困难;症状出现前10d内,有到SARS流行地区的旅行史或/和有与SARS感染者密切接触史。S
是否有没有肺炎的SARS儿童患者?有无 儿童的隐性感染?为什么儿童SARS患者表现 较轻?这都是SARS留给医学专家的问题。文 详见第14、15版《论坛·医生论坛》。 Are there chil
期刊
目前技工院校计算机网络课程教学主要存在着教学方法简单,理论知识与实际操作、实用技术难以相互印证、相互补充的情况;理论知识在教学时脱离实际操作进行,概念化严重,容易导
目前,国家和地方政府主要通过试点推进战略性新兴产业集聚区,从而实现战略性新兴产业的集聚发展。战略性新兴产业集聚发展不仅要求突破性技术创新驱动,而且高度依赖体制创新
技工教育在现代职业教育竞争中的形势,随着科技信息的高速发展变得越来越严峻。本文就技工学校计算机网络专业毕业生的就业问题和计算机网络专业课程设置现状,简要分析技工学
《黄帝内经》天地人"同类相动"思想及典型案例,与哲学、物理学、文学和心理学的"天人合一"、"共振"、"共鸣"原理不谋而合,这为研究"共识效应"提供了全新的思路。由此出发,通过概述《黄
随着网络教育的蓬勃发展,网络课程的开设已成为一个全球化的大趋势。开发适用于网络教育的高质量的课程已成为网络教育中一个非常重要而迫切的研究课题。本文在对我禽网络课程
本文分析了技工院校计算机网络实训教学的现状以及存在的问题,引出了建设基于虚拟仿真技术的网络实训室的重要性,文章中先介绍了虚拟仿真技术,再讲述了其在计算机教学中的优
考核是教学过程中必不可少的重要环节,当前高校的"形势与政策"课一般采用开卷和写学年小论文的考核形式。要使这两种相对简单的形式真实客观地反映教学情况、起到考核应有的