基于深度学习的相机位姿估计方法研究

来源 :山西大学 | 被引量 : 2次 | 上传用户：carboy123

【摘要】

：

近几年,随着人工智能在我国的迅速发展,智慧城市背景下的无人驾驶与机器人研究成为新的研究热点,视觉SLAM(Simultaneous Localization and Mapping,SLAM)正是该领域十分重要

【作者】

：

王江

【出处】

：

山西大学

【发表日期】

：

2020年01期

【关键词】

：

视觉SLAM 相机位姿估计深度学习运动变换图像匹配

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年,随着人工智能在我国的迅速发展,智慧城市背景下的无人驾驶与机器人研究成为新的研究热点,视觉SLAM(Simultaneous Localization and Mapping,SLAM)正是该领域十分重要的研究内容。其中,相机位姿估计问题是视觉SLAM问题的核心。相机位姿估计是指在多张场景或者目标图像中,估计图像间相机运动的变化情况。在这个过程中,图像间的旋转、光度变化、运动幅度的变化以及纹理稀疏等问题,会大大影响相机位姿估计的准确性,进而影响无人驾驶技术与机器人在环境中的定位、建图与识别等一系列任务。本文将影响相机位姿估计问题的原因分为内外两个因素,内在因素是相机本身运动对估计的影响,外在因素是外界环境对特征处理的影响。具体来说,全文在大尺度运动变换与多类室内环境中结合深度学习方法研究了相机的位姿估计任务,帮助视觉SLAM稳定可靠完成定位建图。本文的工作内容如下:(一)针对相机在空间中大尺度的运动估计问题,本文提出了基于稠密特征的运动变换预测方法。该方法将原图像与目标图像看作一个整体,从全局计算图像对的特征相似性,用以预测图像对之间的运动变换。整体方法首先采用特征金字塔的方式提取图像对不同尺度的特征图,然后通过互相关层将图像对之间的特征信息融合,并在融合向量中突出相似性高的特征融合值,接着使用运动变换编码器在每层特征提取层中结合融合信息向量预测运动变换,将这种运动变换参数化。最后不断迭代运动变换的编码器,预测两图之间发生的运动变换。该方法在实验中有效预测了同一场景多视角下发生的运动变换,预测的精度与图像对中关键信息的提取均表现优异。此外,为了直观显示图像对之间的运动,本文也对方法做了补充设计,定性地表示图像对之间的运动变换。(二)为了在多种具有挑战性的场景中保持相机位姿估计准确,并且提升视觉SLAM系统跟踪性能的稳定性,本文将图像中的关键信息做关联性匹配,提出了一种连续特征的追踪方法。首先,通过运动估计网络生成粗粒度的图像对特征。然后,将相机运动的运动变换作为优化信息来帮助判别匹配信息与非匹配信息。最终,使用匹配判别分类策略得到匹配对之间的关系矩阵。整体方法在应用场景中的有效性通过将其应用到SLAM传统方法中来验证,本文为该方法设计了完整的视觉SLAM后端优化模块,以使方法成为完整的视觉SLAM系统。实验结果也证实基于匹配关系的训练有效提升了视觉SLAM系统在多种场景中跟踪的适应能力,特别是在特征稀疏与弱纹理场景中的表现。综上所述,本文从影响相机位姿估计问题的内外两个角度出发,为视觉SLAM领域设计了新的图像特征匹配算法,将图像对之间的特征与运动变换有效联系在一起,在多种具有挑战性的场景中取得了很好的表现。本文的研究为视觉SLAM领域提供了新的思路,在无人驾驶等领域具有积极的应用与研究价值。

其他文献

磷烯器件中光电流的应变调控和边界磁性

磷烯是一种新兴的二维材料,是磷原子通过共价键形成的褶皱蜂窝状结构。磷烯具有可调的直接带隙和高度各向异性的能带结构,在光学和光电子学领域具有潜在的应用价值。本文基于

学位

磷烯边界磁性光电流应变

径向基网络在300MW机组协调控制系统中的研究

在大型火电厂中,单元机组协调控制系统在实现电网调度自动化、提高火电厂经济效益方面起着重要的作用。虽然近些年新能源发电已经广泛普及,但目前70%以上仍然为火力发电,因此

学位

RBF神经网络解耦控制协调控制系统动态特性单元机组

渗流铸造法制备Zr基非晶复合材料及其性能研究

Zr41.25Ti13.75Ni10Cu12.5Be22.5（Vit 1）非晶合金因具有很高的玻璃形成能力及优异的力学性能而受到研究者的不断探索,并被广泛的应用到工程材料和结构材料。作为合金玻璃的一种

学位

非晶复合材料增强相剪切带压缩塑性数值模拟

稀土掺杂氟氧铝硅酸盐玻璃的发光特性及能量传递的研究

作为第四代固态照明光源,白光LED因具有发光效率高,节能环保,热稳定性好,寿命长等诸多优良特性而备受关注。目前实现白光LED的主流方案是蓝色芯片耦合黄色荧光粉。相比于荧光

学位

荧光玻璃白光发射稀土离子能量传递铝粉

中国各省份营商环境的评估与比较:1998—2014

从定量的角度评估中国各省份的营商环境,有利于降低市场运行成本,促进中国经济的高质量发展。世界银行等相关研究多基于可观测变量来构造指标体系,这可能会出现选择性偏差和

会议

营商环境交易成本贸易成本面板数据

特高含水后期杏树岗薄差油层微观孔隙结构研究

本文选取杏树岗油田特高含水后期天然岩心168块,通过常规压汞实验、扫描电镜实验、铸体薄片实验和X衍射实验,给出了高渗透层与薄差油层的孔隙结构差异,并对薄差油层划分三个

学位

特高含水后期薄差油层粘土矿物孔喉比

近32年黄河源区土地利用和植被指数时空动态变化及其驱动因子分析

在全球变暖的背景下,青藏高原作为全球气候变化最为敏感和脆弱的地区之一,其植被-土地利用-气候之间的关系备受学术界和社会的关注。黄河源区处于青藏高原东北边缘,海拔较高

学位

黄河源区气候变化土地利用植被指数相关关系时空变化特征

基于半监督学习的单体型组装算法

单体型组装(Haplotype Assembly)是根据测序得到的DNA片段通过各种模型算法来重建出生物个体的单体型。随着人类基因组计划(Human Genome Project,HGP)的逐渐完成,人们已经认

学位

单核苷酸多态性单体型组装半监督学习策略K最近邻算法K均值算法

CME引起的地磁暴穿越时间研究

日冕物质抛射(CME)是引起磁暴的主要原因之一。CME经过行星际空间传播到地球,使得地球磁场在短时间内发生剧烈扰动,对人类的航天航空以及卫星导航、远距离输电输油网、地质勘

学位

日冕物质抛射(CMEs)地磁暴穿越时间曲线拟合支持向量机

Gumbel分布中参数的广义置信区间

Gumbel分布是极值分布的主要类型之一,极值分析的主要目的之一是估计分位数xp.在水文统计中,称xp为重现期是T=1/1-p的重现水平;在风险管理中,xp为VaR,表示在未来某一特定的一

学位

Gumbel分布位置-尺度族分位数最小风险同变估计极大似然估计广义枢轴量广义置信区间

基于深度学习的相机位姿估计方法研究

与本文相关的学术论文