基于跨视角匹配的图像地理位置定位研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:ymhd_hhxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于跨视角匹配的图像地理位置定位任务是将待查询的地面视角图像与参考数据集里带有GPS标记的航拍(卫星)图像进行比对,从而确定待查询的地面视角图像的地理位置(GPS坐标)。然而,由于地面和卫星图像视角的剧烈变化,导致地面和卫星图像间的视觉内容差异巨大,这也使得跨视角图像匹配具有较大的挑战性。本文通过对当前研究的跨视角图像匹配问题的几个研究热点方向进行研究总结,从跨视角图像的表征、距离度量和视角转换等多个角度入手,主要研究工作如下:1)基于表征学习的跨视角图像地理位置定位算法本文提出了一种用于解决跨视角图像地理定位问题的端到端网络,即GeoNet。该网络通过融合多个卷积层和胶囊层来捕获特征表示及其关系,从而进一步对空间特征层次进行建模,增强表征能力。此外,本文还提出了一种简单有效的基于在线批量的难样本挖掘的加权软边界损失函数(weighted soft-margin triplet loss with batch hard-mining),它不仅避免了使用三元组损失函数(triple loss)和四元组损失函数(quadruple loss)时边界(margin)参数的选择,而且提高了图像检索的准确率。在两个公开的图像地理定位数据集CVUSA和Vo and Hay上进行的大量实验表明,本文提出的GeoNet在跨视角图像地理定位方面的性能显著优于当前最先进的方法。同时该网络在小样本学习、编码长度和存储空间效率等方面也优于其他方法。2)基于视角转换的跨视角图像地理位置定位算法另外,本文提出另一种多阶段学习算法去解决跨视角(即地面和航拍图)图像地理定位问题。即先将地面视角的查询图像转换为航拍视角图像,然后在航拍视角下进行相似度学习。本文首先使用并改进了Pix2Pix-Gan网络,实现了航拍(卫星)图像到地面图像之间的转换,通过生成对抗网络(GAN)将地面视角的查询图像转换到航拍视角,使得查询图像和参考数据集图像同属一个视角。将跨视角问题转换为同一视角问题,从而减少了跨视角匹配的复杂度。然后,本文设计了Siamese架构双分支网络,并采用了加权软边界三元组损失函数进行相似度度量,使相同地理位置的图像对距离相互靠近,不同地理位置的图像对相互远离。在上述两个公开数据集上的实验证明了本文方法的有效性和先进性。
其他文献
现如今,随着我国北方大部分地区都产生了一定程度的雾霾天气,环境污染问题的治理迫在眉睫。火电厂氮氧化物的排放是造成这种污染的重要来源之一,当前氮氧化物脱除技术中选择
井壁失稳问题是钻井施工过程中一个极其复杂的问题。它会给钻井工程造成巨大的困难,不但延长了钻井周期,同时还会大大提高钻井成本。为了解决井壁失稳问题,为此需要科学钻井,
视频不仅是人类生活的重要组成部分,而且在各个领域的应用都占有关键性地位。面对视频压缩效率的亟需,下一代视频编码标准VVC、AVS3已经诞生并取得了良好的压缩效益。另一方
近年来,深度学习技术在多个领域取得十分优异的成就,如计算机视觉、自然语言处理和语音处理等,越来越多的相关应用出现,这给人们的生活带来了很多便利。然而,深度学习在表现
青光眼是由多种因素引起的以进行性视功能损害为主要特征的眼部疾病,目前临床上主要采取局部滴眼液治疗青光眼,患者对这种给药方式接受度高。但是滴眼液每天使用的次数较多,
近年来,随着技术的飞速发展,出现了许多新技术和新方法,血氧水平依赖功能磁共振成像(blood oxygen level dependent-functional magnetic resonance imaging,BOLD-fMRI)是一
随着移动通信和宽带无线接入技术的快速发展以及用户本身日益增长的业务需求,未来通信网络异构融合已成为必然的发展趋势。网络选择作为异构无线网络资源管理的重要方面,旨在
啤酒泡沫蛋白主要来自于麦芽,其数量与各分子量区间蛋白组分的比例影响啤酒泡沫的质量。本论文研究了麦芽库值、蛋白质含量、蛋白酶等与麦汁高分子蛋白质含量的关系,建立了麦
随着全球制造业的快速发展,各行各业对产品的多样化、个性化的要求越来越高,柔性化生产模式在制造领域被广泛采用,并逐渐成为未来的发展趋势。自动导引运输车(automated guid
以往的情感分类大多是基于粗粒度进行的,针对五分类进行的研究不多,且最终的情感分类结果只包含一种情感,很少对多情感共存现象进行研究,因此不能完全体现用户情感的丰富性。