基于深度学习的视觉地点识别技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：angelcaoxian

【摘要】

：

当前,视觉地点识别在多种新兴科技领域中拥有重要的应用前景和科研价值,并成为模式识别中的热点话题。对于视觉地点识别而言,提升性能的一个关键问题是设计分辨能力更强同时

【作者】

：

蔡溯东

【出处】

：

国防科技大学

【发表日期】

：

2004年期

【关键词】

：

视觉地点识别深度学习卷积神经网络跨视角图像地点识别视觉闭环检测关注力模块困难数据挖掘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前,视觉地点识别在多种新兴科技领域中拥有重要的应用前景和科研价值,并成为模式识别中的热点话题。对于视觉地点识别而言,提升性能的一个关键问题是设计分辨能力更强同时对各种视觉变换更鲁棒的图像特征表示方法,然而囿于地点的复杂性和多样性以及其面向的繁多的应用背景,现存的方法并不能完全满足当下的现实需求,还亟待进一步的研究和探索。本文基于深度学习方法对两种视觉地点识别中的难点问题展开了探讨和研究,主要完成的工作如下:在广泛阅读了国内外视觉地点识别及相关领域文献的基础上,对本文关注的两种视觉地点识别任务——视觉闭环检测、跨视角(Cross-View)图像地点识别系统中的现有方法进行了综述,并探讨和总结了现有方法取得的重要成果以及有待进一步探究的方向,为提出本文中的创新性方法奠定基础。针对视觉闭环检测任务,本文提出一种基于Squeeze-and-Excitation增强结构与并行多路径汇聚补偿策略的CNN模型(Hybrid-CNN)用于获取改进的CNN特征图;同时设计了一种基于沿通道降采样和非重叠池化的CNN特征图降维策略以加速特征相似度比对。利用经典的残差网络作为基模型,对“瓶颈”残差构建块应用上述两种增强策略进行针对性改造,得到Hybrid-CNN模型。对模型提取的CNN特征图应用所设计的方法进行降维,并利用降维后的特征进行闭环检测。通过在主流的公开数据集上进行测试,与现有的多种闭环检测方法进行比较验证了方法的准确率,并说明了降维后的特征能够在准确率无明显损失的情况下显著提升方法的效率。针对跨视角图像地点识别任务,本文提出一种基于Siam-FCAMNet特征提取模型与样本赋权Triplet损失的方法。首先考虑了关注机制对CNN特征的分辨力补偿作用,提出一种基于特征通道与空间信息上下文关注机制的轻量级关注模块(Mul-FCAM)对基模型ResNet进行改造,得到ResFCAMNet模型。利用两个参数不共享的ResFCAMNet分别作为地面视角图像、航拍图像的特征提取器,组成孪生结构的CNN模型,并融入一种可学习方向回归分支构建出Siam-FCAMNet模型,用以生成最终应用于该任务的增强后的CNN特征。同时,本文提出一种基于样本赋权实现在线困难数据挖掘的三元组(Triplet)损失函数,旨在“强调”有效困难样本对模型训练的积极作用,并抑制简单样本在参数更新时对有效困难数据的“稀释效应”,以进一步改善特征的分辨力。启发于FaceNet中的Semi-Hard策略,设计了一种添加距离修正因子的Logistic回归用以获得三元组样本的匹配概率,并根据匹配概率计算样本对应的自信息量作为权重。同时为了限制极端困难样本和简单样本对网络参数更新的影响,设计了一种上下限截止策略对权值进行调整,得到最终分配给各三元组样本的权值。通过在现有的主流数据集上进行测试并与当前取得先进水平的(State-of-The-Art)方法进行比较,结果显示本文方法实现了突出的性能,相较于现有方法有显著提升,达到当下先进水平。

其他文献

基于云端的PCB版图在Web上的加速显示研究

PCB仿真系统的开发是当前集成电路研究中的一项重要工作。云端EDA软件能够使用户不再受到必须本地安装部署软件的限制,随时随地进行PCB的设计与仿真优化。但是包含大量设计信

学位

PCB版图EDA软件瓦片技术加速显示

纳米银颗粒及表面包裹对纳米材料光电性能的影响

银材料具有良好的导热性和导电性,特别是纳米尺寸的银颗粒具有表面等离子激元共振效应,可以增强表面拉曼散射、表面荧光和催化活性等特点,在多个领域有广泛应用。因此,可以通

学位

纳米银颗粒PSAgNPsCNTsAgNPs场发射性能光催化性

牙龈软组织形变三维仿真研究

虚拟手术仿真系统是虚拟现实技术在医学方面的一个重要的应用,对于医生进行手术前的练习以及手术规划等具有重要意义。虚拟手术利用计算机构建虚拟手术场景,并利用人机交互实

学位

质点弹簧模型软组织变形超弹性牙齿矫正曲面细分

三维打印支架的定量可视化方法研究

三维打印技术实现了对组织工程支架的自主化设计和空间结构的精准可控。但由于打印材料的形变特性和打印过程的随机误差导致支架的内部微观结构与设计不一致,同时支架的空间

学位

光学相干层析成像大体积成像三维打印定量表征

基于模型控制和无模型控制的机械臂系统轨迹跟踪研究

随着中国智能制造的快速发展,机械臂的研发水平迅速成长,使得机械臂精确的跟踪控制问题逐渐成为研究热点。本文基于模型控制和无模型控制两种方案研究了多输入多输出的n自由

学位

机械臂轨迹跟踪事件触发输出受限无模型自适应迭代控制

致密油藏水驱前缘数值模拟研究

致密储层开发潜力巨大,但开采难度较高注水困难。为明确致密储层中水驱前缘特征及其影响因素,分别选取4块不同孔隙结构岩心来进行分析。本文应用Micro-CT扫描技术获取岩心CT

学位

数字岩心致密储层水驱前缘数值模拟

基于深度学习的视觉SLAM语义地图构建

近年来随着科学技术快速发展,智能机器人的研究受到人们越来越多的关注。在智能机器人研究中,SLAM(Simultaneous Localization and Mapping)是需要解决的基础性问题。现在大

学位

同步定位与建图语义地图目标检测点云切割

基于授权的可搜索加密方案研究

云存储服务的普及,使得数据属主(所有者)把数据存储到云服务器,从而节省了本地存储空间。数据属主若以明文的形式分享数据,则会泄露数据隐私;若以密文形式分享,则会带来如何

学位

可搜索加密抗关键词猜测授权身份验证指定验证者

最优化控制理论在金刚石氮空位体系中的研究

量子计算是量子信息处理领域的重要课题。作为实现量子计算的物理基础,量子计算机需要满足初始化、控制、相干时间、读出及可扩展性等方面的需求。金刚石中的氮空位(nitrogen

学位

量子计算量子控制非绝热和乐量子计算量子最优化控制平均哈密顿量理论

基于表面等离子体激元光波导滤波器的设计及特性研究

表面等离子体激元(Surface plasmon polaritons,SPPs)是一种电磁场局域于金属表面的电磁波形式,其沿着金属表面传播且在垂直于金属表面方向上呈指数衰减。SPPs能够打破传统光

学位

表面等离子体激元MIM光波导滤波器圆盘谐振腔PIT效应

基于深度学习的视觉地点识别技术研究

与本文相关的学术论文