【摘 要】
:
与传统物体检索相比,实例级图像检索有一系列难点,如:相同类别之间差异大(例如,光照,旋转,遮挡,裁剪等),类别与类别之间差异不大(可口可乐瓶与雪碧瓶),图像含有大量的干扰信息(如背景图像)以及有大量的未经标注的干扰图像等。最近的进展表明,卷积神经网络(CNN)可以提供了一个比传统方法更加优秀的图像特征表示方法。但是,卷积神经网络从整个图像中提取的特征包含大量的干扰信息,会导致检索性能达不到预期效果
论文部分内容阅读
与传统物体检索相比,实例级图像检索有一系列难点,如:相同类别之间差异大(例如,光照,旋转,遮挡,裁剪等),类别与类别之间差异不大(可口可乐瓶与雪碧瓶),图像含有大量的干扰信息(如背景图像)以及有大量的未经标注的干扰图像等。最近的进展表明,卷积神经网络(CNN)可以提供了一个比传统方法更加优秀的图像特征表示方法。但是,卷积神经网络从整个图像中提取的特征包含大量的干扰信息,会导致检索性能达不到预期效果。为了解决这个问题,本文提出了两种解决方法。一是一种基于FasterRCNN检测的用于实例级图像检索的方法,它有两个阶段,即Faster R-CNN离线训练和在线实例检索。首先,训练FasterR-CNN模型以定位物体所在的区域。然后,提取物体所在区域的CNN特征并将这些特征融合成图像的整体特征,最后通过计算整体特征之间的欧式距离来得到检索结果。本文分别在INSTRE和Oxford数据集上进行了实验,实验结果验证了本文方法的有效性。二是一个新的实例级图像检索框架。该框架由两个阶段组成。首先,本文通过区域提议网络(RPN)去检测图像,将其检测结果输入双损失正则化三连体网络(DLRTN)。其次,通过计算排名子网络和分类子网络的损失函数,并利用计算结果来优化该网络。然后,本文引入区域广义均值池化(RGMP)层,对来自双损失正则化三连体网络输出的特征映射进行池化并产生区域广义卷积激活(R-GAC)作为全局图像表示。最后,通过在图像检索数据集的实验证明了本文所提出的图像检索框架的有效性。
其他文献
近年来,一些政府单位办事程序繁冗复杂,引发办事群众的不满与诟病,凸显了地方政府政务服务乱像。本届中央政府通过大规模调整和下放行政审批事项,深入推进行政审批改革,各地
冠状动脉分割在血管解剖结构分析、冠脉疾病临床诊断(例如冠脉狭窄、冠脉钙化等)、冠脉外科手术方案制定以及血流情况建模等研究中至关重要。目前冠状动脉分割方法主要包括主
随着互联网时代下网络信息的爆炸式增长,多标签文本分类已经成为处理文本信息数据的一种有效手段。信息数据可以通过多标签文本分类快速准确地定位到所属类别,多标签文本分类
目的:KLHL22分子对膀胱癌的生长、迁移及侵袭的研究。方法:通过阅读文献了解KLHL22分子在人多个疾病的发病机制中所起的作用。综合生物信息数据库查找KLHL22在膀胱癌及正常膀胱组织中的m RNA表达量差异,再通过实时定量PCR和Western blot等实验手段验证其在膀胱癌细胞系与正常尿路粘膜上皮以及临床膀胱癌组织和相应的癌旁组织中m RNA和蛋白质的表达量的差异性。最后检测KLHL22分
精密球铰链具有三个方向的回转自由度,转动灵活、结构简单,是具备大承载能力的低副运动机构,广泛应用于机器人、并联机构、医疗器械等工业领域。为了提升装备运动精度,解决球
随着城市化进程的加快,建筑能耗呈急剧上升的趋势,建筑节能研究已成为我国节能减排工作的重点。近年来大数据相关技术和物联网技术的发展,为建筑节能提供了数据支撑。利用这
随着近年来大数据存储领域的快速发展,MongoDB已经成为了当前存储大数据时的选择之一。在MongoDB的分片式集群部署中,数据以分片的形式均匀的存储到所有的shard服务器中。在实际的应用中,MongoDB通过动态数据均衡的策略来保证所有shard服务器上分片数量的均衡,以此来保证系统运行时的性能。然而MongoDB的动态数据均衡策略并不能解决由热点数据引起的服务器超载问题,因此也就不能保证系统
由于深度网络的强大表示能力,深度哈希已被证明对于大规模图像检索是有效的,可是依然存在问题限制检索性能的提升。一方面,现有的深度哈希方法仅利用单个深度哈希表,为了实现
图像超分辨率重建技术是计算机视觉中的经典研究内容之一,旨在利用低分辨率图像恢复出高分辨率图像。图像超分辨率的目标是产生高重建精度和高视觉质量的图像输出。实践中,在
后工业文明时代中,社会经济的发展、生活水平的提高以及人们自主意识的觉醒,使得人们对行政与责任的关注程度普遍提高。人类渴望文明高效的行政,向往独立自由的社会定位,期盼