图像中目标检索方法研究与应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:aptxkid2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、多媒体技术和互联网技术的迅猛发展,生动形象、表现力强、信息量大的网络图像数据呈现出爆炸式的增长。为了便于用户从海量的网络图像资源中快速找到感兴趣的图像,图像检索技术应运而生。图像中目标检索技术通过用户框选感兴趣目标或者上传目标图片来直接获取用户需求,从大规模数据库中检索得到包含该目标的图片。由于图像中目标的多变性和复杂性,实现快速准确的目标检索是一个非常有挑战性的工作。因此,对图像中目标检索技术的研究具有重要的理论意义和实际应用价值。  图像中目标检索的特别之处在于用户感兴趣的目标只占图像尺寸的一部分,甚至是很小一部分。因此,如何去除背景噪声的干扰,以及在小物体情况下如何检测得到前景目标是目标检索领域的难点。与此同时,在能够获取前景目标的情况下,传统的手工设计的局部特征鉴别性不够,如何有效利用有监督信息学习得到表达能力更强的语义特征,也是一个重要问题。本文针对这些问题,深入研究了图像中目标表示学习的图像检索技术,提高了目标检索准确度。并将相关成果应用到图形商标的侵权检索中。本文的主要贡献和创新点如下:  1.提出了一种结合空间权重的Fisher向量图像表示方法  卷积神经网络(Convolutional Neural Network,CNN)在图像特征表示中强大的鉴别性,使得其在图像检索任务中至关重要。其中卷积层的特征表达能力优于全连接层特征,但是卷积层的特征依赖编码和聚合方法才能得到图片的整体表达。本文在前期实验中发现卷积神经网络的卷积层局部描述子在类似Fisher向量编码,局部聚合向量编码(VLAD)等基于码本的高维聚合方法中表现还不如简单的均值池化或者最大值池化等方法。针对这种问题,提出了一种简单而有效的方法,在这类高维编码方法的聚合方式中引入空间权重信息,这样可以在图像整体表示中突出前景物体,抑制背景噪声,解决了此类高维编码方法在卷积神经网络的卷积局部描述子上效果不好的问题。同时进一步的可视化并分析了数据库中所有图片的空间权重图的整体分布,结合空间权重图分布的统一规律提出了截断的权重聚合方法,进一步的提升了检索性能。  2.提出了一种结合检测的概率候选区域特征聚合方法  场景商标检索是目标检索领域的一种特殊任务,主要难点在于商标图片只占据整体图像的很小一部分,这对图像的整体表示以及检索方法都有很大的挑战。针对这个问题本文提出了一种结合检测框架的特征表示方法,采用主流的目标检测方法检测得到前景商标的多个候选区域。并与此同时,提出了概率候选区域的概念。然后通过一个二级聚合方法:候选区域级别和图片整体级别,得到图片的整体表示。在引入检测环节,保证全局特征表示中商标区域的召回的同时,将检测环节的候选区域打分作为置信度加入第二级聚合中,第一次将目标检测的思想引入到场景商标检索任务中,并较好的平衡了前景商标区域的召回和精度的问题,最后的实验结果在场景商标检索公开数据集上达到了当时最好的结果。  3.提出了一种基于注意力机制的端到端图像表示学习方法  在目标检索任务中引入检测环节,可以更好的将图片整体表达集中在特定目标区域。但是引入检测环节的特征表示方法需要训练独立的目标检测器,并同时依赖大量的精确的目标框的手工标注信息。针对这个问题,本文提出了一种只根据类别标签来同时学习检测器和特征表示的方法,设计了一种基于注意力机制的打分定位子网络作为目标或者部件的检测器,并采用更贴近检索任务的排序损失端到端的学习得到图片的全局嵌入特征表示。在主流的公开数据集上进行了效果的评测,结果表明在只需要四个候选区域的情况下,就可以得到与之前方法几十甚至上百个候选区域持平甚至更好的效果,而且不依赖于任何目标框的手工标注信息。  4.图形商标侵权检索系统  最后,基于以上提出的方法,本文设计和实现了基于商标侵权保护的图形商标检索系统,为用户提供了网页端和移动端稳定、便捷的图形商标查询服务。并将本文提出的特征表示方法和基于全局特征表示的图像检索方法成功应用于该系统的搭建和对外提供服务中,有效的实现了该系统的图形商标查询模块,为知识产权保护尤其是图形商标侵权判定、图形商标设计、商标交易等服务提供了强大的技术支撑作用。
其他文献
当前信息技术的进步,带动了我国IC产业的快速发展。随之带来了贴片机,上芯机等精密电子封装设备需求的快速增长。这些设备有着相同的技术特点,结合视觉的检测技术以及运动机
随着科技的不断进步,我们身边越来越多的领域都在进行着数字化及网络化革命。在监控领域,集成了数字图像处理、远程网络传输等最新技术的网络视频监控系统,正在逐步取代传统
学位
随着汽车产品的不断发展,汽车空调的性能受到人们越来越多的关注。传统汽车空调系统的驱动源是汽车发动机。由于发动机转速视车辆行驶速度而定,因此无法根据空调系统的需要对其
自动测试系统是计算机技术和仪器技术相结合的产物,虚拟仪器理论的提出将自动测试系统带入了虚拟化时代.随着软件开发技术的进步.将面向对象软件开发技术用于自动测试系统软
动态场景语义理解和分析的研究目标是让计算机视觉系统具有和人类类似的视觉感知能力,能够对动态场景进行感知、分析和理解,能够得出人类习惯的语义描述。作为计算机视觉研究的
本文系统的回顾了分布估计算法(EDA)的发展历史背景和理论基础,简要的介绍了分布估计算法和置换流水车间调度问题(PFSP)的研究现状,详细的分析了分布估计算法在求解复杂的连
高超声速飞行器是指飞行马赫数大于5的有翼或无翼飞行器。与现有航空器及航天器相比,高超声速飞行器具有飞行速度快、飞行高度高、快速全球到达、突防能力强、作战效能高等优
能源问题已成为全球共同面对的问题.随着我国经济的高速发展,许多城市出现了电力紧张、石油短缺等能源问题.建筑能耗在总能耗中占有很大的比例.21世纪,随着能源供应的日趋紧
LXI是以太网技术在仪器领域的拓展,作为新一代模块化仪器总线技术,具有向后兼容性、成本低廉、互操作性强等特点,为组建分布式测试系统和混合测量系统提供了基础。近年来,LXI
融合多传感器遥感图像,可有效降低单源信息的模糊性,实现多传感器信息的互补。具体来说,融合遥感领域备受关注并广泛应用的SAR与SPOT图像,可以综合地物目标的可见光与微波辐射特
学位