基于深度学习的敏感目标检索方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:peng7330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索是计算视觉领域一个非常重要而且经典的研究方向,同时,相关的技术在工业界也有非常广泛的应用。近些年来,随着深度学习的兴起,由于卷积神经网络对图像特征很好的表达能力,基于深度卷积神经网络的方法在图像分类,图像检索,物体检测和语义分割等领域都取得了超越传统方法的结果。尽管图像检索技术已经被研究多年,但仍然面临很多挑战,图像中物体的尺寸,姿态以及图像光照的变化都给检索算法的性能带来严重的干扰。本论文主要研究了基于深度卷积神经网络的图像检索方法以及该方法在敏感图像检索上的应用,论文的工作以及贡献总结如下:  1.建立了一个大规模枪支图像数据库—Firearm14k  在当前的社交网络上,充斥着各种各样的令普通用户感到不适的枪支图片,这些图片可能会激起暴力等不良后果,因此有必要对枪支图片进行适当的监管与处理。另外一方面,基于深度卷积神经网络的方法,在网络模型的训练过程中往往需要大量的训练图片,如果训练数据过少,学习到的模型很容易过拟合。截至目前,学术界并没有一个大规模枪支图像数据库存在,为了方便研究者针对这个领域进行研究,我们收集了一个大规模的枪支图像数据库,包含167类不同类型的枪支,图片总数为14755张,我们将其简称为Firearm14k。该数据库包含了真实世界拍摄的枪支图片,因此图片中物体尺寸,姿态,背景等变化很大,识别难度较高。该数据库可以用于枪支图片精细检索的研究,也可以用于枪支图片的精细分类等研究工作。  2.提出了一种多尺度全卷积的图像实例检索方法  目前已有很多工作利用卷积神经网络提取图像特征进行图像检索,但是这些工作并未对影响图像特征有效性的各种因素进行详细分析,例如,图像尺寸缩放的策略,影响多尺度特征有效性的因素等,因此各种因素如何影响检索的性能仍不明确。在该工作中,我们对输入神经网络的图像尺寸缩放策略,提取图像多尺度特征的方式,以及PCA和白化矩阵学习这三个重要的因素进行了研究,通过实验分析了这些因素对检索结果的影响。在此基础上,我们提出了多尺度全卷积的图像特征提取方法。该方法简单而有效,我们在Oxford5k,Paris6k,Oxford105k以及UKB这四个常用数据库上进行了实验,大量的实验结果表明我们提出的方法有着良好的检索效果。  3.提出了一种基于双阈值对比损失函数的敏感目标精细检索方法  在社交网络上或者是在取证领域,人们需要能够自动监管一些不适当的枪支图片或者鉴定枪支的类型等,基于图像检索的技术能够帮助人们有效解决此类问题。通过重新微调已有的神经网络模型,基于卷积神经网络的检索方法取得了很好的效果。传统的单阈值对比损失函数,由于其简单并且有效,被大量使用,但是我们发现将该损失函数用在Firearm14k图像库枪支检索任务上时,网络的性能并不好,原因有两点:第一,在网络训练过程中,相似与不相似样本贡献的损失不平衡;第二,Firearm14k与ImageNet数据库的图片风格差异巨大。我们提出了双阈值对比损失函数来解决网络训练中正负样本贡献的损失不平衡的问题;为了解决Firearm14k与ImageNet数据库的差异问题,我们使用了两步训练的策略,首先用分类任务微调网络,然后再使用检索任务微调网络。大量实验结果表明我们所提出的方法的在枪支精细检索上的准确率超过了当前主流的方法。
其他文献
近年来随着计算机技术的发展和后PC时代来临,嵌入式技术已经成为工业生产和科研实验中不可或缺的重要组成部分。另一方面,数据采集则是信号与信息处理的关键,在军工和民用中得到
随着我国经济发展,机械制造业越来越成为我国经济发展的支柱产业。而数控机床是机械制造业的核心,故数控机床的研制进行得如火如荼。但是,我国研制的数控机床仍然存在不少的
自主/遥控水下机器人是近年来出现的一种新型水下机器人,其自带能源,通过微光缆与水面支持系统相连接,既具有自治水下机器人大范围自主航行的能力,又具有遥控水下机器人定点操作
在过去数十年,由于其广泛应用,例如优化,不动点计算和其他方面,神经网络已经受到相当的关注。众所皆知,时滞现象在神经网络中经常出现,不仅影响传递的速度,还易引起不稳定和震荡。因
PET瓶胚温度控制系统作为饮料瓶吹灌旋一体机的一个重要组成部分,设计的好坏直接决定了吹瓶的质量。饮料吹灌旋一体机是集吹瓶、灌装和旋盖于一体的饮料瓶生产机组设备,相对
本文主要研究了几何主动轮廓模型,和多特征集协作学习在图像分割中的应用。工作主要从以下几个方面进行:从定制矢量流的角度,讨论了集成多线索的信息到矢量场中,以用于驱动GAC模
传统的随机系统控制主要是控制随机系统输出的均值和方差等统计特性。近几年来,随机系统控制出现一个新的分支,即随机分布控制。这类系统的主要特点是其输出为系统变量的概率密
在复杂网络的研究中,当前不同领域的学者关注的热点是揭示节点数众多、连接结构复杂的实际网络的整体特性,特别是网络拓扑结构与网络动力学行为之间的关系、结构与功能的形成机
声学模型,是语音识别领域的核心研究方向之一。段模型放宽了隐马尔科夫模型(Hidden Markov Model,HMM)模型在给定状态时语音观测矢量相互独立的假设,获得更精确的声学模型。然而
光刻用准分子激光光源的激励技术有两大特点:其一,高重复率(2kHz至6kHz);其二,高压放电开关不采用闸流管(放电次数有限)。脉冲充电技术可与磁脉冲压缩开关结合起来达到快放电的目