聚类驱动的无监督图像检索方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:aiqi527927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索作为一项互联网信息处理的重要任务,面临着海量数据带来的挑战。传统的检索方法根据关键字检索,在处理海量图像数据时并不适用,为了解决这个问题,提出了基于内容的图像检索方法。在基于内容的图像检索技术中,图像内容的表达和相似性度量由计算机进行自动的处理,相比较采用文本进行图像检索所面临的缺陷,充分发挥了计算机长于计算的优势,由此大大提高了检索的效率。哈希检索方法是其中的代表性算法,它将图像以二进制码表示,用汉明距离来衡量图像之间的相似度,在算法复杂度和存储空间上有极大的优势。近年来,深度学习被广泛应用于图像处理的任务中,出现了许多基于深度学习的哈希算法,但是大部分深度哈希算法依赖图像标签,而标签的获取代价昂贵,而大部分无监督的哈希算法不能达到理想的性能。本文研究聚类驱动的无监督图像检索方法,聚类驱动的哈希,结合了哈希方法和深度学习的优势,且避免了标注图像数据集的耗费,这种基于深度神经网络的无监督哈希方法有着更广泛的应用前景。基于上述问题,本文主要研究内容以及成果如下:1.本文提出了一个深度嵌入式哈希(UDEH)模型,以通过在深度自编码器的嵌入层软聚类模型递归学习判别性聚类并产生具有高度相似性的二进制码。本章使用聚类的簇作为辅助分布来生成哈希码。通过施加二进制量化约束损失和自动编码器的重构损失,该算法可以通过标准随机梯度下降(SGD)进行联合优化。然后对三个流行的数据集进行了综合实验,证明了该算法的有效性。2.本文还采用了伪三元组的概念,并提出了一种新的方法,即无监督深度三元组哈希(UDTH),它构造了一个三元组自编码器网络,并以伪三元组作为标签进行训练。在UDTH中,利用KNN计算所有样本的相似度矩阵,并选择K个最相似的图像作为正样本,K个最相似的图像作为负样本。通过这种构造策略,数据集中的所有图像都用于三元组(作为锚点),并且错误的训练样本也大大减少了。此外,UDTH利用自动编码器将视觉信息保留在哈希码中。3.本文提出了深度无监督自进化哈希(DUSH)算法,由易到难地训练神经网络。该模型最大程度避免了以往无监督哈希方法中参数选择地问题,将无监督的哈希转换为有监督的方式。DUSH实施起来非常简单,而且效率很高。在min-batch选择伪对,这可以大大降低计算复杂度。此外,伪对是在训练过程中产生的,这与训练前产生伪对的传统方法完全不同。
其他文献
毫米波雷达在近程探测方面应用广泛,有着抗干扰能力强、精度高、体积小等特点。本论文以3mm近程雷达探测系统为研究对象,主要研究了LFMCW雷达在多目标检测中的离散频谱估计算法和频域配对算法。最后结合需求,设计出一种LFMCW近程多目标检测系统。研究的主要内容如下:(1)分析了雷达系统的结构,研究了典型LFMCW雷达的工作信号,给出了雷达探测精度的影响因素。(2)针对频谱的栅栏效应造成的探测精度下降,
随着Android系统的迅速普及,Android恶意应用软件成为了人们日常生活中的严重威胁。虽然近年来研究者们提出了许多方法和工具来对Android恶意应用软件进行检测与防御,但是大多数的方法都聚焦于恶意应用粗粒度的检测,无法更准确的考虑到具体的恶意行为类别。本论文从静态分析的角度入手,在Android应用中提取行为特征,将恶意应用根据其实施的恶意行为进行分类;并考虑对抗环境下检测方法的适用性,研
进入大数据时代,海量数据正以空前的速度产生。这些数据不仅样本数目众多,其特征规模也不容小觑。医疗领域也不例外,如包含数以万计的基因探针的微阵列数据;分辨率很高的X射线、核磁共振等医学影像数据等。上述高维数据不可避免的包含了冗余特征,对分类和聚类算法的学习性提出了许多挑战。因此,本文围绕“医疗大数据特征降维”这一主线开展研究,主要针对分类或者聚类任务,提出了以下三种特征选择和提取的创新方法:(1)一
广播式自动相关监视(ADS-B)技术是一种近年来兴起的航空器运行监视技术,国际范围内已广泛将其视为下一代航空监视的核心技术,欧美澳多国已经对ADS-B技术有较为成熟的系统,我国也正在积极推行ADS-B技术的应用。首先,本文阐述了课题的研究背景及对其进行研究的意义,介绍了ADS-B技术的发展史,以及目前国内外的研究现状。然后介绍了ADS-B使用的几种信号体制,其中应用最为广泛的是1090ES信号模式
现代雷达传感器的灵敏度受到标准量子极限的限制。随着隐身技术的广泛应用,雷达越来越难探测到目标。为了有效的侦查隐身目标,各国学者提出了量子雷达的概念,有望利用量子纠缠技术和量子信息处理技术来增强雷达探测能力、提高分辨率等等。而雷达目标特性作为雷达探测能力的重要参数,具有重要的研究意义。但对于量子雷达散射截面积的研究才刚刚起步,如何从回波光子状态中获取目标信息是实现目标探测与识别必须要解决的问题。所以
激光雷达凭借其角分辨率高、测距精度高等优点,在军事和民用领域有着广泛应用。与传统激光雷达不同,光子计数激光雷达以工作在盖革模式下的雪崩光电二极管(GmAPD)为核心光电检测器件,对远距离目标、弱回波信号的探测能力更强,是实现目标三维信息感知的重要手段。传统的点云数据处理方法在信噪比较低或目标反射率较低时,无法有效完成三维图像重建任务,为了弥补上述不足,本文深入研究了光子计数激光雷达的工作原理,以光
区块链作为一种新兴的分布式存储技术,能够实现数据的多方共享与维护,为数据共享提供安全、可信的环境。然而,随着近年来区块链研究的逐步深入,其自身的安全问题日益显露,区块链数据隐私保护逐渐成为热门的研究课题。联盟链Hyperledger Fabric(以下简称“Fabric”)作为最广泛应用的区块链平台之一,采用授权的方式限制节点访问数据,但在数据存储机密性和隐私性上缺乏合适的解决方案。本文针对Fab
雨是现实生活中非常普遍的天气,不仅影响人类的视觉,而且还会严重影响户外视觉系统的性能,包括视频监控,物体检测和自动驾驶等等。随着计算性能的提高以及深度学习理论的发展,图像去雨任务已经取得了许多突破性的进展。但是同样存在背景模糊、雨痕残留等问题。本文对现有的图像去雨方法的优缺点以及适用范围进行总结。针对现实场景下的图像去雨问题,本文重点研究了雨痕图像的特点,提出了基于分解的循环生成式对抗网络的图像去
非接触心率检测算法存在较为成熟的体系框架,通过摄像头采集目标面部信息,完成不接触待测者便能获取心率特征的任务工作,能够在较大程度上解决传染性病人、行动不便的患者、老人与婴幼儿的健康监测,同时也能作为情绪分类评估的指标,具有一定的研究价值。然而大多数的框架任务研究的内容偏向于微动、静止一类的情况,本文旨在建立剧烈运动状态场景下的心率监测的有效框架。(1)在原始ROI亮度信息采集的基础上,额外获取五官
随着移动互联网技术的快速发展和智能手机的大量普及,利用智能手机进行毒品交易、传播网络谣言,电信诈骗等犯罪行为日益猖獗。面向智能手机的数字取证可以有效地帮助司法部门收集犯罪证据。在所有的智能手机平台中,Android系统凭借其开源性和功能多样性等特点,占据了市场的主导地位,因此,针对Android智能手机的取证技术研究具有重大现实意义。由于Android生态环境的开放性,导致Android移动设备的