基于联合语义嵌入的深度哈希算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:spls108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码产品的普及和互联网技术的发展,图像数据不断涌入互联网,呈现数据规模大、特征维度高、语义关系复杂等特点。哈希算法因其检索速度快、储存成本低等优点成为了基于内容的图像检索领域的热点问题,它将图像映射成紧凑的二值码即哈希码,并保持原始图像的相似性关系,利用紧凑的哈希码进行快速的异或运算对图像进行检索,加快了检索速度,减少了存储消耗。近年来,深度学习被广泛地应用于哈希算法中。相对于传统哈希算法,深度哈希算法的性能有了较大提升,但是目前依然存在一些问题需要解决:(1)主流深度哈希算法利用图像标签构建一个相似矩阵,并利用该相似矩阵监督图像哈希学习,直接利用相似矩阵的方式面临着两个挑战:a.单标签数据的不平衡性:单标签数据的相似对数目远小于不相似对的数目,导致相似矩阵十分稀疏,神经网络难以学习和收敛;b.多标签数据语义挖掘不完全:多个标签导致数据的相似性有了更复杂的演化,相似矩阵仅被简化为相似与不相似的离散关系,导致丰富的语义关系难以准确刻化。(2)深度学习需要大量标注数据进行驱动,需探究一些方式来减轻算法对现有标注数据的依赖,利用其他已标注的相似数据来帮助模型学习,降低人力消耗。针对以上两个问题,本文提出了对应的两个深度哈希算法,内容如下:(1)提出了基于联合语义嵌入的深度哈希算法。该算法构建了两个神经网络:标签网络和图像网络。标签网络旨在挖掘标签的语义特征信息和学习准确的哈希码,并将其学习好的语义特征和哈希码嵌入到两个网络共同的语义空间和汉明空间,在两个层面监督图像网络进行语义特征学习和哈希学习。使用标签网络学到的哈希码来直接监督图像进行哈希学习,代替原始相似性矩阵的直接约束,避免了单标签数据集的不平衡问题;标签网络从多标签中挖掘了丰富的语义特征,构建了更加精确的相似性关系,克服了多标签数据集语义挖掘不完全的问题。(2)提出了基于对抗学习的深度迁移哈希算法。该算法引入了迁移学习中的对抗学习,利用已标注的源域数据集来帮助未标注的目标域数据集进行哈希学习。该算法构建了一个端到端的神经网络,包含了:域特征提取器、域分类器和哈希编码器。其中对域分类器引入域分类损失,期望来自两个域的特征更易区分;域特征提取器引入域混淆损失,期望来自两个域的特征数据难以区分。最终使得域特征提取器从不同域提取的特征分布一致,从而不同域的数据相互协作学习,减少了算法对图像标注的依赖。
其他文献
马克思主义哲学的核心在于其对唯物辩证法观点的阐述。唯物辩证法的实际作用是帮助人们通过解析矛盾把握事物变幻莫测的奥秘。马克思主义矛盾分析法要求我们看问题要学会一分
2018年9月20日——艾里逊变速箱公司近日在第六十七届IAA商用车展上宣布,在全球范围内推出中型商用全自动9速变速箱,且进一步开发了一款具有纯电驱动行驶里程的混动系统。
蚕豆是一种粮、饲料以及肥料兼用的作物,有着丰富的营养。蚕豆的有着旺盛的生长力、茎秆粗壮,叶子大而且厚。蚕豆含有多种必须的氨基酸和碳水化合物,可以作为杂粮、蔬菜等使
小麦节水高效栽培技术在当前的小麦种植形势下,能够促进小麦绿色高产高效发展,实现生产与生态平衡发展,提高种粮效益。本文章从品种、灌水和农艺应用等方面介绍了咸阳小麦节
近日,深圳街头出现了一批车身印有诗歌文字的巴士,上面的诗句熨帖心扉:“我的爱人,让我们手挽手老去,和词语一起冬眠”。若是扫描车身上的二维码,还可以聆听诗人北岛的作品。在深圳
本文简单介绍了甘蔗病虫害防治技术中常见的问题,重点探讨了其解决方法,包括提高思想认知、更新防治技术等,旨在防止甘蔗受病虫害的影响,促进甘蔗可以健康生长,增加甘蔗的产
笔者认为,只要不法侵害持续进行,从社会人及行为人的角度来看,行为人不堪忍受不法侵害且只得以防卫行为破除不法侵害,便是不法侵害达到了紧迫程度。杜志浩等人的不法侵害经历了最
报纸
把统计学中的多维标度技术应用到无线传感器网络节点定位是一种新的思路.提出了NMDS—RSSI(nonmetric multidimensional scaling and received signal strength indication)定位
本文为对关口表计计量准确性的实时监测系统设计,系统对关口电能计量系统进行远程实时监控,将监控的状态数据保存和上传,并可对历史数据进行分析处理
随着人类活动的大力开发,海岸带地区的环境保护问题受到越来越多的重视。在海洋经济迅速发展条件下,海岸带地区始终面临着人口稠密、资源紧张和海洋环境污染严重等问题,人口、资源与环境之间的矛盾已经成为制约区域海洋经济发展的关键因素。在这种背景下,开展对海洋资源、环境和社会经济承载的研究已成为迫切需要。本文选取天津市滨海新区为例进行实证分析,建立海岸带资源-环境-社会经济指标体系,对滨海新区2007年—20