基于生成对抗网络的精准图像检索方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jy168300124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网,网络设备传输能力以及设备存储能力发展,越来越多的用户选择在网络上分享和下载各种图像数据。网络中的图像数据在近年呈现爆炸性地增长,但是这种大量级却没有进行精确标注的图像数据给相应的图像检索任务带来了巨大的挑战。因此,如何对这类图像进行快速而且准确的图像检索成为当前研究的热点问题。DCNN(Deep Convolutional Neural Network)深度模型因为在计算机视觉问题上的优秀效果也被广泛应用于处理图像检索的问题上。目前已有的图像检索方法中使用的深度模型多采用监督学习的方式来训练模型,得到了很好的效果,但是模型需要有大量标注的图像数据集来训练。这显然极大地限制了其方法的应用范围,因为在实际的图像检索应用中,获得训练模型所需的大量标注数据是非常困难的,而且成本十分高昂。针对上述的问题,本文提出了一种基于无监督训练的图像检索模型,主要是基于生成对抗模型(Generative Adversarial Networks)作为基础模型并对其进行改进,通过该模型的无监督对抗训练方式来学习图像索引然后应用于图像集进行精准检索,以期模型在无标注的数据集中也能适用。本文的主要工作如下:1.提出并使用信息生成对抗模型(InfoGAN)结合传统哈希网络模型生成更准确的图像索引,并提升图像分类检索效果。2.原始模型对于信息向量长度的依赖性较高,如果长度设定不合理会出现模型训练崩溃或者训练结果不稳定,最终影响模型的精度。针对这一问题,本文中创新性地引入了调整向量和自适应信息损失,来去除信息向量长度对于模型训练的影响。3.生成对抗模型的对抗训练过程存在不稳定性和易陷入模式塌陷(mode collapse)的问题,在本文中通过引入了 BN模块(Batch Normalize)和自注意力模块(self-Attention)来有效地遏止了这种情况的发生,优化了模型的性能。最后,为了检验本文中所提出的基于生成对抗网络的无监督图像检索模型的性能,在实验中,以检索性能平均准确率(mAP)作为性能评价指标,在去标注的cifar-10等数据集上对比了其他传统的包括但不限于基于深度模型的检索方法,实验结果表明本文所提出模型在无监督检索准确性上明显优于其他模型。为了更好地验证所提模型在复杂特征提取上的效果,还将该模型应用在人脸相似度衡量的任务上,实验结果表明通过模型进行重排后,相似度检测效果得到优化,并提高了相似脸检测命中率。
其他文献
随着全球经济的高速发展,海运业的重要地位日益凸显。然而,频繁发生的海上事故却是海运业发展的主要制约因素。为降低居高不下的海上交通事故率,出于船舶航行安全评价在海事
数字化校园已经成为高等院校必备的信息基础设施,作为数字化校园建设的网络架构以及设备的配置与管理,是数字化校园高效应用与运行的关键所在,文中以一个数字化校园建设案例
事业单位是我国特有的机构,在改革开放初期设立了事业单位来管理社会事务,事业单位在社会公共服务中发挥着重要作用,因而,事业单位人力资源管理对于人力资源价值的有效发挥具
目前我国正处于社会转型期,社会结构持续分化、利益主体日趋多元、价值观念激烈碰撞,社会不稳定的因素增多。这些问题对于执政的中国共产党来说是一个非常严峻的考验,要求其
<正>《建筑与文化》杂志是中国第一份建筑与文化类专业刊物,国家一级刊物,中国建筑文化研究会会刊,中国出版集团重点刊物。现面向广大业内设计师、专家、学者、征稿。基金项
介绍20世纪70年代以来欧洲现代有轨电车建设的实践成果,总结现代有轨电车的优势与特点,并通过对法国各城市的若干具体案例的深入分析,归纳现代有轨电车在法国不同规模和不同
本文通过对中国传统建筑元素的简介和对优秀案例的调研解读,从微观(建筑构件、建筑装饰、建筑色彩等),中观(空间布局、屋顶造型、立面造型等),宏观(旧建筑群改造、旧街区等)
网络计划技术是现代管理科学总结出的一种科学有效的项目管理方法,在工程项目计划管理中被广泛应用。网络计划技术可以把施工过程中的各项工作组成一个有机的整体,全面而明确
常听说日本人对开运吉祥物等非常着迷,招福猫就是其中之一。该信仰是否是日本人自古传承下来的,现在日本人经营者对招福猫的利用现状又如何。出于对招福猫信仰的诸多好奇和疑
朝鲜族历来以能歌善舞著称于世。在生活的历史长河中逐渐形成了自己独特的舞蹈艺术。朝鲜民族典雅、含蓄、飘逸的内在精神风韵与优美舞姿的融合,构成了朝鲜族民间舞蹈的特有