基于卷积神经网络的实例图像检索

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：fuzaifeng

【摘要】

：

【作者】

：

刘易斯

【出处】

：

西安电子科技大学

【发表日期】

：

2020年02期

【关键词】

：

卷积神经网络实例图像检索特征提取激活函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人工智能时代,以卷积神经网络为代表的深度学习技术在计算机视觉领域的各项任务中大放异彩。在图像检索方面,基于卷积神经网络的图像表示模型表现十分优异。然而这种优异的表现更多地体现在相似性图像检索任务中,在实例级的图像检索任务中的表现仍缺乏竞争力。实例图像检索任务对技术的要求更为苛刻,也有具有更广泛的应用前景。本文认为深度方法在图像检索方面取得的成果表现平庸的原因主要是存在以下四点问题:1)现有的基于卷积神经网络框架的实例检索系统大多都选择使用已经在ImageNet数据集上预训练好的网络模型来作为特征提取器,然而ImageNet数据集是针对分类(相似性图像检索)任务而设计的,这样学习出的图像特征是用来区分图片的不同语义类别的,这样的特征对于类内的变异具有较强的鲁棒性,但是实例图像检索的任务是去区分特定的对象,而不是两张图片是否属于相同的语义类别。2)不适合实例图像检索的网络结构与训练过程。3)没有充分的利用卷积神经网络模型的学习能力,目前很多方法都只是将卷积神经网络当做一个局部特征提取工具,仍需要进一步对特征进行手工计算得到滤波参数,没有实现端到端的网络模型。4)次优的激活函数,大部分进行实例图像检索的网络模型选用的都是ReLU,PReLU,以及Sigmoid等现有的激活函数,然而这些激活函数也存在着诸多问题,优化的空间很大。本文的研究目的就是通过解决以上提出的目前大多数方法存在的问题,以提高基于卷积神经网络进行实例图像检索的精度。本文的主要工作总结如下:Ⅰ)针对问题1和问题2,本文选用更适用于实例图像检索的基于三元排序损失的三输入流孪生神经网络框架,将本文提出的基于ResNet-50的网络模型在ImageNet上进行预训练,再将预训练好的模型在本文选用的专门针对实例图像检索的数据集上进行微调(fine-tuning),使模型提取的图像特征更适用于实例图像检索。Ⅱ)针对问题3,最近提出的卷积层区域最大激活值特征描述方法R-MAC,非常适合实例图像检索,且其提取的特征对于平移和缩放具有一定的鲁棒性,本文提出将所有组件都可微分的R-MAC集成卷积神经网络模型中,实现端到端的实例图像检索模型,提高了R-MAC的表达能力。Ⅲ)针对问题4,本文提出一种全新的激活函数TReLU,在保留ReLU所有优点的同时,解决了ReLU在训练过程中会出现“死”神经元的现象,并缓解了ReLU输出非0均值的问题,并对TReLU在计算效率方面存在的不足提出了优化方案以进行改进。本文实现的端到端的基于卷积神经网络进行实例图像检索的模型包含了以上全部工作,使用三输入流的孪生神经网络并结合了三元排序损失函数,使用了本文提出的TReLU激活函数,在训练过程结束时生成针对实例图像检索任务的全局图像表示。在Oxford5k,Paris6k,以及Holidays等公开数据集上通过大量实验对本文提出的方法进行了验证,实验结果表明,本文提出的基于卷积神经网络的实例图像检索模型有着较高的检索精度,优于传统的图像检索算法以及空间验证等最先进的方法。

其他文献

2种立井提升系统防止撞击、过卷缓冲、托罐保护装置的比较

多方面比较了BS＋FHT型和HZHN型立井提升系统防撞、过卷缓冲、托罐保护装置的原理和性能,阐明了钢带逆止缓冲装置的优越性,用现场实例证明其良好的安全可靠性和推广应用前景.

期刊

立井提升安全保护过卷缓冲防撞托罐

经导管主动脉瓣置换术中自膨式瓣膜支架释放预测与实际投照角度的差异性分析

目的探讨经导管主动脉瓣置换术(TAVR)术前应用多层计算机断层摄影(MSCT)预测投照角度与术中实际投照角度的差异,总结TAVR术中自膨式瓣膜支架释放的最佳投照角度的经验。方法

期刊

经导管主动脉瓣置换术自膨式瓣膜支架投照角度

教师倾听在课堂中的道德意蕴及其实现策略

目前,课堂中存在着各种各样的教师"失聪"现象,这在一定程度上成为课堂教学道德性缺失的集中体现。基于对课堂中教师"失聪"现象的分析,发现倾听在课堂教学中有丰富的道德意蕴

期刊

教师倾听道德意蕴课堂教学

活动理论特点及其对汉语二语动机研究的启示

近年来国际上的"汉语热"现象引起了学界对汉语二语学习者动机心理的兴趣与关注。本文首先回顾了汉语二语动机的研究现况,指出当前研究对引起汉语二语学习者动机的影响机制研

期刊

活动理论汉语二语学习动机启示

探索高校学前教育专业舞蹈教学发展

学前教育是教育学的一个分支,是主要研究托儿所、幼儿园的儿童教育,同时对家庭教育、社会教育具有一定的教育和指导作用。学前教育专业是目前就业率排名最高的专业之一,几乎

期刊

高校学前教育舞蹈教学

内蒙古农牧交错区施氮量对燕麦饲草产量和饲用品质的影响

对比施氮量对饲草产量、品质的影响，为内蒙古农牧交错地区燕麦饲草增产提质提供理论依据。在旱作条件下对2个燕麦品种‘蒙燕1号’和‘8202’分别设低氮（30kg／hm^2）、中氮（90kg／hm^2

期刊

燕麦饲草氮肥品质产量

把实验室生物安全主动权牢牢掌握在自己手里

2013年1月18日，“P3和P4实验室生物安全技术与应用”项目荣获2012年度国家科技进步二等奖。这是我国认证认可领域首次获得国家级科技奖项，标志着我国高级别生物安全实验室的设

报纸

未来的冷链推动力

在新的一年开始之即，冷链物流的成长性和创新性空间与冷链物流的短板和问题依旧相伴而存，与冷链产业相关的链条、产业构成、供给占比、发展状态、产业环境、发展方向、发展前景

期刊

成长性创新性核心竞争力冷库行业生鲜电商冷链物流企业

直流稳压电源常见故障分析与排查

直流稳压电源是目前高校普遍应用的电子学实验教学装置。设备发生故障后会给造成实验教学一定损失，实验室装置完好率是实验教学保障的重要指标，能否及时发现并排除实验装置故障

期刊

实验装置直流稳压电源原理故障分析

云南汉语方音史稿(一)

云南地处祖国西南边疆，而汉语方音却属北方话，，如何解释它的形成？曾经是让不少人感到困惑的问题。本文讲清楚这些历史，目的在于古为今用。了解云南汉语方音演变的来龙去脉，可以发现

期刊

明史兰茂《声律发蒙》《韵略易通》

基于卷积神经网络的实例图像检索

与本文相关的学术论文