基于残差网络的多标签图像检索方法研究

来源 :桂林电子科技大学 | 被引量 : 4次 | 上传用户:BEYONDPEAKER
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能,物联网以及多媒体等技术的快速发展,图像量级呈爆发式增长,如何高效准确地检索出用户所需图片是多标签图像检索领域面临的关键问题。为了提高多标签图像检索的准确率和效率,目前主流的解决方案为采用深度哈希的方法。尽管基于深度哈希的方法在多标签图像检索领域取得了一定的成果,然而在多标签图像检索时仍然存在检索准确率不高这一突出问题。本文围绕相关问题展开研究,提出了基于残差网络的多标签图像检索方法的解决方法,主要内容包含以下三个方面的工作:(1)在现有的深度网络模型中,提取的底层特征不能有效地将多标签图像的多层次语义信息和相似度排序信息集成到一个深度哈希模型中。因此,本文构建了基于改进残差网络的深度哈希模型。该模型采用成对多标签图像标签向量的余弦距离来量化多标签图像中存在的多层次相似性信息。同时,引入残差网络提高模型的学习能力。实验表明,与对比方法中最佳的基准模型相比,改进后的模型在两个多标签数据集上平均检索精度分别提高了4.09%和8.47%。(2)在现有的深度哈希模型中,提取的特征向量通常包含多标签图像的全局信息,其中包括多标签图像的目标信息和杂乱的背景信息。因此,本文构建了融合注意力机制的残差网络深度哈希模型。该模型引入注意力机制来识别多标签图像中目标(前景)的近似位置。同时为了适应融入注意力机制的模型学习,本文在引用第三章的损失函数的基础上对其进行了修改。实验表明,与对比方法中最佳的基准模型相比,改进后的模型在两个多标签数据集上平均检索精度分别提高了5.29%和9.83%。(3)针对当前单机GPU有限的计算能力和资源,导致在训练深层残差网络模型时速度缓慢。在分析了数据并行和模型并行的各自优缺点基础上,根据本文所使用改进深度残差网络模型,本文设计了基于Keras框架的多GPU数据并行方法来提高训练效率,以解决改进深度残差网络模型在单机上训练代价大的问题。通过对比实验,验证了基于残差网络的多标签图像检索方法具有更高的准确率。
其他文献
目的研究中药提取物姜黄素对人视网膜神经胶质瘤WERI-Rb-1细胞的放射增敏作用。方法采用X射线辐照仪辐照人视网膜神经胶质瘤WERI-Rb-1细胞。CCK-8细胞活性检测试剂盒检测0μm
一、某些企业基建项目财务管理概况映与监督是财务的两大基本职能,而目前大部分基本建设项目财务所能发挥的作用仅仅是核算功能,财务的监督和控制功能仅局限于是否符合合同规定
杨泳梁作为一名年轻的当代艺术家,其作品通常被认为极具中国集锦摄影风格。本文则更侧重于将杨泳梁置于当代艺术体系下进行分析讨论,强调他作品的综合性和独特性。笔者希望杨
目的:探讨肾寐足浴汤足浴联合耳穴贴压疗法对慢性肾脏病(CKD)患者并发失眠症状干预作用的临床疗效。方法:选择肾病科住院和专科门诊患者176例,随机分为对照组和治疗组各88例
目的:为了探讨IL-13基因编码区精氨酸(Arg)110谷氨酰胺(Gln)多态性是否与湖北地区汉族人群哮喘及血浆总IgE水平升高相关.方法:采用PCR-RFLP方法,检测湖北地区43名哮喘患儿、4
黎小斌教授是中国中医科学院中青年名中医,广东省优秀中医临床人才,第二批全国名老中医药专家李丽芸教授学术继承人,黎教授中医临证辨治有快、准、效的特点,其辨证善抓主证,
目的分析对肱骨远端C型骨折患者实施切开复位双锁定钢板内固定治疗的应用效果。方法将64例肱骨远端C型骨折并行切开复位内固定术的患者随机分为2组,每组32例。观察组实施双锁
2017年初,国家癌症中心发布中国最新癌症数据,报告显示我国癌症新发人数呈上升趋势,形势依然严峻。DNA微阵列技术可获取大量的基因表达谱数据,为肿瘤特征基因选择和肿瘤亚型
在城市建筑设计中,既要提倡建筑艺术创作的普通性,也要提倡在建筑创作中汲取生活源泉和文化渊流的深广性,更要提倡建筑风格。因时、因地、因人、因物制宜的多样性。本文对建设设
<正> 军事绘画是当代中国美术创作的重要内容。军事题材的美术创作具有崇高的美学特征,它能产生一种力量,形成一种气势,高昂的英雄主义精神给人留下不可磨灭的印象。回顾建国