【摘 要】
:
随着网络和多媒体技术的发展,基于内容的图像检索(CBIR)作为一种精确、快速的检索方法越来越受到用户的欢迎。近年来,CBIR面临的主要问题是人工设计的底层特征难以描述人类所理解的图像语义信息,即“语义鸿沟”问题,以及如何快速、有效地从海量图像数据库中检索出相似图像。这两个问题对应的是CBIR的两个主要步骤,即图像特征提取以及基于图像特征的索引建立。本文的研究便是围绕这两个主要步骤展开的。(1)提出
论文部分内容阅读
随着网络和多媒体技术的发展,基于内容的图像检索(CBIR)作为一种精确、快速的检索方法越来越受到用户的欢迎。近年来,CBIR面临的主要问题是人工设计的底层特征难以描述人类所理解的图像语义信息,即“语义鸿沟”问题,以及如何快速、有效地从海量图像数据库中检索出相似图像。这两个问题对应的是CBIR的两个主要步骤,即图像特征提取以及基于图像特征的索引建立。本文的研究便是围绕这两个主要步骤展开的。(1)提出一种图像特征提取模块——基于非监督学习的SS-VGG16卷积神经网络,应用在图像特征提取阶段。该模块有三个创新点,解决了三个问题,即:VGG16模型参数量过大问题、VGG16网络只能输入固定大小图像的问题、监督学习不能基于无标签图像数据库进行训练的问题。本文对经典的卷积神经网络VGG16进行改进,提出的基于Squeeze Net思想的轻量化S-VGG16网络结构,旨在减少网络的参数量,更少的参数量代表更短的网络训练时间,同时意味着更快的图像特征提取速度。为了解决传统CNN不能提取任意大小图像的特征问题,本文使用空间金字塔池化(SPP)去代替S-VGG16网络中的最后一个最大池化层,得到SS-VGG16网络框架,使得网络能够接受任意大小的图像作为输入,因此无需进行图像拉伸、裁剪等预处理,避免了图像失真问题。考虑到对无标签数据集进行图像检索,本文提出无监督迁移学习对SS-VGG16框架进行训练。该方法利用相似图像数据的内在联系,使用图像特征均值作为训练目标。为证明提出的SS-VGG16网络结构的有效性,本文在MIT Places 365-Standard公共数据集上进行监督学习实验,使用Top-1和Top-5准确率作为评价标准,对比了本文提出的SS-VGG16与原始VGG16的图像检索性能,证明了SS-VGG16的有效性。为了证明本文提出的无标签无监督学习的有效性,使用Paris 6k、UKBench作为实验数据集,并分别以MAP、Top-4准确率作为评价标准,将本文提出的方法与近年来使用无监督学习方法进行比较,证明对SS-VGG16进行无监督训练在图像检索任务中的优越性。(2)提出一种基于深度特征、特征预降维、以及迭代量化编码的图像检索算法。在建立特征索引前,本文提出使用基于自编码器的特征预降维方法对数据进行非线性学习,以达到对特征进行预降维的目的。在建立特征索引阶段,本文提出使用迭代量化(ITQ)方法,对预降维后的SS-VGG16深度特征进行编码;ITQ方法不断逼近特征与设定比特数的哈希码之间的量化误差最小值,实现量化误差的最小化。本文使用查全率(Recall)、查准率(Precision)和平均精度均值(MAP)作为检索效果的评价指标,在Caltech256图像库上进行测试。实验结果表明,本文提出的图像检索算法性能要优于其他主流算法。
其他文献
[背景和目的] 口腔扁平苔藓(oral lichen planus,OLP)是一种皮肤粘膜联发疾病,可单独发生于口腔粘膜或皮肤,也可同时/或先后并发。目前普遍认为它是一种慢性的非感染性炎症,女性多于
计数数据广泛存在生物医学、遗传学、金融保险、临床诊断以及风险控制等多个研究领域中。对于计数数据的研究,最常见的是使用Poisson模型或负二项分布模型来进行回归分析。然而随着科学技术的发展和研究的不断深入,所研究的计数数据往往会出现高维的、非线性的情况,常用的回归模型已经不能够满足数据研究的需要,因此,需要建立一种动态的非线性模型来描述变量之间这种动态的相关结构。Copula函数作为相关分析和多元
背景:原发性肝癌是消化道常见的恶性肿瘤,具有发病率高、手术切除率低、术后复发率高等特点。肝癌治疗方法繁多,各有利弊。近十余年来,超声引导下肝癌介入性治疗作为一种肿瘤原位
目的:研究慢性情绪应激对C3H/HeJ小鼠乳腺肿瘤生长的影响,并进一步探讨应激影响乳腺肿瘤生长的神经内分泌机制与神经免疫学机制。 方法:C3H/HeJ小鼠110只,随机分为应激组与对照
<正>在中央赋予海南建设国际旅游岛的诸多优惠政策中,免税购物政策备受关注。2010年1月4日正式发布的《国务院关于推进海南国际旅游岛建设发展的若干意见》提出,要在海南实行
本文选取合肥市四里河路地铁车站深基坑工程作为研究背景,根据现场监测资料以及有限差分软件计算模拟,简化模型计算条件,并结合现场施工情况,绘制现场主要监测点以及模拟计算
目的:比较不同严重程度中青年阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者睡眠脑电觉醒及循环交替模式的特征,探讨觉醒不稳定性与认知障碍及日间嗜睡的关系。方法:筛选2017年7月至2019年1月于苏州大学附属第二医院睡眠门诊就诊的疑似OSAHS的中青年打鼾患者,依据入组标准共纳入患者134例,平均年龄(37.54±7.66)岁,收集所有患者的一般资料。所有患者行夜间多导睡眠监测(PSG),分析夜间
农村养老保险经办服务是社会保险经办服务体系中的短板。本文主张重构农村养老保险经办服务体系,建立以市为中心,省级统筹的农村养老保险服务经办体系。在这个体系中,互联网
当今社会,全球政府普遍面临着政府公信力下降的挑战,政府信任危机是当前各级政府所面临的严峻问题。政府信任反映了居民对政府的认可程度,是政府政策执行的基础,较高的政府信任可以有效降低政策执行成本。2008年发生了震惊中外的5.12特大地震,此次大地震给灾区人民带来了巨大的创伤。在抗震救灾和灾后重建时期,各级政府向地震灾区投入了大量人力、物力和财力支持,圆满完成抗震救灾以及灾后重建工作,帮助灾区人民走出
鞋是人们生活的必需品之一,成鞋耐折性能反映了成鞋产品帮面材料耐久性能、帮底粘合牢固程度和外底耐屈挠性能等,从而体现成鞋的整体质量和穿着耐久性。因此,成鞋耐折性能的测试无论对于成鞋生产制造还是质量检验都很重要。目前成鞋耐折性能的测试方法存在的问题除了测试过程中存在安全隐患外,最主要的问题是测试效率低。在传统的鞋类产品质量检验的过程中,一般采用批次抽样来判断产品质量。然而,随着产品批次和数量的增加,产