论文部分内容阅读
随着科学技术的不断进步,数字图像数量增长速度之快令人惊叹。面对庞大的数字图像数据库,用户如何快速、有效地从中找到所需的图像已然成为广大学者研究的热点。基于文本的图像检索这一传统方法已经无法达到用户的要求。目前,基于内容的图像检索得到了迅猛的发展。为了更好地了解花卉资源,花卉图像的检索是一项具有较好经济价值和社会价值的工作。本文介绍了基于内容图像检索的国内外现状和核心技术,并以此为基础研究并实现了花卉图像检索系统。近年来,深度学习在计算机视觉研究方面获得了惊人的成绩。本文以深度学习为基础,利用卷积神经网络模型来提取花卉图像的特征,对花卉图像检索展开了研究,主要工作如下:(1)为了提取到效果更好的花卉图像特征,本文对比不同的卷积神经网络模型选择了以VGG-16为基础的模型来提取图像的特征向量。本文提出对VGG-16进行一种优化方法,在VGG-16中引入两个模块特征金字塔多层融合模块和残差注意力机制模块。原网络深层有丰富的高级语义信息但缺乏空间位置信息,浅层与此相反,所以引入特征金字塔多层融合模块能够有效地融合高级和低级特征,使两者信息互补得到更好的图像特征。在图像特征提取的过程中,通过整张花卉图像进行全局特征的提取,花卉图像背景中的杂草、泥土和石头必然会包含其中,这样会有大量的冗余信息从而影响检索的准确性。残差注意力机制模块的引入,可以有效剔除冗余信息从而优化特征图。将这两个模块加入VGG-16中可以有效地优化提取到的图像特征。(2)对不同索引的方式作了对比,如基于树型结构、高维度数据聚类和基于哈希算法等索引方式,选择了现有算法中具有良好效果的哈希算法。本文利用了全连接层中第二层的特征映射作为图像的特征向量,通过了主成分分析和哈希检索相结合的检索算法。哈希检索分别采用了局部敏感哈希、平移不变核局部敏感哈希和密度敏感哈希这三种经典的算法来通过实验,当利用PCA将特征向量降维至64、编码长度为256 bit的局部敏感哈希时,检索算法效果最佳,验证了 PCA和哈希检索结合的有效性。(3)本文利用改进后的VGG-16提取特征、PCA和局部敏感哈希相结合的索引方式作为花卉图像检索的模型和算法,采用Oxford 102 Flowers数据集进行验证,实验结果表明算法的查全率和查准率较高。通过与其他特征提取的模型和方法以及原VGG-16模型比较,证明了改进后VGG-16模型的优越性。最后,利用本文的方法实现了一个实用的花卉图像检索系统。