论文部分内容阅读
近些年来,多媒体技术发展迅速,而互联网上的媒体数据,如图像、视频等也呈现飞速增长的态势。图像作为媒体数据的一种主要形式,可以传递丰富的信息。因此,如何从海量的图像中进行相似图像的识别与检索,成为现在多媒体领域亟待解决的难点。基于内容的图像检索框架通常包含建库阶段和查询阶段:建库阶段首先对图像库中的图像提取视觉特征向量;然后,组织所有特征向量建立高维索引;查询阶段首先对查询图像用相同的特征提取方法得到查询特征;然后,在高维索引中进行相似性查询;最后,返回相似图像。在许多实际应用中,用户的目的不仅仅是检索出与输入图像整体相似的图像,更希望返回包含输入图像中的特定标识的相似图像,即面向特定标识的图像检索。该技术目前在许多方面,例如医学、交通等,都有较高的研究和应用价值。然而,当前已存在的通用图像检索框架面临的问题是:特定标识往往占图像面积较小,区分度不明显,而且种类繁多,这些属性增加了检测识别的难度。因此,为了实现面向特定标识图像的快速、精确检索,本文针对面向特定标识的图像检索技术开展研究,主要内容如下:(1)基于卷积神经网络的特定标识检测算法针对特定标识所占图像面积较小的问题,本文提出一种基于卷积神经网络的特定标识检测算法,该算法针对小物体检测优化FasterR-CNN,利用多个区域建议网络融合高层与中层特征,并获取更多候选区域;同时扩大网络高层的特征图,提高目标定位的准确度。该方法在LUNA16公开肺部结节检测数据集上进行实验,疑似结节检测召回率达86.42%,相比现有方法提高至少3.3%。结果表明,本文提出的特定标识检测算法可有效检测出在图像中所占比例较小且与背景区分度低的标识。(2)基于卷积神经网络的哈希量化算法由于网络上图像规模较大,若用浮点数特征描述图像会占用较大存储空间,并且检索过程中图像间相似度计算效率低较。因此,本文提出一种基于卷积神经网络的图像哈希量化算法,该算法利用图像间相似性关系、量化误差最小化以及信息熵理论提升量化精度,并在CIFAR-10和NUS-WIDE数据集上进行实验,结果表明算法最短只需12比特就可以充分表示图像信息,并且量化精度较现有方法提升5.98%。(3)基于二进制索引的图像检索系统本文基于误差加权的分段哈希索引技术组织二进制特征并建立高效索引,从而提高近似最近邻的查询速度,并基于该索引实现图像检索系统。该系统首先提取图像的二进制特征,然后建立分段哈希索引,并基于误差加权哈希算法在索引表中筛选出候选集,在海明空间下对查询特征进行K-最近邻查询,并返回整体相似图像,最后基于本文提出的特定标识检测算法实现特定标识图像的检索。实验表明,该系统在千万级数据库中的精度较线性查找达到96.8%,且检索速度为0.31s,较线性查询提高82ms。