论文部分内容阅读
随着互联网、社交网络、自媒体的高速发展,图像数量出现了爆炸性的增长,大规模的图像数据库不断涌现,对图像检索的需求也随之提高。当前的图像检索技术大多采用基于文本的、基于内容的以及上述两者相结合的混合图像检索技术,存在着匹配精度不高,检索效率不好的问题,很难完全满足用户的需要。本文在理解和分析基于内容的图像检索技术的基础上,提出了一种基于物体检测的图像检索技术。该方法根据物体检测的内容进行图像检索,比传统的检索技术更加准确和高效。本文主要研究工作如下:1.对目前图像检索中的一些关键技术进行了研究,包括SIFT、MSER和HO G等多种特征描述方法,并选取SIFT和MSER作为本文的图像提取特征;介绍了图像特征的相似性度量和图像检索算法的性能评价。2.介绍了物体检测技术的发展历史,讨论了几种常用的物体检测算法,分析对比之后,采用YOLO物体检测算法,阐述了YOLO算法的基本原理,并详细介绍YOLO算法的配置、训练和使用过程。3.在大规模图像检索中,需要用一个单一的SIFT特征去匹配数百万或者数十亿的SIFT特征,在这种情况下,SIFT特征的辨别能力下降很快,因为独立的特征之间有许多错误的匹配;MSER检测的是稳定范围。通常MSER输出的是数量相对较少的范围区域,它的可重复性和特殊性与SIFT关键点相比更高。将SIFT和MSER结合到一起生成特征束,它的可重复性更小,分辨能力更高。在物体检测的基础上完成图像特征的提取,生成SIFT和MSER组合到一起的特征束。4.在大规模图像检索中,提取的特征过多,会发生纬度灾难。本文采用KMeans算法对特征进行聚类,KMeans算法快速、简单,对大数据集有较高的效率并且是可伸缩的,但存在收敛到局部极小值的问题;因此,在量化过程中,本文采用k-d tree算法进行量化,把KMeans算法和k-d tree结合到一起,生成视觉词袋(Bag of Words),提高了图像检索的效率和准确率。5.在图像检索技术中采用图像倒排索引,把图像数据库中的图像特征分配到与之最近的视觉单词,提高了检索效率。将查询图像与图像数据特征库进行相似性度量,得到结果进行排序并输出。实验表明,本文方法速度快,检索准确率高是一种较好的图像检索方法。