论文部分内容阅读
基于内容的图像检索是近年来的热门研究内容,涉及图像处理、计算机视觉和数据库系统等方面的学科。其中,有效的高维索引机制是使大规模图像库的检索能够达到实时性要求的关键技术,近年来吸引了众多研究者的注意,具有重要的理论意义和应用价值。
本文针对大规模人脸图像数据库检索的实用要求,在分析国内外相关研究的基础上,设计并实现了能支持高速检索的大规模人脸检索系统,提出了一个能充分利用内存优势的混合索引选择机制,并改进了已有的内存索引和磁盘索引,把近似检索结合到树结构的索引方法中。
大规模人脸图像检索系统在众多领域都有着广泛的应用前景,对其设计与实现的研究具有非常实用的意义。其中高维索引机制是系统的核心技术,能够使图像检索速度大大加快。传统的索引机制只采用一种索引方法,本文提出采用混合的索引选择机制,根据内存和数据库状况选择不同的索引方法,充分发挥内存优势。
在目前大内存的环境下对内存索引的研究显得非常必要。本文改进了一种内存索引方法NB树。它的建树算法和搜索算法都非常简单,而且维护索引的开销很少,因此特别适合作为内存中的检索方法。经过改进以后其检索性能得到进一步提高。
近似检索是近年来新兴的课题,原因是传统的精确检索方法都会遇到“维度灾难”问题,在高维情况下性能大幅下降。为了使索引在高维下依然能够较大的提升检索速度,牺牲一定的检索精度来换取速度成为一个可行的解决方案。本文把近似检索方法结合到磁盘聚类树索引中,实验表明该方法在保持较高精度的前提下能够显著减少检索时需要访问的原始数据,是一个理想的磁盘索引。