论文部分内容阅读
随着科技的进步,现代摄像技术和设备越来越便捷和先进,互联网中图片数目成爆炸式增长,用户对图片检索的需求也越来越大,而传统的检索技术依赖于文本检索,由于视觉特征和文本信息之间存在语义鸿沟,传统的方法并不能达到检索精度指标,基于图片内容的检索技术应运而生并有了长足的进步基本的Bag of Visual Word图片检索模型使得大规模的基于图片内容的图片检索成为可能,但是犹有不足和亟待改进之处主要表现在:一是高维视觉特征被量化为视觉关键字时因降维而带来的信息丢失,导致特征的区分力下降;二是传统的BOV模型以单个特征描述符为单位,忽略了特征描述符周围的上下文信息本论文针对上述两方面展开工作,引入了海明码和软量化技术来改善因量化而引入的信息损失,提高单个特征描述符的判别力为了描述单个描述符的上下文信息,本论文先引入了<均值,方差>距离,然后在此距离定义基础上将K-means聚类生成的无序的视觉码书构建成一个无向图,对该无向图适用改进的Prim算法计算最小生成树,以顶点的输出顺序为新的视觉码书顺序,然后以单个描述符的Hessian-Affine区域为上下文区域,对落入此区域的描述符计算区域面积描述符密度尺度角度还有关键字id相关的参数统计量检索过程中依照参数统计量的一致性重新估计相似度和权重,消除误匹配影响,提升检索精度本论文工作还包括搭建完整的图片检索系统,并在Holidays UKBench等数据库上进行实验验证实验结果表明基于参数统计量的图片检索模型有效提高了系统的搜索准确率,在运行时间上也满足系统的实时需求