论文部分内容阅读
鞋印是刑事侦查的重要物证之一,如何在海量的鞋印数据集中查找到与现场遗留的鞋印同类的图像,是刑事技术迫切需要解决的问题之一。目前的鞋印检索算法没有考虑数据集中图像之间的相关性以及同类图对检索结果的影响,使检索结果在一定程度上缺少语义信息。基于此本文提出了基于聚类的鞋印图像检索算法,目的是通过聚类的手段来提升鞋印图像检索算法的性能。本文主要工作如下:1)提出了基于聚类的鞋印图像检索算法框架本文针对目前鞋印图像检索算法存在的缺陷,提出了基于聚类的鞋印图像检索算法框架。该框架将整体检索过程分为聚类和基于聚类的检索两大部分。在目前鞋印图像检索算法的基础上,加入了数据集中图像之间的相似关系和案发现场存在多幅图像对检索结果的影响,三类数据集的测试实验验证了本文算法的合理性。2)提出了基于K步稳定的鞋印图像聚类算法本文根据鞋印图像的特性,提出了基于K步稳定的鞋印图像聚类算法。该聚类算法主要针对鞋印图像集类别之间存在隔离带的情况而设计的。核心思想是寻找各类鞋印图像之间的隔离带,将各类分开。在两类公开测试数据集和鞋印数据集上的实验表明:本文算法的主要性能指标都超过典型比较算法,其中在包含5792枚鞋印图像数据集上的聚类准确率和F-Measure值分别达到了99.68%和95.99%。3)提出了基于数据集图像聚类的鞋印图像检索算法本文提出的基于数据集图像聚类的鞋印图像检索算法考虑了数据集中两两图像之间的局部关系和同类图像的全局关系,使检索排序得分满足三个条件:(1)检索得分与特征之间的相似性一致;(2)数据集中图像之间的得分关系与其特征之间的相似性一致;(3)数据集中同类图像的检索得分接近。实验结果表明,本文算法的MAP (Mean Average Precision) 和 NDCG (Normalized Discounted Cumulative Gain)指标值分别达到了79.84%和87.15%,较传统算法提高了近20%和12%。4)提出了基于查询图像聚类的鞋印图像检索算法本文考虑了在犯罪现场遗留多幅相同花纹的鞋印图像的情况。根据现场遗留的多幅相同花纹图像的排序得分应该接近这一先验知识,通过考虑多幅现场图像与数据集中图像的综合相似性关系构造排序得分目标函数。实验结果表明,基于多幅查询图像聚类算法的MAP和NDCG指标值分别达到了84.39%和91.89%,较仅根据一幅现场图像检索的算法提高了近30%和20%。本文提出的基于聚类的鞋印图像检索算法较传统算法增加了语义特性,即特征相似图像的排序得分以及同类图像的排序得分都应该相近。在公开测试数据集和实际鞋印数据集上的实验结果表明,该算法对于提升检索结果的性能和主客观一致性具有良好的效果,并已应用到实际系统中。