论文部分内容阅读
在公共安全领域,各种监控摄像机及拍照系统遍布城市各个角落,每天获取大量的数据信息。如何高效的从海量的,公共安全数据中获取需要的信息,成为一个新的课题。本文中,就是针对公安部门在办理案件时的刑侦现勘图像数据,使用基于内容的图像检索技术,结合实际情况进行检索实验,并提出改进方法的。从陕西省刑侦局获取了实际案例图片,并预处理选取了八类400幅现勘图像作为实验数据。首先,使用常用的基于内容的图像检索算法,对刑侦现勘图像库进行检索实验。实验中使用了,基于HSV颜色空间的颜色直方图作为颜色特征,三层小波分解系数的均值和方差作为纹理特征,和以上两种特征的融合特征,分别进行检索。在相似性度量环节,分别对比了欧氏距离和街区距离的效果。作为对照实验,使用同样的方法在标准图库COREL中进行了实验,对比实验结果。实验结果显示,常用的基于内容的图像视觉特征,相较于其在标准图库上的检索效果,在刑侦现勘图像数据库上并不适用,所以,研究用于刑侦现勘图像的数据库检索算法具有重要意义。其次,在上述基于内容的图像检索系统的基础上,针对刑侦现勘图像提出了,基于区域语义模板的图像检索框架。这个检索系统分为四个部分,分别是:用户提交查询图像及感兴趣区域,构建区域语义模板,预分类和最终的图像排序。在图库中,使用本体论(ontology)将图库中的不同类别的图像以及图像区域间的语义关系构建一个层次的结构体。使用一个或多个区域-“目标物体”的语义信息来代表整幅图像的语义,通过对查询图像区域类别的判断,加上区域语义间的联系,对图像所属类别进行判断。经试验表明,这样的方法在提高刑侦现勘图像的查准率方面是有效的,这里对比的是不使用本方法的基于内容的图像检索系统的检索结果。最后,为了进一步提高基于区域语义模板的图像检索框架的性能,提出在系统中添加入加权算法。通过使用文本检索中的TF-IDF (term frequency-inverse document frequency)加权算法的思想加上信息熵,计算出每类“目标物体”的权值,即这类区域相对于其所属类别图像所具有的代表性和重要性。通过对权值大小的排序,在预分类环节,帮助判断“目标物体”所属图像类别。计算TF-IDF权值时加上信息熵可克服TF-IDF原本的一些缺陷,但是也造成了新的问题,就是这样的加权算法只能用于具有多个“目标物体”类别图像的权值计算。所以在实验中只适合类的图像检索情况进行了试验,但是实验结果显示这样的改进是有效的。虽然对不同类别的图像,平均查准率提高有所不同。