论文部分内容阅读
为了从互联网海量的图像数据中检索出用户所需图像,基于内容的图像检索技术(CBIR, content-based image retrieval)一直是人们研究的热点和难点。而基于区域的图像检索技术(RBIR, region-based image retrieval)是CBIR的进一步发展,它利用分割后的区域形成区域特征向量,允许区域之间相互匹配。该技术不仅迈向了对象层次的检索,可以在对象层次上表示和索引图像,而且在一定程度上减小了图像低层视觉特征和高层语义特征的鸿沟,因此在图像搜索领域具有重要的研究价值和市场应用前景。论文首先介绍了RBIR国内外发展现状,分析其相对于其他检索系统的技术优势。在此基础上,研究了图像检索的关键技术,包括区域分割、特征提取、区域匹配、相似性度量等。接着重点论述了模糊C均值聚类(FCM, fuzzy C-means clustering)算法和综合区域匹配(IRM, integrated region matching)算法,分析了它们的优势和不足,并提出了相应的改进方案。最后将改进后的算法应用在一个图像检索原型系统中,使用查准率和查全率作为评价准则,对比改进前后算法的检索结果。创新点主要体现在以下两个方面:针对FCM算法在图像分割时很难选取最佳m值以及分割鲁棒性较弱的问题,提出了先采用初步阈值分割图像,然后采用FCM算法进一步细分割。在此基础上,考虑像素之间的空间位置关系因素,定义某一像素属于某一聚类中心的概率为两者的空间距离,这样使得图像中的每一个像素同时包含颜色信息和空间信息。传统IRM算法的时间复杂度较大且没有考虑区域面积比因素,导致检索效果欠缺鲁棒性。为此,改进了综合区域距离和显著性矩阵的算法。对区域距离设置阈值并作归一化处理,极大地降低了算法复杂度。同时,考虑图像目标和背景的面积比关系对图像匹配的影响,提出了“有效距离”概念,使得区域面积特征权重增加,达到区域匹配算法中“最相似最优先”的效果。实验结果表明,改进后的算法较好地融合了颜色、纹理和区域面积特征,返回的检索结果中相似的图像排列更加集中,不仅在效果上更符合人眼视觉感受,而且相比其它文献的算法在查准率和查全率上都有明显提高,图像检索系统性能良好。