论文部分内容阅读
随着计算机、互联网以及手持移动设备的快速发展,关于数字图像的应用越来越多。其中,基于内容的图像检索技术是近些年国内外研究的热点之一。本文对基于内容的图像检索的一些关键技术进行了探讨,并针对图像的低层颜色特征提取、低层特征与高层语义之间的语义鸿沟,以及相关反馈算法都提出了相应的改进方法,以适应更加快速更加精准的图像检索需求。针对图像低层颜色特征提取,本文提出了颜色互信息特征(Color Mutual Information, CMI). CMI特征是在颜色相关图的基础上融入了信息论中互信息的概念,充分利用了颜色相关图中不同“颜色对”所具有的空间相关性的特点,使用互信息对颜色相关图特征进行压缩提取。本文将由颜色相关图提取的颜色自相关特征和互信息特征结合使用作为新的图像颜色特征——颜色自相关互信息特征(Color Autocorrelogram Mutual Information, CAMI),该特征不仅弥补了颜色自相关图“颜色对”单一的缺陷,而且减小了特征矢量维数,降低了计算复杂度和图像检索时间,提高了检索精确度。为了减小语义鸿沟并且进一步压缩特征矢量,我们使用支持向量机(Support Vector Machine, SVM)和模糊C均值(Fuzzy C Means, FCM)方法分别对CAMI特征进行语义分类。我们将SVM算法的决策矩阵和FCM算法的隶属度矩阵作为图像新的CAMI-SVM和CAMI-FCM特征。因为SVM和FCM都是基于高层语义的机器学习算法,所以这种处理方式可以减小低层特征与高层语义之间的鸿沟。我们将这两种特征融合成新的图像特征CAMI-SVM-FCM,该特征的特征矢量大小由图像库中定义的类别数确定,当类别数目较少时可以大幅降低特征矢量维数,加快检索时间。本文最后提出了一种新的基于类别权重调整的相关反馈算法用于进一步减小语义鸿沟。该算法对用户反馈的相关和不相关图像集的类别进行统计,按数量多少对相应类别分别赋予不同的奖励或者惩罚系数。实验证明该算法不仅可以大幅度提升图像检索系统的检索准确率,而且可以快速收敛,确保用户使用较少的反馈次数就可以得到满意的结果。基于CAMI-SVM-FCM特征提取方法和类别权重调整相关反馈算法,本文使用Corel 1K作为图像库开发了图像检索系统原型。实验结果表明,经过CAMI-SVM-FCM特征提取后,系统检索速率有了大幅提高。用户使用一次类别权重调整相关反馈后,就可以达到理想的检索效果。