论文部分内容阅读
基于内容的图像检索(Content-based image retrieval,CBIR)技术在很多应用领域的需求不断增大,例如:数字图书馆、生物医学、军事、商业、教育、以及互联网上图像的搜索和分类。CBIR利用从图像中提取的低层可视特征来检索图像,相关反馈技术和图像的高层语义特征也被用于CBIR,但是,CBIR的性能大大依赖于低层可视特征的表示。因为人们很难准确地表示图像的内容特征,以完全符合人的视觉感知,所以,CBIR中还有很多问题有待解决。 研究图像特征表示,着重研究图像的颜色-空间特征表示、纹理特征表示和边缘特征表示。属于CBIR的基础性研究课题,具有理论和实际应用价值。 主要工作如下: 在颜色-空间特征表示方面,提出了基于多邻域统计矩直方图。在量化HSV颜色模型下,以颜色直方图作为颜色特征表示,计算每个像素点不同邻域的统计矩,对每个邻域的统计矩,计算它的归一化直方图,以这些直方图作为空间特征表示,组合颜色特征和空间特征得到图像的颜色-空间特征表示。该特征表示对图像内的平移、旋转不变。实验结果验证了其高效性。 在纹理特征表示方面,提出了六种新的纹理特征表示,即:方向差单元表示1直方图、方向差单元表示2直方图、方向差单元表示3直方图、旋转不变的方向差单元直方图、梯度单元直方图、旋转不变的梯度单元直方图。它们分别刻画图像的每个像素在不同邻域多个不同空间方向上的显著变化特性。这些特征表示的优点是计算上简便,特征向量维数低,对图像的平移不变,旋转不变的方向差单元直方图和旋转不变的梯度单元直方图还对图像内的旋转不变。从实验结果,可以得到如下结论:对于具有相对规则的纹理特性的图像,方向差单元表示2直方图和梯度单元直方图的检索性能在这六种特征表示中是最好的,它们的性能与Gabor纹理特征的性能相当,且优于纹理谱的性能;对于一般的图像,方向差单元表示3直方图和梯度单元直方图的检索性能在这六种特征表示中是最好的,它们的性能比Gabor纹理特征和纹理谱的性能要高得多。 在边缘特征表示方面,提出了三种新的边缘特征表示,即:极大-极小差直方图、量化极大-极小差直方图和量化模糊熵直方图。前二者利用像素的量化颜色值在其邻域内的极大值与极小值之间的差值来刻画边缘的强度;第三者利用像素在其邻域上的色调值计算得到的动态隶属函数和模糊熵来刻画边缘的强度。这三种特征表示对图像内的平移、旋转不敏感;量化模糊熵直方图还对噪音不敏感。实验结果显示,极大-极小差直方图与量化极大-极小差直方图的检索性能基本相近;对于具有比较规则的纹理特性的图像,量化极大-极小差直方图比量化模糊熵直方图更有效;对于一般的图像,量化模糊熵直方图比量化极大-极小差直方图更有效。 对于组合特征表示,提出了两种混合特征表示,即:组合上述颜色特征表示中的颜色直方图、纹理特征表示中的梯度单元直方图、边缘特征表示中量化极大-极小差直方图或量化模糊熵直方图形成图像的两种混合可视特征表示。这两种混合可视特征表示计算简便,比任何单个特征表示,能够表达更多的图像信息;以它们作为特征索引检索图像,可以取得更好的检索性能。