论文部分内容阅读
图像分割在计算机视觉领域应用广泛,是图像分析与图像处理中研究的重点和难点之一。生活中常见的图像为彩色图像,与灰度图像相比,彩色图像包含有更丰富的颜色和纹理信息,这些信息的综合利用可以有效提高图像分割的性能。针对不同特征的图像和不同的应用,人们研究和提出了多种多样的彩色图像分割方法,其中基于谱聚类的图像分割方法成为近些年来的一类主流方法,其特点是能收敛到全局最优解且对数据样本空间无限制。基于谱聚类的图像分割方法的关键是合理描述和提取图像的特征,进而建立能准确体现图像像素间关系的相似度矩阵。然而,目前常见的彩色图像分割方法,往往只是简单地将彩色图像转化为灰度图像或者是采用分通道的处理方法,将针对灰度图像的分割方法扩展用于彩色图像分割。常用的基于谱聚类的彩色图像分割方法在建立相似度矩阵时,往往只考虑了彩色图像的颜色信息,而没有考虑彩色图像的纹理、梯度和边界等信息。 本文针对基于谱聚类的彩色图像分割算法中的关键问题展开研究,研究工作主要分为以下几点: (1)四元数工具相对于流行的欧氏距离在描述彩色像素的颜色差别和彩色三通道间的光谱联系上具有明显的优势,本文利用四元数旋转理论来度量彩色像素间的色差距离,提出了一种基于四元数的彩色图像谱聚类分割方法。实验表明,基于四元数的彩色图像谱聚类分割方法的性能要优于基于欧氏距离的谱聚类图像分割方法。 (2)研究了目前流行的谱聚类分割方法只考虑相邻像素和超像素间相似度而造成错分的问题,并利用图论的最短路径法,提出了一种基于全域相似度的谱聚类分割方法。该方法在建立相似度矩阵的过程中,同时计算了相邻和非相邻的像素间以及相邻和非相邻的超像素间的相似度,并利用阈值将获得的全域相似度矩阵进行稀疏化以提高算法的效率。实验结果表明,该方法能准确快速地对图像进行分割。 (3)研究了 Snake模型中的图像力定义的问题,提出了一种基于四元数的彩色Snake图像分割方法。该方法利用四元数旋转理论来描述彩色像素间的色差,从而计算出彩色图像的梯度,并将该基于四元数的彩色图像梯度信息用于定义 Snake模型中的图像力。实验结果表明,基于四元数彩色梯度的Snake模型比基于欧氏距离梯度的Snake模型能更快更准确地收敛到目标区域的边界。 (4)研究了超像素间的相似度计算问题,提出了一种混合控制机制的相似度计算方法。该方法在计算超像素间的相似度时,不仅考虑了相邻的超像素间的相似度,还计算了非相邻的超像素间的相似度。对于同质性较好的超像素,利用四元数旋转理论来计算它们的色差。对于不同质的超像素,在计算它们之间的相似度时,不仅考虑超像素的颜色均值,而且还考虑了超像素的颜色方差信息。同时,该方法利用图像的边界信息对生成的超像素进行合并,有效减少了超像素的数目,降低了相似度矩阵的维度。另外,该方法在计算相似度时,还考虑了图像的梯度信息,使获得的全域相似度矩阵更加稀疏化,有效提高了算法的运行效率。 (5)研究了局部二值模式(LBP)的翻转不变性问题,提出了一种具有翻转不变性的局部二值模式(RLBP)纹理描述算子。流行的LBP算子仅具备平移、旋转、缩放不变性,而RLBP算子同时考虑了顺时针和逆时针两个方向的编码,因此具备翻转不变性。实验结果表明,在纹理图像分割中,RLBP算子比目前流行的LBP算子能更有效地描述纹理的不变性。