论文部分内容阅读
在计算机视觉领域,图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易被理解和分析。图像分割通常用于定位图像中的目标和边缘(线、曲线等)。更精确来说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。目前已经出现了上千种图像分割的方法,但没有一种图像分割方法对于所有的图像都具有很好的分割效果。图像分割是由图像处理到图像分析的关键步骤,其分割结果的优劣将直接影响到随后的图像分析、图像理解以及景物的恢复,所以图像分割具有其重要性和现实意义。在本文中,我们将自然图像的分割转化为将纹理特征作为多元混合数据的聚类问题。我们使用高斯混合分布来建模纹理特征的分布。然而不像大多数已有的聚类方法,我们允许混合成分是退化或趋于退化的。我们认为这种假设对于图像分割是特别重要的,在图像分割中我们通过使用一种对不同纹理的共同特征表达式来引出退化的概念。我们的目的是在一个给定失真条件下,找到一个最优分割来最小化分割数据的全局编码长度。通过分析混合数据的编码长度或编码率,我们正式建立一些数据分割与有损数据压缩以及率失真理论这些概念之间的联系。我们认为对于压缩混合数据而言,一个明确的分割应该是其近似(渐进)的最优结果。所以,我们提出一个非常简单且有效的算法,它仅依赖于一个参数,且允许失真。在任何给定的失真条件下,该算法能自动判断相应的群集数量和维度,且无需任何参数的估计。仿真结果揭示了当改变失真水平或奇异值数量时,分割数量的类相变行为。通过有损数据压缩方式得到的简单的凝聚聚类算法可以有效地分割诸如混和分布的情况。使用简单的固定大小的高斯窗口,比如纹理特征,该算法通过减少所有特征向量的整体编码长度来分割图像。我们进行的综合性实验,通过将本文提出的算法与常用Canny边缘检测算法、Sobel算子的梯度算法、K-均值算法和模糊C-均值算法对图像进行分割作对比,以及通过调整本文算法中的纹理阈值λ来优化分割效果去衡量该算法的性能。结果证明运用本文提出的算法分割的图像更接近于人类主观的分割判断。