论文部分内容阅读
模糊集(Fuzzy Sets)和粗糙集(Rough Sets)是数据挖掘中解决不精确性和不确定性问题的有效工具。由于在人们产生大量数据时,数据本身会具有不确定性,同时在人们所要解决的问题中会存在模糊性的概念,所以基于模糊集和粗糙集进行数据挖掘方法的研究是十分必要的。众所周知,粗糙集模型需要对连续型属性的数据进行必要的离散化处理,为此必将带来一定程度上的信息损失。结合模糊集理论和粗糙集模型的模糊粗糙集模型可以更好的处理具有连续型属性的数据。扩展了传统粗糙集模型的决策粗糙集(Decision-Theoretic Rough Sets,DTRS)模型更被广泛运用。因此如何结合模糊集理论和决策粗糙集模型对具有连续型属性的信息表进行属性约简和分类是值得研究的问题。作为模糊理论中的模糊聚类分析也受到广泛关注,尤其是用于图像分割的模糊C-均值(Fuzzy C-Means,FCM)聚类算法。FCM聚类算法是最小化加权误差平方和的迭代无监督聚类算法。FCM算法的软性划分特性真实地反映了图像像素归类时的模糊性和不确定性,从而使得其性能优于传统的硬聚类方法。但是FCM算法在做图像分割时仍存在着一些问题。一方面是聚类数及聚类中心难以确定,糟糕的初始数据会对FCM进行图像分割结果产生影响;另一方面是FCM算法对图像相邻像素间的空间信息缺乏利用,可能导致分割模型并不完整。本文分别针对上述的几个问题进行研究和改进,主要工作如下:引入模糊隶属度函数来改变计算DTRS模型中代价损失函数中的条件概率计算方法,得到模糊决策粗糙集模型(Fuzzy DTRS,FDTRS)。基于新的模型,进行属性模糊化处理、约简以及根据决策进行分类。实验表明,该方法是行之有效的。在利用FCM算法进行图像分割之前,我们提出用扩展的决策粗糙集模型(DTRS)做聚类有效性分析。这样可以确定最佳聚类数目和聚类中心,从而避免遇到在利用FCM算法时的盲目初始化问题。实验表明,该方法是行之有效的,并且比其他一些方法更具优势。我们提出结合FCM聚类和图割理论的图像分割方法。将图像预分割成超像素集合,其次用FCM算法进行图像分割,根据聚类结果和超像素邻域关系构建图模型,定义边的权值,从而达到充分利用图像的空间信息进行后续分割的目的。实验表明,该方法能够取得良好的分割效果。