论文部分内容阅读
模糊聚类由于引入模糊集合理论,才能处理事物的不确定性和模糊性,才能更客观的反映现实世界,成为模式识别的一个重要分支,目前己经被广泛应用于许多的领域中,比如数据挖掘、图像处理等领域。迄今,模糊聚类技术已经形成庞大的体系。而基于目标函数的模糊C均值聚类(FCM)算法是一种实际应用比较广泛的模糊聚类技术。FCM算法虽然具有设计简单、快速高效、易于实现、数学基础深厚等优点,但是仍然存在许多薄弱环节和不足,比如无法自动来确定聚类个数、聚类结果比较依赖初始化聚类中心、对孤立点及噪声比较敏感、容易陷入局部最优等。对FCM算法进行了深入的学习和研究,针对FCM算法的两个缺点:需要预先确定聚类数与对初始化聚类中心比较敏感,分别提出了相应的解决方案。本文主要的研究工作如下:(1)最佳聚类数的确定问题常常可以转化为聚类有效性的决策问题。针对FCM算法无法自动确定最佳聚类个数的问题,我们提出了一种新的模糊聚类有效性指标,简称为COD指标。该指标首先重新定义了类内紧致性的度量,降低了运算量;其次引入了清晰度来度量模糊划分结果是否分明;最后基于模糊聚类的类内紧致度、类间重叠度和类间清晰度三部分定义COD指标。实验结果表明该指标能够有效的识别出数据集的最佳聚类数,尤其是对有明确分离的部分中又包含明确分离的子类或包含重叠子类的数据集。(2)针对FCM算法对初始化聚类中心较敏感的问题,我们提出了一种改进的FCM算法。该算法引入粒子群优化算法(PSO),借助它较强的全局寻优能力和较快的收敛速度等优势代替FCM算法寻找初始聚类中心,并从数据集类内紧致性和聚类中心类内紧致性两方面因素对适应度函数进行设计。实验结果表明改进的FCM算法在一定程度上解决了FCM算法对初始模糊划分矩阵敏感而容易陷入局部最优解等问题。(3)根据COD指标和改进的FCM算法,提出一种基于灰度图像的自动分割算法。该算法首先利用COD指标对图像进行有效性评估来获取图像的最佳分割数目,其次将得到的最佳图像分割数目结合改进的FCM算法,最后将其应用到图像分割。实验结果不仅验证了该算法的有效性,而且取得了较好的分割效果。