论文部分内容阅读
在基于目标函数的模糊聚类算法中,模糊C-均值聚类算法得到了丰富的理论研究和广泛应用。它通过迭代和爬山技术来寻找问题的最优解,是一种局部搜索算法。然而,该算法对初始中心很敏感,易导致一致性聚类。协同聚类算法利用了不同特征子集之间的协同关系,可提高原有的聚类性能。本文将协同聚类算法和以模糊C-均值聚类算法为基础的改进算法结合,来解决特征属性完备性和隶属度取值随意性的问题。本文的主要工作如下:模糊C-均值聚类算法及其改进算法都是基于概率约束的聚类方法,所采用隶属度的取值形式体现了数据集的绝对隶属程度,常出现不理想的聚类结果。本文通过两个基于相对隶属程度的判断准则参数,表示数据对聚类簇隶属关系亦此亦彼的不确定性,将迭代过程中数据集对聚类簇隶属的可能性与不确定性关系引入目标函数中。再与协同聚类方法相结合,提出了一种协同的可能性模糊聚类算法(C-FCA)。该方法先进行特征选择,并对子集的差异性和相识性进行度量,利用不同特征子集之间的协同系数,说明子集之间的关系程度,再采用隶属关系不确定的聚类算法(UMPFCA)在中数据对某个类的隶属度程度不会受到其他聚类中心的牵制。该算法解决了因模糊聚类算法隶属度取值的随意性而导致的实际聚类效果不理想、容易出现聚类中心重合的问题,达到明显的优化聚类结果的功效。理论分析和实验结果表明,相对其他聚类算法,新算法具有更高的聚类正确率。