论文部分内容阅读
数据分析是探索现实世界的一门重要学科,数据聚类是数据分析的一个有效工具,基于不同理论与方法的聚类方法层出不穷。模糊聚类方法因其能量化模式间的不确定关系,已经发展成为数据聚类领域的一个重要分支。纵观国内外文献,国内外学者通常用单个模糊聚类方法对数据进行聚类,联合多个模糊聚类方法共同对数据进行聚类的研究工作,即组合模糊聚类方法的研究,尚未受到应有的重视,迄今为止,只有Evgenia Dimitriadou等人、Gordon, A.D与Vichi M于2002年分别提出了一个模糊聚类的组合模型。本文在前人的研究基础上,主要研究模糊聚类的组合模型,取得了一些探索性成果,旨在进一步推进组合模糊聚类方法的研究工作。(1)本文首次提出了一个联合多对模糊聚类有效性指标与模糊聚类算法共同识别聚类数的新方法。仿真实验表明,该方法明显优于应用单对模糊聚类有效性指标与模糊聚类算法识别聚类数的传统方法。(2)所有的模糊聚类算法几乎都需要使用者提供初始聚类中心,而初始聚类中心对模糊聚类的结果有着直接的影响。本文应用最小支撑树原理,设计了一个聚类中心初始化算法,该算法较其它聚类中心初始化算法,更能提高模糊聚类的模式识别率。(3)当数据集合的聚类数已知时,不同的模糊聚类算法在同一个数据集合上常常产生不同的模糊聚类,而且,没有哪一个模糊聚类方法在任何情况下总能产生较好的聚类结果。为解决这一问题,本文应用多个模糊聚类方法在同一个数据集合上产生不同的模糊聚类,然后,以多个模糊聚类有效性指标为评价指标,应用层次分析法对它们进行综合评价,从中选出一个最优的模糊聚类,由此提出了一个模糊聚类优选模型。仿真实验表明,该模型能选择模式识别率最高的模糊聚类为最优模糊聚类。(4)模糊聚类优选模型虽然能从同一数据集合上的一组模糊聚类中选出最优者,但是,当它们都不是理想的模糊聚类时,即使选出了最优者也得不到好的聚类结果。模糊聚类优选模型自身无法解决这一问题,为此,本文首先提出了一个基于KNN的类的匹配算法,以此建立来自于不同模糊聚类的类与类间的对应关系,然后,分别将传统的多数票法则,模式识别率与加权多数票法则推广为模糊多数票法则、模糊模式识别率与模糊加权多数票法则,最后,分别将模糊简单多数票法则、模糊加权多数票法则与基于KNN的类的匹配算法相结合,提出了两个模糊聚类的组合模型。仿真实验表明,本文提出的模糊聚类组合模型能结合多数模糊聚类的优势,克服其不足,产生优于参与组合的所有模糊聚类的组合模糊聚类。(5)研究了组合模糊聚类方法在彩色图像分割与系统辨识方面的应用。彩色图像分割的仿真实验表明,基于模糊加权多数票法则的模糊聚类组合方法能结合参与组合的多数单个模糊聚类的优势,克服其不足,在各种情况下都能产生理想的分割效果。综合应用本文提出的聚类中心初始化方法、聚类数的识别方法、模糊聚类的组合模型,以及模糊聚类的优选模型辨识T-S模型的前件,再应用最小二乘法辨识T-S模型的后件,由此建立的T-S模型能准确地辨识非线性系统。仿真实验表明,应用组合模糊聚类方法辨识T-S模型的前件,较之于单个模糊聚类方法辨识T-S模型的前件,提高了T-S模型辨识非线性系统的精度。