论文部分内容阅读
模糊聚类分析是模糊模式识别范畴中的一个重要分支,是一种无监督的模式识别方法,在许多领域得到了广泛应用。本文研究的主要内容为:首先,对工程上常用的三种模糊聚类方法即模糊等价关系的传递闭包法、模糊相似关系的最大树法和模糊c-均值算法的聚类结果进行比较,从算法本身角度分析了其聚类结果的相似和不同之处,并给出了实用范围。尽管模糊c-均值算法的聚类效果优于前两者,但模糊c-均值算法及其应用的主要缺点是对初始化较敏感,收敛速度较慢,不适合于类与类间样本数相差较大的情形。然后,针对上述缺点,在对模糊聚类方法的相关理论和方法进行较全面、系统的研究基础上,提出了一些改进的模糊聚类方法,主要内容包括:针对模糊c-均值算法的离线学习方法对初始化敏感问题,从递推计算角度,提出了在线递推学习方法;在结合离线学习方法和在线递推学习方法的优点基础上,提出了一种改进的离线学习方法,该方法不仅减少了离线学习方法对初值敏感性,而且加快了目标函数的收敛速度,从而缩短了模糊c-均值算法的聚类过程;针对模糊c-均值算法具有对样本集进行等划分趋势的缺陷,对每类样本数相差较大的数据集,模糊c-均值算法的最优解可能不是数据集的正确划分,本文以少量先验知识作为部分监督信息,再利用样本点分布密度大小作为权值,提出了点密度加权模糊c-均值算法和部分监督加权模糊c-均值算法,并且算法的加权系数的计算和点密度范围限定值的选取都是客观的,仿真结果证明,算法不仅在一定程度上克服了模糊c-均值算法的缺陷,而且具有良好的收敛性,在算法实用范围内,聚类效果有较好的改善;针对聚类分析最主要缺陷是,不管所给数据集的结构如何,它总能将数据集进行分类,本文用聚类有效性函数对算法的聚类有效性进行评价;并用MATLAB语言和国际公认的比较聚类方法性能的典型数据集IRIS以及其它数据集,对聚类算法的聚类结果进行了验证和分析。最后,对模糊聚类方法在模式识别中的应用进行了研究:针对我国地下水质量评价存在的问题,结合模糊聚类法和模糊综合评价法,提出一套从水域划分到水质评价的完整方法,然后将其评价结果与国标的内梅罗指数法的评价结果比较,验证该方法对地下水质量综合评价的合理性;并对模糊聚类方法在图像分割领域的应用进行了初步探索。