论文部分内容阅读
聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支。它己经被广泛地应用于模式识别、数据挖掘、决策分析和预测等许多领域。引入模糊理论的模糊聚类分析为现实数据提供了模糊处理能力,更能客观地反映现实世界,从而成为聚类分析研究的主流。
本文对模糊聚类分析进行了研究,主要做了以下工作:
1)对模糊C-均值(Fuzzy C-Means,FCM)与遗传算法相结合的混合聚类算法进行了研究。用遗传算法求解,其关键的问题是染色体编码、个体适应度评价、遗传算子的设计以及遗传参数的设置,本文给出了关于这些问题的一种新的设计方法,在文献[26]的基础上提出了一个改进的遗传模糊混合聚类算法(HGFA)。并用MATLAB进行仿真实验,结果表明,这种改进后的算法能够有效的提高收敛速度,改善聚类效果。在收敛速度和对初值的敏感性方面HGFA算法明显优于FCM,在聚类质量及收敛速度上优于原有算法。
2)对改进的遗传模糊混合聚类算法(HGFA)的应用进行了研究。本文将HGFA算法分别应用在了超市会员聚类和灰度图像二值化中。用HGFA算法对超市会员进行聚类,能够得到与实际完全相符的聚类结果;用HGFA算法对灰度图像进行二值化处理,不需要设定阈值,可以较好的分离出目标图像,另外这也说明了HGFA算法在处理大数据集时的有效性。