论文部分内容阅读
模糊 C-均值(FCM)聚类算法是非监督模式识别中应用最为广泛的算法之一。由于该算法是通过极小化目标函数而求得最优解的,而在目标函数中涉及到的两个重要参数(即加权指数m 和聚类数c)值必须事先确定才能得到与数据集结构相符合的划分结果,因此涉及到这两个参数的优选问题。为此,本文首先提出划分模糊度的概念,并在此基础上借助模糊决策思想提出了加权指数m 的一种优选方法。同时,又由于 FCM 算法适用于球型分布的数据集分析,为此本文在定义球型半径之后通过对隶属度的重新定义,提出了基于划分模糊度的聚类有效性函数,实现了聚类数c的自适应确定。实验结果表明本文提出的有关参数m 和参数c的确定方法是有效的。最后,本文利用 FCM 算法对微阵列基因表达数据进行了分析,并把所得结论与基于模型的微阵列基因表达数据分析所得结论进行了比较,结果表明该方法是有效的,从而为 FCM 算法开辟了新的应用领域。