论文部分内容阅读
聚类分析是数据挖掘中的一个分支,模糊聚类是聚类中的重要方法,已经取得了丰富的成果,其中的模糊C-均值(FCM)算法具有良好的性能和广泛的应用价值。然而,FCM算法对初始聚类中心的敏感问题影响了实际应用的质量和效果。本文针对这一问题展开研究,并将研究成果应用于安徽省淮河流域水文分区。主要工作如下:(1)研究分析了数据挖掘及模糊聚类的现状及存在问题,描述了模糊理论中的相关方法。(2)研究了神经网络和模拟退火聚类算法。分别对基于模糊逻辑的神经元网络聚类和使用Cauchy训练的模拟退火聚类算法进行了单独和混合实验,对聚类过程中能量的变化、聚类有效性和聚类耗时等方面做出了分析和总结。(3)在研究分析FCM模糊聚类算法的基础上,提出了模糊聚类算法NFC。该算法首先运用基于模糊逻辑的神经元网络和Cauchy训练的模拟退火聚类算法求解初始聚类中心,然后运用FCM进行聚类,解决了FCM对初始聚类中心敏感和局部极值的问题,在随机给出初始聚类中心的实验中有效率高达99%。(4)将所提出的NFC算法应用于安徽省淮河流域的水文分区。对采集的124716个原始水文数据,首先采用主成分分析法获得主成分属性,然后运用NFC算法聚类。实验表明,与传统分区方法相比,有效地改善了时间性能,提高了求解精度,为水文站网规划做出了有益的尝试。