论文部分内容阅读
近年来,随着信息全球化和互联网化,大量数据的产生出现了信息过载的现象,数据挖掘应运而生,聚类技术就是具有代表性的数据挖掘技术。聚类分析应用于数据挖掘得到了显著效果,但是,随着人们认识的深入,发现这种非此即彼的分类越来越不适用于具有模糊性的分类问题。因此,结合了机器学习以及模糊数学两家之长的模糊聚类技术成为了聚类技术的新宠儿,在聚类精度上取得了突出的成绩。如何从统计年鉴那些浩瀚的经济统计数据中获得较为准确的划分就成了一个难题,尤其是在毫无先验信息的前提下。本文利用基于FCM的模糊聚类算法,以六项宏观经济指标作为划分依据,得出了非常有效的聚类结果,具有很强的实际参考意义。本文围绕模糊聚类技术的研究,主要进行以下研究并列出了相应研究结果:1、介绍了聚类分析技术的概念和一般要求,然后讨论了聚类分析的常见方法,重点描述并实现了经典聚类分析-Kmeans算法,实验发现,Kmeans算法具有局部最优和收敛速度快的特点,但无法保证全局最优,而且对初值敏感,精度表现也中规中矩。2、详细研究了模糊聚类技术,在模糊数学基础上,从模糊关系和模糊划分两方面入手,实现了对两种模糊聚类算法并分别进行了数据集实验。基于模糊关系的聚类可以得出最佳分类对应的最佳阈值或所属区间,但容易出现孤立点问题;基于模糊划分的FCM算法的最终输出是隶属度矩阵,兼具效率和精度,而且聚类结果可以清晰的认识到每个样本属于每一类的程度。3、利用FCM算法高聚类精度的特点,应用在了我国2013年区域经济划分,实验结果揭示了过去的2013年,我国东部、中部、西部发展差距依然存在,地区发展不平衡这个老问题必须引起我们足够的重视。从分类结果看,大体上可以反映我国区域经济发展的真实情况,验证了模糊聚类方法的有效性。在没有任何先验信息的前提下,仅仅从数据本身出发,得出四类发展水平不同的地区,取得了很好的效果,可以为实际经济工作的展开提供前期判断,加快效率。