数据挖掘中基于遗传算法的K-means聚类算法的研究及应用

被引量 : 0次 | 上传用户:sdrb_123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和数据库技术的迅速发展,人们日常生活中的数据呈爆炸式增长。数据挖掘作为一项从大量数据中提取有用信息的技术,为人们根据数据进行科学决策提供了重要帮助。聚类分析是数据挖掘的一种基本分析方法,它是一种无监督的分类方法。通过聚类,可以在无任何先验知识的情况下将大量数据分成不同的簇,使得簇内对象非常相似,簇间对象不相似,从而发现大量数据之间有趣的模式。在数据挖掘中,聚类分析是一种常用的分析方法,而K-means算法是目前最流行的基于划分的聚类算法。该算法的缺点是容易受初始聚类中心的影响而导致过早收敛于局部最优解。为了解决这一问题,本文利用遗传算法全局寻优的优点,提出了基于自适应遗传算法的K-means聚类算法和基于DNA遗传算法的K-means聚类算法,并用样本数据仿真验证了算法的有效性。本文的主要工作如下:1)结合遗传算法和K-means聚类算法两者的优点,设计了一种基于自适应遗传算法的K-means聚类算法。此改进算法首先利用遗传算法的全局寻优能力得出最优的初始中心,然后利用K-means聚类算法进行聚类,得出最佳聚类结果。2)针对K-means聚类算法对初始聚类中心敏感的问题,提出基于DNA遗传算法的K-means聚类算法。利用DNA编码设计了两种交叉算子很好地保证了种群在进化过程中的多样性,使得算法不易早熟收敛。提出了一种新的逐级进化策略,该策略明显增强了算法的全局搜索能力。最后利用Rosenbrock测试函数验证了算法的有效性,再利用样本数据验证了聚类结果的准确性。
其他文献
中小企业,尤其是科技型中小企业是世界各国经济发展的主要动力,在世界各国的创新体系中发挥着重要的作用。2012年,我国更是首次在《国民经济和社会发展“十二五”规划纲要》
我国全面实行素质教育,要求教师以培养学生的创新精神和实践能力为重点,造就"四有"的劳动者为目标。传统意义上的教师素质的内涵不能满足培养新型劳动者的要求。教师的职业素
<正>1概述焊接技术是船舶建造工程的关键工艺技术,是建立现代造船模式的支撑技术。焊接技术的发展带动了造船技术的进步。20世纪初,由于船舶业引进了焊接技术,造船模式由整体
技术性贸易壁垒(TBT)已成为阻碍当代国际贸易发展的重要因素,对出口国特别是发展中国家的出口企业带来了广泛、持续与频繁的影响。因此,对TBT的实施及其效应的理论与实践研究
随着我国国民经济的不断发展,中小企业已成长为推动国民经济发展的重要力量之一,其自主创新能力在提高产业竞争力和促进科技进步中起到了重要作用,尤其是在建设创新型国家的
目的:通过多种方式,对阎洪臣教授临证思维进行研究,以期进一步总结阎洪臣教授学术思想。方法:通过跟师临证学习、整理病历、搜集资料、老师口头传授、研读阎洪臣教授论文著作等方
文章论述了农村消防工作的现状,对存在的薄弱环节进行了分析研究,提出了加强当前农村消防工作的一些对策。
进入21世纪以来,各国对发展文化产业日益重视,文化产业对国民经济的贡献率不断上升,成为经济发展的新亮点。韩国在亚洲金融危机之前主要是以发展农业和工业为主,亚洲金融危机
圆形思维,由来已久,是中国几千年传统文化沉淀的结晶。由圆演绎出的抽象哲理丰富多样,它不仅包含着先人对宇宙生命的认识,还包括对修身、齐家、治国的多方位理性思考。在古代
近年来,我国跨界流域水权冲突问题日益凸显,流域所流经的行政区域在水质和水量上存在着矛盾和冲突,流域上游污染下游受害,上游用水下游枯竭的冲突现象频繁发生。严重的跨界流