基于遗传算法的聚类方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:gonyen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来数据挖掘引起了信息产业界的广泛关注,其主要原因是存在大量的可用数据,并且迫切需要将这些数据转换成有用的信息和知识。通过数据挖掘,可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持。聚类分析是数据挖掘的一项基本任务,是一个无监督的学习过程,聚类的目标是在没有任何先验知识的前提下,将数据聚集成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间有趣的相互关系。在聚类分析中,K-means算法可以说是应用较为广泛的一种算法,但它的一个致命弱点是对初始化非常敏感而容易陷入局部极小值,而遗传算法是一种通过模拟自然进化过程搜索最优解的方法,其显著特点是隐含并行性和对全局信息的有效利用能力,因此,借鉴K-means算法,用遗传算法来解决聚类问题,既能发挥遗传算法的全局寻优能力,又能兼顾K-means算法的局部搜索能力,从而更好地解决聚类问题。本文就是提出了新的混合遗传算法,并以此来解决聚类问题。本文对遗传算法和经典的聚类算法做了深刻地分析、研究,提出了一种改进的基于模拟退火机制的多种群并行遗传算法,利用该混合遗传算法解决聚类问题,并通过实验验证算法的有效性。主要工作包括:1.介绍分析了聚类算法以及遗传算法。介绍了数据挖掘的相关概念、任务、方法,然后介绍了聚类分析的概念、常见算法以及遗传算法的基本概念、研究现状等,并进行了相应的分析。2.提出了一种改进的基于模拟退火机制的多种群并行遗传算法。提出的混合遗传算法利用模拟退火遗传算法,并对其进行了改进(采用动态调节近邻子集大小的方式),再结合多种群并行遗传算法的思想,同时加入小生境技术,从而有效地克服基本遗传算法的早熟收敛等缺陷。3.将改进的基于模拟退火机制的多种群并行遗传算法用于聚类分析。借鉴了K-means算法,并采用基于聚类中心的浮点编码方式,同时考虑到聚类数目k的值通常在事前不能很好地确定,往往根据经验来定,所以本文分别提出了固定聚类数目k值的聚类算法以及可以动态确定恰当的聚类数目k值的相应算法,使得聚类算法具有更普遍的意义。4.测试本文提出算法的有效性。为了测试本文提出的聚类算法的性能,本文采用两组实验数据,分别针对固定聚类数目k的聚类算法以及动态确定聚类数目k的聚类算法进行实验,并与其它的聚类算法,即K-means算法以及基于遗传算法的聚类算法进行效果比较,实验结果显示本文算法有效地解决了聚类问题。由于人们面对的数据是海量的,所以要求聚类算法能够快速准确地解决实际问题。本
其他文献
市场竞争的日益加剧,使得企业使用各种手段来提高自己的知名度,同时降低经营成本。建立门户网站是企业扩大客户群体、为客户提供各种信息服务、树立产品知名度的一个有效手段
新闻视频是人们获取信息的主要媒体,但如何快速、准确地从海量的新闻视频数据中找到所需的内容成为一个迫切需要解决的问题。新闻视频中的字幕高度概述了相关的新闻事件,为新闻
以光纤通信为代表的传输网构架了现代通信最重要的基础网络,为各类电信业务网提供传输通道和对传输通道进行调度保护,对传输网进行管理是整个网络管理系统的重要组成部分。随
数据采集设备是远程自动抄表系统中至关重要的部分。目前国内电力市场流行的数据采集设备大多采用8位单片机设计开发,存在运行效率低、速度慢、可管理存储容量小、可扩展性差
随着计算机辅助设计技术的飞速发展,人们不仅把计算机作为一种实现设计方案的可视化工具,同时已经开始将机器智能应用在设计工作中最为重要和根本的概念设计阶段,激发设计师
数据格式是一个需要关心的问题。就像磁盘有不同的文件系统格式一样,磁带的组织也有不同韵格式。一般备份软件会支持若干种磁带格式,以保证自己的开放性和兼容性。但使用通用磁
随着Internet的普及和WWW的迅猛发展,人们可以通过网络在浩瀚的信息海洋中漫游。然而,由于信息的爆炸式增长,很多Web经验不足的用户经常会“迷失”在其中,他们往往因为找不到所需
随着语义网出现,提出了一个人工智能网络与人类世界结合的远景,作为文化艺术领域内的概念参考模型也经过多年的发展,产生了一些针对文化遗产、可应用在博物馆领域知识底层的本体
Internet的出现和普及使计算机应用已经全面进入Internet时代,软件构件也经历了从传统集中式应用构件到分布式的松耦合网络构件的变革。网络构件是一种崭新的分布式计算模型,是
计算机技术、传感器技术以及通信技术的不断发展,有力的推动了数据采集系统的不断发展和创新。数据采集系统在当今工业设备检测诊断中起着关键作用,本文以宝钢工业技术服务有限