基于遗传算法的k-means聚类挖掘方法的研究

被引量 : 30次 | 上传用户:wodeblog1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是随着信息技术不断发展而形成的一门新学科,是信息处理和数据库技术领域的一个新兴的研究热点。数据挖掘的任务是从海量数据中发现隐含的有用知识,为科学决策提供支持。聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法,目标是在没有任何先验知识的情况下,将数据集划分成不同的类,使得相同类中的对象尽可能相似,不同类中的对象尽可能相异。k-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。然而,k-means算法具有对初始值敏感、易陷入局部极小值等缺点。针对这些缺陷,本文结合遗传算法的思想,提出了一种基于遗传算法和k-means算法的混合聚类方法,并通过仿真实验验证算法的有效性。本文工作主要体现在以下几个方面:首先,详细介绍了聚类分析技术,对现有的聚类算法进行了分类,分析了这些算法的优缺点,并在此基础上,重点研究了k-means算法。其次,全面介绍了数据挖掘中的一个重要算法——遗传算法。对遗传算法的特点、基本要素、工作流程等进行了详细描述。再次,基于遗传算法和k-means算法的特点,提出了一种改进的遗传k-means聚类算法,并从编码方法、适应度函数的构造、选择算子、交叉算子和变异算子的设计、k-means优化操作等方面对提出的算法进行了详细描述。最后,为了测试本文提出的聚类算法的性能,本文用k-means算法和改进的算法进行了三组实验,并对两种算法的聚类结果进行比较,实验结果表明本文算法能够有效地解决聚类问题。
其他文献
添附是物权法上确定所有权取得的一项重要规则,同时也与债法中的不当得利、违约责任、损害赔偿等制度密切相关。房屋租赁中的添附主要表现为不动产与动产的附合,它虽以租赁合
莎士比亚是世界级的著名文学家和戏剧家,一生创作出很多脍炙人口的作品,并对后世的创作产生跨时代的影响。《仲夏夜之梦》是莎翁四大喜剧之一,同时也是其最具有浪漫主义情节
人口集聚度作为一个综合性人口状况指标不仅准确反应了区域人口集聚程度,也是该区域资源环境承载能力、区域现有开发密度、区域未来开发潜力的基本反应,它既是主体功能区划的
葛兰西的政治哲学创造是20世纪马克思主义政治哲学形态更新的一个缩影。他不仅研究抽象的理论,而且研究实际的运动,为马克思主义政治哲学搭建起整体框架;他在"伦理国家"这一
新《民事诉讼法》以检察建议的方式赋予同级检察机关民事检察监督权,可以平衡上下级检察机关的监督职责,缓解只能以抗诉的方式进行监督所造成的监督资源分配的紧张关系。与抗
行政给付是解决社会贫困问题的重要手段,也是政府的职责所在。在构建和谐社会的今天,行政给付的意义更为重大。因为和谐社会的要义就是要构建一个人与人和谐相处的公平社会,
随着中国城市化的快速发展,出现了大量的失地农民。由于中国长期的城乡二元结构以及相关法律制度的不完善,失地农民的基本权益如自主选择权、土地权益、就业权益以及社会保障
改革开放三十年来,我国经济建设取得了举世瞩目的成就,社会取得了长足发展,各种体制改革也在紧锣密鼓的进行。而在当下,三农问题持续升温,党中央连续六年以“一号”文件的形
目的:探讨全髋关节置换术(THA)后,翻修术中髋臼骨缺损处理方法和髋臼假体的选择及早期疗效。方法:对2004年8月至2007年10月期间在我院骨关节科行全髋关节翻修术中处理的髋臼
当前,我国新型毒品违法犯罪来势凶猛、发展迅速。一方面是新型毒品的滥用日趋突出,吸食人群和场所迅速扩大;另一方面是新型毒品的制造、走私和贩卖来势凶猛。研究新型毒品滥