基于遗传算法的数据挖掘技术的应用研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:x1026221496
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和网络的普及,我们能方便获取我们关心的所有信息,在很多领域,都存在这些急速增长的以不同形式存在的数据,仅靠人们对数据库的查询或检索得出的数据往往不能得出我们所需要的归纳性的结果。如何根据所获得的海量的数据信息做出关键的决策,找出它们之间的结构关系,从而进行正确的管理和行动,这就涉及到数据挖掘。数据挖掘的目的,是在数据库中提取潜在的,有用的信息和知识。要是把这个数据库当作一个搜索空间,数据挖掘算法则就是搜索这个空间的策略。一般来说,数据库是很庞大的,即搜索空间很大,所以,挖掘算法这个搜索策略必须是高效的。聚类分析是数据挖掘技术的重要任务之一和主要研究领域之一,在识别数据内部关系方面具有重要的意义,主要研究如何在没有训练的条件下把对象划分为若干类。一般的数据库都是大型的,传统的聚类分析方法不但工作量巨大,而且不能保证最优的聚类分析结果。遗传算法模拟自然进化过程,从而搜索到最优解,对全局信息的有效利用是它的最大特点。我们只需通过较少的结果来反映出搜索空间较大的区域,有利于同步处理,具有较强的鲁棒性,可以防止结果陷入局部最优。本文就用遗传算法的这些特性来解决聚类分析中的动态确定聚类数目及其全局优化问题。k-means算法是聚类分析中的一种经典算法,但是它容易受到初始聚类中心的影响而得不到最优解,是一种局部的搜索技术。遗传算法具有良好的全局优化的能力,将遗传算法与k-means算法结合起来,能很好解决这一问题。当然,传统的遗传算法对k-means算法进行改进时也有自身的缺陷,即容易发生早熟现象,而且在进化的后期搜索效率比较低。因此本文引入免疫原理和自适应遗传算法,对传统的遗传算法再进行优化,使算法更加高效。最后将改进后的算法应用到实际的图书管理系统中去,得到良好的聚类效果。
其他文献
随着人口的增长和社会经济的快速发展,社会对土壤的产出比不断加大。在投入一定的情况下怎么提高土壤的产出已是当前精准农业主要解决的问题。数据挖掘致力于解决从海量数据
近年来,利用手机终端进行产品推介已经在许多工业产品、餐饮、娱乐、旅游等产品中得以实现,但就农产品领域来说,还处在一种摸索、起步的阶段。由于农产品的产销过程环节多、复杂
学位
无线传感器网络是由大量具有无线通信与计算能力的微小传感器节点构成的自组织分布式智能系统,它综合了传感器技术、微机电技术、嵌入式计算机技术和现代无线通信技术,成为了
无线Mesh网是一种新型宽带无线接入系统,可以看作是WLAN和移动AdHoc网络的融合,具有可靠性、自组织性和自愈性等特点。由于无线Mesh网络拓扑结构的动态变化以及无线信道的不稳
随着计算机网络的迅速发展,计算机网络技术的应用越来越广泛,其规模也越来越庞大;安全事件层出不穷,安全形势日益严峻。信息安全态势相关技术能够综合各安全因素,全面、整体地反映大规模网络的信息安全状况,并能够对其发展趋势进行预测。目前,信息安全态势的相关技术研究已经成为网络信息安全领域的研究热点。本文概述了电力信息安全态势研究的基本内容,设计并且实现了电力信息安全态势分析系统,该系统所包含的功能模块自下
在当今信息化高度发达的社会里,人们可以享受到信息化技术所带来的诸多便利,如网上购物、网上银行、远程办公等。同时,各种各样的非法信息,如色情、暴力、反动、封建迷信等,也通过
农业机械化是现代农业的重要基础。在我国,农机作业服务十分普遍,但由于农机作业受价格、天气、面积、距离、路况、作业能力等诸多因素影响,仍然存在着作业地点盲目选择、作业成
作者识别是一个应用广泛的研究领域,可以应用于中外文学作品的作者考证领域,也可以应用于版权保护、恶意邮件识别等信息安全领域。对于近年来在文学创作、论文写作等学术领域
随着国家大力推进互联网、广播电视网、移动网的三网融合,有越来越多的视频数据需要畅游于三网之间。然而,三网间网络带宽、播放设备以及播放软件各不相同,因此需要对视频进行转