基于遗传算法的知识发现算法研究及应用

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:jonsh123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据在日常决策中的重要性越来越显著,人们对数据处理技术的要求也不断提高,需要对数据进行更深层次的处理,以得到关于数据的总体特征以及对发展趋势的预测。然而数据量爆炸性的增长使得现有的知识发现算法存在着一定的局限性,因此必须对现有的算法进行改进或创建新的算法以适应时代之需。 遗传算法是模拟自然进化的通用全局搜索算法,它具有简单、通用、鲁棒性强和适于并行处理的特点,为其他科学技术无法解决或难以解决的复杂问题提供了新的计算模型。而今,交易数据库在不断地增大,花费在扫描整个数据库的时间会越来越长,效率的低下促使我们必须寻找新的关联规则挖掘算法。因此,本文提出了ARM-GA算法,并针对矿山事故数据库进行了简单的计算和分析,取得了很好的效果。 大家普遍认可:在数据挖掘技术中,决策树是在数据集上发现有价值模式的最高效的方法之一。然而,当需要在大规模数据集上进行规则挖掘时,可比例缩放性和准确率问题却无时不困扰着决策树算法,使它力不从心。为了在有限的计算能力内构建出高质量的决策树、挖掘出实用的规则,本文提出了DT_GA(Decision Tree on geneticalgorithm)算法,它是将随机采样技术、遗传算法和标准的决策树算法集成在一起而生成的。该算法是使传统决策树算法的质量得到提高的一种有力方法。 本文分别对交叉和变异算子给出了新的定义,并取决策树在测试集上的分类准确度作为种群中各树个体的适应值。通过在矿山数据集上进行试验研究,主要对平均计算时间和分类准确度这两个指标进行了考察和分析,发现DT_GA算法:即使在较低的采样水平上也能获得标准决策树算法一样的分类准确度;无论初始种群质量如何,该算法都能产生高准确度的决策规则,且结果具有一致性;该算法具有很好的比例缩放性,对大型数据集的挖掘很有效。为更加适应实际的需求,本文还提出了DT_GA算法可做的改进,并给出了改造后的CAMM算法的大致描述。
其他文献
高校附属医院是目前部分高水平研究型大学的重要的医疗和科研基地。高校附属医院的安全生产不仅事关人民群众的生命财产安全,事关构建社会主义和谐社会,而且还事关我国医学人
<正> 3.用水平仪测量单导轨的扭曲 随着机械加工手段日臻完善,以磨削、精密车削等加工方法代替繁重的手工刮研劳动对机床圆导轨进行修复已日益普及。然而,采用机械加工出来的
复杂系统决策是复杂系统研究的重要分支。系统结构分析是复杂系统决策的重要任务之一。分析结构是对系统内在结构的描述和表达,是解决复杂系统决策问题的基础。论文首先介绍
为保护滨海湿地生境以及保持海洋生态平衡和生物多样性,文章选取我国19处具有代表性的滨海湿地,于2018年5-10月的水鸟繁殖季对滨海湿地水鸟进行调查,并基于调查结果评价其种
在珙县麻塘坝的“焚人”悬棺周围,绘有内容丰富的岩画(多为红色,有少许白色、黑色),这也是史学界研究古代悬棺民族政治、经济、军事和文化风俗的宝贵资料。
期刊
海洋结构导管架的建造和使用都有严格的要求,建造过程操作不当等人为因素会造成母材表面的损伤。为保证使用寿命,钢材表面损伤主要通过壁厚、尺寸外观和磁粉检验进行验收。在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正> 短暂性脑缺血发作(TIA)样脑梗塞已见报告,而 TIA 样脑出血报道极少。本文就我院近两年遇到的临床表现为反复TIA,而 CT 扫描证实为脑出血的3例,分析讨论如下例1:女,55岁
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
<正> 球形垫圈的加工关键在于1mm&#177;0.05mm尺寸(图1)。我厂过去用简单的R形刀靠摇车床刻度来控制车削尺寸,操作难度大,加工不准确。后来采用一种成形刀具和测量工具,即可