基于基因表达式编程的分类算法研究及应用

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:kinds1118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当今计算机应用技术和理论研究中最热门的领域之一,经过二十多年的发展,已经逐渐建立起系统的挖掘理论和成熟的挖掘技术。分类规则挖掘作为数据挖掘的一个重要分支,引起了不同领域学者的广泛关注,其中以遗传算法和遗传程序设计为代表的演化计算方法因为其智能性、并行性、不确定性等诸多特点成为其中一个特殊的分支。基因表达式编程是在结合遗传算法和遗传程序设计的优点的基础上提出的一种新的遗传算法,在数学建模方面取得了非常好的效果并在许多工程领域取得了应用。本文以基因表达式编程和分类规则挖掘为主要研究对象,研究基于基因表达式编程的神经网络和决策树算法及其在分类规则挖掘中的应用。本文的主要工作和成果如下:1.在简要介绍GEP技术主要思想的基础上,分析了基因表达式编程的编码特点及其技术优势的实质,总结了一些比较有影响的GEP分类方法,着重讨论和比较了基本GEP分类方法和精确与简洁GEP分类方法。2.分析指出了传统GEP神经网络方法不能用于二次及以上建模问题的缺陷,并提出了一种混合式GEP神经网络方法,并在此基础上进一步提出了一种改进的GEP神经网络演化方法,实验证明该方法在回归和分类问题中均能取得良好的效果。3.针对GEP神经网络解决多分类问题需要进行数据切分的不便之处,引入GEP决策树算法,并针对该算法在常数数值数组产生策略中的几点不足,提出了一种基于均匀常数分布的GEP决策树算法,实验证明该算法优于传统C4.5算法和标准GEP决策树算法。4.在开源数据挖掘平台WEKA上独立实现了混合式GEP神经网络算法,在开源演化计算研究平台ECJ上独立实现了标准GEP决策树算法和基于均匀常数分布的GEP决策树算法,为针对各种算法的验证和比较提供了支持。
其他文献
由于无线网络应用的飞速发展,数据如何可靠传输成为目前重要的研究课题。TCP协议是目前因特网上应用最广泛的数据传输协议,但由于无线链路与有线链路的不同特性,TCP协议应用
多相图像分割是目前图像处理与计算机视觉等领域的研究内容之一,在医学图像处理,遥感图像处理及机器视觉等领域具有重要应用。由于问题的复杂性,多相图像分割的建设与计算方
医院信息化是提高医院管理效率的重要途径。近些年来,随着计算机技术的飞速发展,计算机信息技术在医学领域逐渐得到了广泛的应用。但是就目前来看,在很多中小型医院中,信息化
随着软件规模和复杂度不断增大,传统的软件开发模式面临巨大的挑战,出现了新一轮的“软件危机”,而软件复用是解决这个问题的有效方法之一。构件技术在软件复用中扮演着重要角色
随着基于Android系统智能手机的日益普及,特别是伴随着3G网络的普及以及4G业务的高速发展,智能手机已经取代了部分电脑的功能逐步融入了人们的生活。当前智能手机已经具备了
非线性动力学系统产生的时间流是目前研究复杂系统的主要依据。非线性动力学复杂系统内部具有确定性的规律,但在现实中的外在表现形式多呈现变量演化、多层次性等特征,系统的结
集装箱码头的堆场部分可分为前方堆场和后方堆场,它的主要作用是为集装箱提供临时的集中堆存。堆场管理是码头生产的一个重要环节,它包括多个方面,主要包括堆存优化和堆场机械调
居住健康的研究理念是在满足住宅基本建设要素的基础上,提升健康要素,满足居住者生理、心理、道德和社会适应等多层次的健康需求,以促进可持续发展,营造出安全、便利、舒适、
21世纪是一个互联网的时代,互联网的快速发展,使人们的生活发生了翻天覆地的变化,人们越来越习惯于在网络上浏览获取信息和发表自己的看法,网络构成的虚拟社会环境成为广大民
交通法中对专用车道或规定路段有严格的规定,不允许除规定车辆以外的车辆在其中行驶。对有限制条件的路段,通常采用人工检测方式,为此需要大量的人力物力,而且这种人工的方法