多表达式编程在规则挖掘中的应用研究

来源 :石家庄经济学院 | 被引量 : 0次 | 上传用户:yurui4010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一个多学科交叉融合的前沿学科,是信息技术发展过程中的重要成果之一,其理论研究和实际应用都已被广泛关注。关联规则挖掘是数据挖掘中的一项重要任务,用于发现大量数据中项集之间隐含的关联。近年来,随着互联网的迅速普及,数据库规模的不断扩大,关联规则挖掘变得越来越复杂,传统的关联规则挖掘算法已经不能满足当今知识发现的需要。学者们开始将多种算法应用到关联规则挖掘中来,其中演化算法是一种非常有效的方法,并已成为人们关注的焦点之一。基因表达式编程是一种新的演化算法模型,主要借鉴了生物进化中基因表达的方式。多表达式编程是遗传程序设计领域的一个新的扩展。近几年来,多表达式编程因其独特灵活的编码方式,已经被广泛应用在诸多领域,并取得了一定的成果。本文主要研究多表达式编程算法并将其应用于求解关联规则挖掘问题。首先,研究了基因表达式编程和多表达式编程的基本原理和实现技术;其次,详细分析了数据挖掘中经典关联规则挖掘算法的优缺点;最后,针对关联规则挖掘问题,改进了多表达式编程算法,使其能更好的解决关联规则挖掘问题。本文主要工作和创新点概括如下:(1)设计了多表达式编程算法的遗传算子和适应度函数。对数据挖掘中关联规则挖掘进行了深入研究、对传统关联规则挖掘算法进行了详细分析,结合关联规则挖掘问题、多表达式编程的编码方式、多表达式编程算法的优缺点,设计了适应度函数和几种不同的遗传算子。(2)改进了多表达式编程算法。为了更充分的利用算法的优点,更好的弥补其不足,提出了改进的多基因表达式编程算法、改进的多表达式编程算法、改进的多表达式编程与差分演化融合算法、改进的多表达式编程与模拟退火融合算法,并将这些算法应用于关联规则挖掘中。(3)对算法进行仿真实验。通过对实验结果分析,证明了算法在求解规则挖掘问题时具有可行性,并表现出了很多优势。
其他文献
目前,无线Mesh网络已经成为了下一代无线网络中一种非常具有应用前景的新型无线组网技术,它可以为用户提供灵活的自适应无线互联网接入,因此很多新兴的网络运营商都在利用各
计算机处理的数据一般来说基本抽象于客观世界,由于客观世界中事物的复杂性,导致数据结构极其复杂,数据维度极高,这无疑增加了计算机处理数据的难度。Folksonomy是通过用户自
随着信息化技术的不断提高,人们对交通设施以及汽车安全性能的要求也随之提高,智能交通就是在此的环境催生之下产生并发展的。为了提高车辆的主动安全性,在车辆上安装行车辅助系
仿生智能计算是一类模拟自然界生物、生态等系统中“优胜劣汰”行为的模型和算法,具有自适应、自组织、自学习等特点,能够解决传统计算方法难于解决的各种复杂问题。仿生智能计
人类基因组计划目标是完成人类染色体的全部 DNA的测序,这对于治疗遗传病有着重要的意义。现有的技术不可能直接连续测序超过几百个碱基的片段,只能使用散弹枪法获得并测序大
随着云计算的发展,由欺诈行为驱动的窃取云资源和云服务的行为日趋严重,导致云计算资源的拥有者、提供商与被提供服务的用户间出现信任危机,此种危机给云计算的应用与发展带
随着Web2.0和互联网的飞速发展,社交网络呈现爆发式增长。微博作为社交网络的一大重要代表逐渐深入人心,成为网民上网的主要活动之一。正是由于微博具有便捷性、高速度、广泛性
自然语言处理系统的开发在当前数据库智能领域中一直占据着重要地位,该类系统开发的主要目的是使所操作的计算机自主了解用户的输入请求,自动对查询目标进行处置。如何开发先进
信息技术的高速发展改变了人们生活习惯,近年来,人们对基于位置服务的需求越来越强烈。GPS技术的成熟应用虽然能够满足人们对室外定位的各种需求,然而由于GPS信号穿透能力差无法
众多无线传感器网络的应用中,用户常常对某个目标区域内的感知数据感兴趣。例如,用户为了获得一片植物种植区域内的温度或湿度等相关数据。目前,相关的无线传感器网络区域查