基于GA的分类规则挖掘技术的研究与应用

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:harryxu200x
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是多学科技术的集成,主要包括数据库和数据仓库技术、统计学、机器学习、人工智能等,它的主要目标是从大量的数据中找到隐藏在其中的人们所需要的信息。分类数据挖掘则是从源数据的训练样本集中挖掘出已经有类标识的数据与类标识之间的对应关系,总结这种关系,以便对未知类标识的数据进行分类。遗传算法是一种全局随机搜索的最优化算法。本文主要是利用遗传算法对数据挖掘中的分类数据挖掘进行研究。首先,回顾了数据挖掘技术的产生和发展、数据挖掘的基本概念和基础理论,着重讨论了分类数据挖掘的概念、过程、基本技术以及其评价标准。接着,对遗传算法进行了讨论,分析了遗传算法和自然选择之间的关系、简单遗传算法的基本方法、遗传算法的理论基础以及存在的问题。通过对数据挖掘和遗传算法的研究,发现了利用遗传算法来解决数据挖掘问题时,普遍存在的问题,比如,分类规则之间的冲突、较大型数据库效率问题、遗传算法的早熟收敛以及遗传编码问题等。为了解决分类数据挖掘算法中普遍存在的规则之间冲突的问题,提出了一种冲突解决策略。为了克服简单遗传算法的早熟收敛问题,利用三交换启发式交叉算子和三交换变异法,对简单的遗传算法进行改进。为了有效的解决分类挖掘编码困难和对于较大型数据库效率较低的问题,提出了一种基于矩阵解码遗传算法的分类规则挖掘算法。最后,利用car evaluation数据集进行验证,用分类算法的四个评价标准,对本文算法和J4.8算法进行比较,结果表明,本文算法明显优于J4.8算法,证明了本文算法的可行性及有效性。
其他文献
及时、全面掌握网络舆情信息是当前各级地方政府要解决的一个关键问题。本文根据绵阳市政府舆情监测的实际需求,设计并实现了基于领域本体的舆情监测系统。   通过利用小
随着计算机图像及视觉处理技术的飞速发展,智能视频监控逐渐成为备受关注的前沿课题之一。智能视频监控指的是在不需要人为干预的情况下,利用计算机视觉和视频图像分析技术对
随着通信产业的快速发展,如何实现绿色通信已成为当今社会亟待解决的问题。为了降低认知无线电网络中的能量消耗,提出一个面向网络基站的节能机制。本文针对集中式认知无线电
UML类图是软件建模中最常用的图形化表示之一。类间二元关系是UML类图中的重要组成部分,它包括关联、聚合、组合关系等。鉴于UML在软件建模中的广泛应用,在软件的开发维护过程
近代科技高速发展,信息量正在呈指数级增长,有效处理海量数据是用户获得有效信息的瓶颈。人们的社交范围越来越大,发现复杂网络的社团结构,对分析复杂网络的性质及功能,获得
伴随着网络上的服务数量日益增多,如何对这些功能类似或者功能相同的语义Web服务进行有效区分成为人们亟待需要解决的问题。近年来,开始采用QoS作为标准对服务进行评价与衡量
随着我国经济建设的飞速发展和人民群众的需要,国家对公路等基础设施的建设日益重视,在交通领域的投资也逐年增加,进一步促进了公路交通事业的快速发展。交通事业的加快发展
给定图G、查询结点v以及用户指定的k值,k核心子图查询用于从G中返回包含结点v且任意结点的度均大于或者等于k的一个子图。k核心子图主要应用于朋友推荐、社交网络中的广告宣
机器人视觉系统是模拟人眼的视觉系统,采集各种场景的图像信息,在实际应用上起着关键性的作用。由于机器人视觉系统在获取图像的过程中,受到环境噪声、光照和图像存储的影响,
随着人类基因组计划的完成,人类进入了后基因组时代,基因组研究的重心转向基因组信息分析,而基因剪接是真核基因组信息分析中的一项重要内容。同时,海量生物数据的出现,促使生物信