决策树分类算法的研究与改进

来源 :郑州大学 | 被引量 : 0次 | 上传用户:chenwoyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘又称数据库中的知识发现,是数据库研究最活跃的领域之一。通过数据挖掘可以从数据库中提取出可信、新颖、有效并易于理解的知识、规律或高层信息。发现的知识可用于决策、过程控制、信息管理、查询处理等方面,因此数据挖掘的技术和应用有了飞快的发展,正日益引起国内外学术界和产业界的广泛关注。 数据分类是数据挖掘中一个重要的内容。分类的方法很多,其中决策树是一种常用的算法。与其他分类算法相比,它能够较快的建立简单、易于理解的模型,容易转换成规则,而且具有与其他分类模型同样的,有时甚至更好的分类准确性。 本文主要对决策树分类算法展开研究,主要包含两个内容: 1.研究了SLIQ算法和SPRINT算法。因为这两个算法可以说是目前决策树算法中最有效的。其中主要对两个算法分别在串行、并行情况下的执行时间进行了分析、比较,得出了一些建设性的结论。 2.对SLIQ算法和SPRINT算法进行了改进。目前这两种算法所处理的都是固定大小的训练集。将增量式学习的方法与建树算法相结合,使其能够处理不断生长的训练集,提高算法的实时、有效性。本文还证明了改进算法的正确性。
其他文献
在通信设备中广泛使用嵌入式系统作为通信控制部件。随着网络应用的快速增长,对承担网络传输的通信设备提出了快速、支持多业务、支持多协议的要求,致使现代通信设备中的嵌入
嵌入式操作系统(Embedded operating System)最初出现于上世纪八十年代,随着其应用领域的不断拓展和需求的不断增长,近年来相关技术的研究和系统开发受到了越来越多的关注,为数
随着无线通信技术、嵌入式计算技术、微机电系统等技术的进步,无线传感器网络技术得到快速发展。从无线传感器网络概念提出起,许多研究机构和学者对其做了大量的研究,并取得了不
CBIR是一种从图像本身出发,通过提取图像的低层视觉特征来检索出相似性图像的方法,在医学图像检索领域得到了广泛的应用。但医学图像具有难以识别、分类准确度要求高等特点,导致
遗传算法作为一种实用、稳健的优化搜索算法,已渗透到许多学科及工程领域,在数字图像处理中的应用亦日趋广泛.在图像边缘特征提取中,遗传算法的研究还有待深入,该文对遗传算
在当今的IT领域,Web服务技术正在日益受到关注。现在普遍认为Web服务是新一代应用程序的集成,通向新的商业模式的大门,是企业之间相互联系的前所未有的重要途径。但是,调查显