一种决策树算法研究及应用

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:kongxf04
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据库中用已有的算法对那些有噪声的、不完整的海量数据进行分析、提取,从而可以得到潜在的、隐含在海量数据当中的、对数据操作有用的信息和知识过程就被称之为数据挖掘技术。而决策树算法思想则是数据挖掘技术中常用的一个思想,他在研究数据挖掘过程中起着非常重要的作用,被广泛的用在现实生活的各行各业当中。数据库技术的发展日新月异,随之而来的就是数据库中的数据采集速度和数据存储量的迅猛增加,这就导致传统的决策树算法不能适应当前的庞大数据量。所以,更高效更实用的决策树挖掘算法的研究就显得非常重要。本文对传统的决策树生成算法做了深入浅出的分析和探讨,并阐述了他们的优点和不足之处。在此基础上,论文提出了改进ID3算法,实现了一种基于用户兴趣度和简化信息熵的决策树算法,经过实例比较,新算法在性能上要优于传统的ID3算法。将改进算法应用于农林管理信息库中,为相关部门提供决策支持,有效地发挥出了新算法的实际应用价值。该算法和传统算法的挖掘效果进行对比分析。实验验证前者比后者的优越性要高很多。
其他文献
随着大规模数据存储技术、信息技术和网络技术的发展,人们正陷入数据泛滥、知识贫乏的境地。为满足日益增长的信息需求,聚类分析作为一种主要的数据挖掘技术已经应用到各种领
在图像处理技术中,细胞图像的分割与提取技术是的最为关键技术,,如何使得分割的效果精确也是人们一直以来研究的重点。由于图像之间存在差异性,它们有各自的特点,在实际的应
随着国民经济的迅速发展,我国汽车的数量迅速增加,致使公路交通的负担越来越重。智能交通系统(Intelligent Transportation System, ITS)可以科学、高效地利用好现有交通基础
随着计算机性能的大幅度提高,人们对计算机的要求也不断扩大。计算机获得外部信息主要依靠计算机视觉,运动目标的检测与跟踪是计算机视觉中最热门的研究课题之一。只有先将背景
结合我国统一坚强的智能电网建设需求,为应对电力信息化建设可能出现的海量数据,寻找行之有效的并行且弹性的数据处理技术是解决该问题的关键所在。MapReduce是由Google提出的基于大规模集群的分布式计算框架。Hadoop是Apache开源基金会开发的分布式系统的基础架构,包含MapReduce和HDFS。其良好的扩展性能和简单易用的操作特点,使之成为云计算的主流平台。本文进行基于MapReduc
嵌入式系统的三个基本特征:资源紧凑有限、时间约束严格、成本极度敏感,并且嵌入式软件本身由于需要处理大量中断,许多嵌入式软件性能指标(系统吞吐量、任务处理能力、堆栈深
近年来,随着我国经济的迅猛发展,企业信息化进程不断推进,作为我国经济建设基石的中小企业的信息化建设越来越引起业界的重视。然而,由于中小企业普遍存在着经济实力弱、个性
人脸识别就是利用计算机技术,通过对人脸图像的分析,提取我们所需要的一些特征信息,用来做身份识别或者目标追踪。它主要有三个步骤:人脸检测、特征提取和人脸识别。人脸识别
目前,关于计算机网络系统特性的研究已经成为一个热点,其中对于竞争特性的研究尤其引人关注。关于星形网的运行机理早已介绍。竞争—冲突淘汰(C-CC)存取方式,作为星型局域网
Skyline查询处理是数据库技术领域的一个研究重点和热点,它在多目标决策、数据挖掘和可视化、用户偏好查询等方面有着广阔的应用。Skyline查询输出数据集中不被其它任意数据