【摘 要】
:
随着信息技术的发展,数据挖掘技术得到了广泛的应用。分类问题是数据挖掘中的重要问题,分类算法是数据挖掘中的一类常用方法,本文对决策树分类算法进行研究,主要内容如下:(1)
论文部分内容阅读
随着信息技术的发展,数据挖掘技术得到了广泛的应用。分类问题是数据挖掘中的重要问题,分类算法是数据挖掘中的一类常用方法,本文对决策树分类算法进行研究,主要内容如下:(1)通过对几种典型的决策树算法的分析和比较,总结各个算法的特点,建立了一种改进的决策树分类算法。该算法对于那些不容易被区分的属性,计算其决策支持度,以新的理论方法作为属性选择的依据,重新定义算法过程,从而建立了有效的决策树。(2)利用UCI数据库的数据集,将本文建立的决策树分类算法与ID3算法进行实验对比,得到了较好的效果。同时,为了避免选择取值较多的属性作为测试属性的问题,本文还引入了兴趣度α,有效的避免了多值偏向性问题。(3)采集了西安市部分学生的资料,以其所在年级、家庭收入、是否是毕业班及学习成绩为条件属性,以是否报课外辅导班为决策属性,利用本文建立的决策树分类算法建模进行实证研究,得到了较好的分类结果。
其他文献
与有限差分法(FDM)和有限元法(FEM)一样,无网格方法也是求解偏微分方程的数值算法之一。虽然有限差分法的精度较高,但是它需要一个结构化的网格甚至网格集;有限元法具有高度灵活
区间线性系统的解集研究是区间优化理论的基础。迄今为止,关于区间线性方程组和区间不等式组解的研究较为成熟,而对混合区间系统解的探究却不多。因此,研究混合区间系统解的特征
股票市场是现代金融市场的核心组成部分,准确有效的股价分析和预测在金融投资中占有重要地位。随着中国股票市场的迅猛发展,股价分析及预测在国内投资领域受到了广泛关注。由于
设G=(V,E)是一个简单连通图,V和E分别为G的顶点集和边集,则图G的和连通指数是X(G)=∑uv∈E(G)1/√ud+uv其中du和dv分别表示图G中顶点u和v的度数.和连通指数是化学图论中一个
我们首先给出偏相对Hopf群余模的定义并证明偏相对Hopf群余模基本定理.其次,我们介绍偏群Smash积的概念给出偏群Smash积代数和通常的张量积代数成为一个半单Hopf群余代数的充要
改革开放以来,我国经济高速发展,综合国力不断增强,居民收入不断提高,与此同时,在发展过程中也暴漏出不少的问题。经济增长与经济结构、财政收入和居民收入之间具有很强的相
计算机试验的设计理论和建模方法是在经典试验设计基础上发展起来的一个新的方向。借助于计算机试验,能够使得企业在产品的研发和制造中获得设计成本低、上市周期短、性能质量