决策树分类算法及其应用

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:njuchen1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业信息化建设,数据仓库和决策支持系统技术在企业中得到了空前的应用。如何将决策支持系统中的数据挖掘方法应用到企业中成为了研究的重点。论文主要是围绕数据挖掘分类算法中的决策树算法的关键技术展开研究的。本文首先对决策树分类算法做了一个综述。对典型的决策树分类算法的主要特性,优缺点,适用范围,目前的改进状况,决策树算法的应用和展望进行了简要的概述。随着数据处理技术的飞速发展,需要处理的数据规模越来越大,已经从最初的小型数据库发展到现在大型数据库,数据仓库等。这时有效性、正确性和空间性就成为了数据挖掘中主要考虑的特性。在对典型决策树分类算法的研究后,将抽样技术引入到决策树算法C4.5中,使得这种对小数据集有效的算法也能在给定大数据集的情况下挖掘出有一定正确性的分类规则。选择UCI机器学习库的标准数据库为数据源,使用改进的基于抽样的决策树C4.5算法进行分类规则的挖掘。试验表明该方法能在获得满意的正确性的情况下显著的提高数据挖掘的效率。紧接着结合一个钢铁企业的应用背景,将改进的算法应用在了两个大的方面:钢铁企业生产成本关键工序分析和钢铁企业亏损品种分析。第一个应用以工艺路线为切入点,结合钢铁企业的成本分析项目,对生产成本关键工序进行数据仓库建模。采用改进的基于抽样技术的决策树C4.5算法对海量数据进行挖掘,挖掘出工艺路线中的关键工序,影响钢铁企业成本的分类规则。第二个应用结合钢铁企业的销售亏损品种分析项目,对亏损品种分析进行数据仓库建模,挖掘出钢铁企业亏损品种分析的关键影响因素。两个应用为钢铁企业的成本管理提供了科学依据,同时为数据挖掘系统的建立提供了很好的经验。
其他文献
<正>人性中最深切的本质是被人赏识的渴望。作为教师的我们,应深深地明白这一点。于是,在新课改大力推进的今天,我们不约而同地拿起了表扬这个简单而又有效的武器。然而,最近
期刊
搞活企业,特别是搞活国有大中型企业一直是经济体制改革的中心环节。改革以来,我们也一直进行探索。从给企业扩权,实行利润留成,到两步利改税,推行承包制,使企业改革不断深化
护士不仅承受着繁重的工作负荷,更负有“健康所系,性命相托”的重大责任感。因此护士承受着巨大的工作压力。本研究采用问卷调查的方法,对杭州市六所医院的279名医院护士的工
随着我国海洋资源开发和利用的不断深入,海洋环境监测已经成为海洋及环境保护领域重要的研究课题。长期以来海洋环境调查研究积累了大量的多源、异构、多维、动态、海量的海
随着中国全面深入地进行改革开放以及中外文化交流的日益增长,加之新闻传播方式的变化更新,以及新闻翻译活动日趋频繁,新闻翻译的重要性日益突出。同时,对翻译质量的要求也越
贝宁第一大城市科特努经过了两轮的城市规划设计,由于缺少相关的城市设计指导,城市空间规划后没有变得更好,而是变差了。本文根据商业街空间的相关理论与概念,从历史回顾、空
<正>在上世纪80年代后期,日元在广场协议后大幅升值,吹起了人类经济史上迄今为止最大的一个泡沫。泡沫破裂后的15年间,日本都在为这个泡沫还债:经济萧条、政局动荡、犯罪率上