基于决策树的数据挖掘算法研究与应用

被引量 : 0次 | 上传用户:lzydcx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息处理领域的一项重要课题,它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。分类是数据挖掘的重要功能之一,基于决策树的分类算法在数据挖掘中的应用是非常广泛的。与其他分类算法相比,决策树具有计算量相对较小、易于提取显式规则、可以显示重要的决策属性和分类准确率较高等优点。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、生成树的规模较大等。因此,进一步改进决策树算法,提高决策树的性能,使其更加适合数据挖掘技术的应用要求具有重要的理论和实际意义。针对上述不足,本文进行了深入的研究,将粗糙集理论引入决策树分类当中,对如何优化决策树分类算法进行了探索。本文主要研究工作如下:首先,论文介绍了数据挖掘的相关技术和理论基础,并重点对决策树生成及后剪枝算法进行了分析和比较。其次,从属性约简和剪枝两方面对决策树算法进行优化,提出了基于属性依赖度的属性约简算法ER和基于粗糙集理论的决策树后剪枝算法Prune。最后,将优化的决策树算法应用于供应商评价系统当中,并将该算法与C4.5算法作了比较,验证了该算法的有效性。
其他文献
<正>外交使馆对在驻国微博平台的使用,是一种新的外交模式,它使得国际交流呈现出人格化、民间化、互动化的特色。这种无需中介、直接到达的优势,日益在各国公共外交活动中发
随着近些年来经济水平的不断提高,我国的很多项目都在积极稳定的开展,这种情况对于国家的发展而言具有十分重要的意义以及影响。煤炭作为一种重要的自然资源,为我们国家的发
<正>雄关漫道,承前启后。回望新时期中国广告业的发展历程,可划分为五个发展阶段。一是恢复和初步发展阶段,这以十一届三中全会为标志;二是快速发展阶段,这以邓小平南巡谈话
纳米零价铁(nZVI)结合了零价铁还原性强和纳米材料比表面积大的特点,能够高效去除水体中的重金属和有机污染物,是当前环境科学领域研究的热点之一。研究表明单一nZVI颗粒存在
冷冻面团技术于20世纪90年代由欧美进入中国,现已成为我国食品工业最具发展潜力的技术之一,解决了传统面食货架期短、易老化的难题。着重就冷冻面团技术的影响因素进行综述,
本文首先对IEEE802.15.4协议和ZigBee协议进行了研究,分析了JN5121 ZigBee的软硬件开发环境,包括JN5121芯片、传感器开发板、编译环境CodeBlocks、烧写器Flash Programmer等,
本文运用国内新发现的重要日伪挡案文献 ,对关于“日本在华北的劳务掠夺体系”、“1 94 2年后日本向东亚各地输出华北劳工之政策手段”、“日本在华北本地矿山企业使用强制劳
针对再生水回用河道后浮游植物大量繁殖问题,以防控再生水水质劣化为目的,采用改进的黑白瓶法原位测试顺义潮白河再生水受水区浮游植物初级生产力,探讨其空间变化特征和影响
十八大赋予了现阶段"改革开放"全新理解,也开启了2013年这个对于中国社会来说颇为重要的"转型"年。本文从五个方面出发探讨媒介产业转型的话题,包括报纸媒体的生死讨论、电视
<正>长期以来,我国企业一直存在资产不实的问题,如高估资产、虚盈实亏问题。资产核算的准确与否,对企业利润的影响很大,也对广大投资者的切身利益产生影响。所以,准确计量资