基于粗糙集的决策树优化算法研究

来源 :四川师范大学 | 被引量 : 5次 | 上传用户:yzyzyzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,也称之为数据库中知识发现,涉及了人工智能、机器学习等重要研究领域。分类是数据挖掘的一个关键内容。目前,分类主用于诊断、预测、区分、甄别等方面。决策树技术是一项重要的分类技术。较其他分类模型简洁、易懂,便于操作,并且可保证分类准确性不低于其他分类模型。粗糙集能处理不确定的知识。粗糙集技术能更好的发现不准确数据及噪声数据内在的结构联系,生成更加健壮的决策树,可用于优化决策树算法。本文将对各种基于粗糙集理论的决策树生成算法进行了深入的研究,主要工作如下:1、在变精度粗糙集理论基础上,定义了变精度明确区与变精度非明确区的概念,替换原始的非明确区和明确区的概念。2、认真分析了Jinmao-Wei等人提出的基于粗糙集的单变量决策树算法HACRS的优缺点。采用C4.5算法中的信息增益率的标准替代ID3算法中的信息增益的标准,结合这两个新的概念,提出了一种基于变精度粗糙集的单变量决策树算法HACBRS算法。3、HACBRS算法在对数据集进行划分的过程中,引入分类误差参数,能对少量噪声数据对结果产生的影响进行了弱化,也不会导致生成的决策树对原来的数据集会产生过度拟合的现象,这样就使得决策树生成的泛化能力得到了大大的提高。4、将这几种算法同经典的ID3算法进行实例分析比较。5、通过分析比较,基于粗糙集理论生成的决策树要比基于信息熵的ID3算法构造的决策树规模小的多,简洁的多,可以很好的抑制噪声数据,分类精度也高得多。同时进一步验证了基于变精度粗糙集理论的决策树生成算法比基于粗糙集理论的决策树算法有一定改进方面的优势。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
日本京都先进通信研究实验室 (TAR)的研究人员提出一种新的“混沌反射镜”,可能会形成新的自由空间光通信方法的基础。这种 7面形的腔式反射镜正由该室的自适应通信研究实验
A series of unconfined compression tests (UCTs) were conducted to investigate the effects of content of reactive magnesia (MgO) and carbonation time on the engi
偏微分方程(组)广泛应用于大气物理、天体物理、燃烧与爆炸理论、航空与航天、惯性约束聚变、石油勘探等众多领域.本文研究的欧拉方程组和辐射扩散方程组具有很强的物理意义,是
中国共产党历来重视反腐败斗争,分别在革命、建设和改革开放中形成了三次反腐倡廉高潮,积累了宝贵的历史经验,为我党深入开展反腐败斗争提供了有益的启示。 The CPC has alw
图像分割是从图像处理到图像分析的一个关键技术。图像分割是指把图像区域分成各具特性的区域,并提取出感兴趣目标的过程。近年来,偏微分方程的分割方法得到了国内外学者的广泛
本文研究非正规子群的核对有限p群结构的影响。分类了所有非正规子群的核均同阶的有限p群以及所有非正规交换子群的核均同阶的有限p群,在某些情况下,分类了每个非正规子群的核
法国格勒诺布尔市 CSO测量公司的研究人员已发展一种作为干涉测量系统参照源使用的高频稳定激光源 ,该干涉测量系统是巴黎国家气象研究空间中心 (CNES)投资的红外大气探测干
传统文献检索算法将用户查询关键词集与系统数据库存文献关键词集进行匹配,然后根据匹配程度的大小检测文献。实践证明,此方法存在一些不足。其一,词语具有多义性,很难确定文
摘 要:近些年来,由于固定化细胞技术、固定化酶反应器的推广与使用,使得食品新产品得到了开发,食品的品种数量与质量都得到了明显的提高,这为食品工业带来了巨大的经济效益。本文就酶工程技术在食品添加剂中的应用情况作进一步的说明。  关键词:酶工程 食品添加剂  引言  利用酶和细胞或者是细胞器所具有的催化功能为人类提供服务,生产所需产品的技术统称为酶工程技术。作为生物工程的一个重要组成部分,酶工程技术被