基于变精度Rough集的决策树改进算法

来源 :中山大学 | 被引量 : 0次 | 上传用户:hdmlb2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是让计算机模拟和实现人类学习的过程,目的是自动获取知识。机器学习在人工智能的研究中具有十分重要的地位。归纳学习方法在机器学习中是一种重要的学习方法。作为归纳学习方法的一种,建立决策树的方法被广泛地应用于机器学习的过程之中。本文研究一种基于变精度Rough 集思想的决策树改进算法,其基本特征是把数据预处理(属性近似约简)和决策树建立(属性结点选择)统一在整体框架之内,从而达到在大量数据中有效提取规则的要求。本算法主要分为两个步骤。首先提出条件属性关于决策属性约束度概念。通过计算约束度对条件属性进行近似约简。其次提出基于变精度Rough集的条件属性关于决策属性关联度概念。通过各条件属性的关联度进行决策树结点的选择,从而完成决策树的建树过程。与经典的ID3算法相比,在理论分析方面,本文研究了属性关联度与信息熵之间关系,从某种意义上将两种算法进行适当比较;在实验分析方面,通过两组通用数据,对本文提出的改进算法进行了模拟实验。实验结果表明,改进算法在建立决策树所用的时间和规则的复杂度方面都有一定程度的改进,在规则正确率方面也有所提高。理论分析和模拟实验表明了本算法的合理性和有效性。
其他文献
随着因特网的蓬勃发展和社会信息化水平的日益提高,网络业务日趋多样化,这对运营商在网络中提供的服务提出了更高的要求。本文研究的课题业务选择网关(SSG)使运营商能够实现
随着信息化进程的深入,计算机支持的协同设计(CSCD)正受到日益广泛的重视,并成为一个研究热点,它的深入研究和推广应用需要解决一系列的技术难题,而协同感知技术的研究便是其中的
许多应用领域产生的数据属于数据流类型,比如信用卡交易业务、传感器网络和网络监控等等。如何从数据流中发现隐含的知识,即数据流挖掘成了一个研究热点。流数据高速、连续无限
随着基于网络计算平台的分布式计算技术的迅猛发展,以支持应用互操作的应用需求为核心,以面向对象技术为主要特征的分布式构件技术和异构服务技术得到了蓬勃发展。异构服务组装
在基于构件的开发过程中,构件组装机制是基于构件的开发重要的组成部分,在其研究领域中最为关心的就是如何使用一种灵活的组装机制,能表现构件之间的复杂关系,使得系统内部的构件
当今的商业环境中充满着不确定性,面对全球化所带来的经济、政治及其安全方面所发生的巨变,以供应链运作模式的一切商业活动都不得不考虑市场变化及扰动所带来的问题。为了使整
论文紧跟嵌入式系统发展趋势,采用一种新的嵌入式系统设计技术——SOPC(片上可编程系统)技术进行通信产品开发。Nios嵌入式处理器是Altera公司推出的一个32/16位精简指令处理
鲁棒性数字水印是信息隐藏技术的一个分支,为数字多媒体产品的知识产权保护提供了一条有效途径。论文在研究图像数字水印技术的基本模型和基本要求的基础上,着重研究了基于人类
在这个日新月异的信息年代,计算机已经成为传播信息的主要工具和载体,目前网络已经在人类的日常生活工作中占据着重要的作用。伴随着有线网络的广泛应用,以快捷高效,组网灵活为优
数字水印技术作为一种数字产品的版权保护和身份认证的方法,越来越多的受到广泛的关注。本文主要针对抵抗打印扫描攻击的数字水印技术做了深入的研究。首先,介绍了数字水印技术