基于粗糙集的多变量决策树的应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:jxwdi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类在数椐挖掘中是一项非常重要的任务,本文研究的是基于决策树的分类技术。与其他分类技术相比,决策树技术具有许多优点:决策树更易被用户理解;生成决策树的效率更高、更适合大训练集;决策树的生成算法不需要除训练集之外的额外信息;它可以提供更好的精确度。当然决策树技术也有缺点:一方面,它无法删除带噪声的不相关的属性;另一方面,大多数决策树被限制在每个节点上只检验单个属性。 为了克服这些困难,本文引入了粗糙集技术。粗糙集理论是一种处理模糊和不精确知识的数学工具,它具有很强的知识获取能力。粗糙集理论将分类和知识联系在一起,认为知识即是将对象进行分类的能力。尽管粗糙集理论对知识的不完全的处理是有效的,但是它的容错能力和推广能力相对较弱,这意味着需要其他方法补充。 面对决策树技术和粗糙集各自的优缺点,在研究过程中作者将这两者结合起来取长补短。对于仅有离散值属性的情况下,利用粗糙集理论中条件属性相对于决策属性的核以及条件属性的区分能力,同时考虑到待建决策树的规模问题,我们提出了一种新的条件属性的约简算法。以约简后的多个属性构造检验,解决了决策树中属性的选择问题。改进后的算法可以构造出多变量决策树,与ID3算法相比,两者拥有相同的分类准确率,但前者具有更高的效率,并且大大减小了决策树的规模。 最后本文在这个新型的算法框架基础上设计了一个KDD原型系统,并实现了其中的基于粗糙集技术的数据预处理部分和基于改进后的决策树算法的分类器部分和预测器部分。应用该系统对心血管住院患者的病案首日(首页)数据进行研究分类,以实现对患者病情的危重度做出较为客观准确的分级,从而对医疗服务质量和医疗资源的分配情况进行更为有效的考察和改进。
其他文献
在航空测量领域,运动物体运动参数的非接触式测量是非常重要的研究内容,一般采用视频变形测量(Video Measurement Deformation, VMD)的方法,视频测量技术用于确定三维空间物
在航空测量领域,运动物体的运动参数非接触式测量是非常重要的研究内容,因为在航空器,推进器,武器系统,风洞流场等的性能测试中,往往会遇到难以使用接触式传感器进行测量的情况。随
一个实时系统是指计算的正确性不仅取决于程序的逻辑正确性,也取决于结果产生的时间,如果系统的时间约束条件得不到满足,将会发生系统出错。实时系统有广泛的应用领域,包括多媒体
目前的科研和商用人脸识别系统能够在小规模人脸数据库、用户配合、摄像环境接近理想的情况下获得令人满意和满足一定实际生产要求的结果,但在更大规模人脸数据库、用户不配
本文基于对目前宽带接入网网管实现技术的研究,提出了采用TMN(电信管理网)体系结构和SNMP为接口的统一网管分层体系结构。整个结构从下到上依次为数据交换层、数据分析处理层
Petri网适合于网络环境下的信息处理系统的描述和建模。它的主要特性包括:并行、不确定性、异步及分步描述能力和分析能力。Petri网以其简洁、直观、潜在模拟能力强等特点被
TCP协议是固定网络上有效的端到端传输协议,它在应用于复杂多变的无线网络时性能却大大下降。这主要是由于TCP的错误控制机制不适用于无线网络。针对固定网络设计的标准TCP协
Robocup机器人足球系统是一个典型的多智能体系统,同时也是一个典型的多智能体协作与竞争系统,它为分布式人工智能的研究提供了一个标准的试验平台。多智能体学习与协作是当
随着Internet的迅猛发展,越来越多的应用基于网络展开,而作为网络上数据表示和交换的事实标准,XML也被这些应用大量使用。XML作为信息的载体在网络上的广泛应用带来了XML的安全
随着互联网的迅猛发展,网络的安全性问题愈来愈重要。目前解决网络安全问题的主要技术手段有口令认证、加密技术、安全审计和防火墙技术等,它们在防御网络入侵方面有一定的作