基于信息熵的决策树算法研究及在肺病住院费用分析中的应用

被引量 : 1次 | 上传用户:dracula1103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树分析就是知识发现的过程,决策树模型的复杂度和预测精度决定了决策树的好坏。决策树是根据启发规则生成的,常见的决策树生成算法有基于信息论的ID3、C4.5算法,但是这些算法在实际应用中都存在着各种不足之处。本文提出了一种基于信息熵的离散化算法I-C4.5算法,以减少C4.5算法在做数据离散化处理时产生计算量偏大的问题。本文将改进的算法I-C4.5应用到了医院对肺病住院费用决策树分析中,并对比分析了I-C4.5算法和C4.5算法生成的决策树规则,验证了I-C4.5算法在决策树规则分析上的优越
其他文献
随着Internet技术的发展,网络应用服务越来越丰富多彩。为了对互联网中各种各样的流量实施有效的监控,首先需要使用协议识别技术来分辨网络流量的不同应用类型,然后才能够有
在研究Web服务组合中存在着一个重要问题是怎么样使用进程代数形式化的描述Web服务组合并且证明Web服务组合的正确性。用Pi-演算建模Web服务组合的模型可以用来检查、验证Web
本文研究了基于CART(Classification and Regression Tree)算法的基因芯片数据的分类问题。基因芯片技术对于早期癌症的诊断和确诊是一个革命性工具,它从基因表达的角度判断
由于网络的飞速发展,当前的网络正面临严重的安全和管理等方面的挑战,保障网络的可控性成为当今网络发展的迫切需求,国内外许多组织都针对该问题陆续开展了相关研究工作。针对当
随着网络技术和即时通信技术的飞速发展,即时通信工具随之得到了广泛的应用。这一通信工具领域的革命,改变了人们以电子邮件为主的传统的通讯方式,使协同化办公中需要员工互
决策树剪枝是决策树优化的常用方法。在保持决策树分类精度的前提下,该方法通过去掉决策树中某些子树的方法,达到减小决策树规模的目的。目前的决策树剪枝方法按照一定顺序遍
近年来,伴随着网络信息技术的高速发展,产生了一种新式的数据模型——数据流。它常常产生于web上的用户点击、网络入侵检测、实时监控系统或无线传感器网络等动态环境中。相
虚拟人是人在计算机的数字世界中的形象表示。随着计算机技术和工业技术的不断发展,虚拟人技术在近几年有了快速的提高。目前虚拟人技术在航天航空、军事、医疗、教育等领域
针对新疆维吾尔自治区信息处理技术的重要性,以及当前联机手写维吾尔文识别技术尚不能完全解决支持连续书写的维吾尔文手写单词的输入问题,本文以联机手写维吾尔文连体段特征
学位