两种提高决策树性能的算法研究

来源 :计算机工程与设计 | 被引量 : 8次 | 上传用户:any_ray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服用重复剪辑近邻法筛选训练样本集产生样本被误剔除进而增大决策树的判决风险和误判概率的问题,提出一种新的方法-引入拒绝阀值的重复剪辑近邻法,并从理论上分析了它降低判决风险和误判概率的原理。通过实验比较这两种方法发现,引入拒绝阀值的重复剪辑近邻法在降低判决风险和误判概率上要优于重复剪辑近邻法;而在决策树的规模和分类错误率上,重复剪辑近邻法的精度要优于引入拒绝阀值的重复剪辑近邻法。
其他文献
ID3算法是决策树算法中的经典算法,但存在多值偏向问题。一些改进的ID3算法虽避免了多值偏向问题,但多存在主观性强、没有考虑属性信息熵等问题。为了解决该问题,提出了一种基于
目前,我国人才管理体制一个突出的弊病是人才的单位所有制,这种制度使单位或部门具有充分使用人才的权力,但也不可避免地出现垄断现象。这种体制有几个弊病: ①助长了本位主
近年来,物理引擎在计算机仿真模拟和游戏应用等领域扮演着越来越重要的角色。一款专业的图形渲染引擎与物理引擎相融合,能够更好地体现出虚拟现实场景的逼真性。在对国外专业的
针对锅炉这种大型特种设备,提出了一种基于粗糙集和人工神经网络集成的智能故障诊断方法。该方法先利用RS理论建立故障决策表,对原始数据进行约简,并按照一定的原则选取多个约简;然后建立神经网络故障诊断子系统,使用粗糙集处理后的数据计算出故障发生程度。研究结果表明:该方法能够正确而且高效地诊断出锅炉中各种部件的故障发生的严重程度。
白盒测试是保证高可靠性软件质量的有效手段。由于传统白盒测试成本较高,且具有相对的局限性,对大型可靠性软件实施测试可能并不实用。因此,在实际测试过程中需要使用一套黑
在泛故事化的后工业时代,体育报道演变成整合了政治、经济、民族认同等复杂要素的综合体,商业报刊为满足受众多元的需求,获取最大的经济利益,必然会促使体育报道在叙事策略上
<正> 党的十一届三中全会以后,随着改革开放的深入进行,社会经济的发展越来越需要大量的经济管理人才。为适应这种社会需要,我国各类经济管理干部学校应运而生,担负起成人高
<正> 国家将对跨国集团实行税务管理近日,国家税务总局透露,将对跨国集团实行专业化管理,为不同规模的纳税人提供有针对性的&#39;个性化&#39;服务,提高税务行政管理效率,降低