基于粗糙集与属性值聚类的决策树改进算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:fenggge886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用粗糙集理论和属性值聚类相结合的方法,从决策树最优化的三个原则对其进行优化。首先,采用粗糙集理论的约简功能求出相对核,并利用信息熵作为启发信息求出相对约简,以此来保证生成决策树的路径最短和减少决策树的节点数。其次,在选择特征属性时,在信息熵增益最大的前提下,根据属性值间的相异性距离来对属性值聚类使其能够接近单峰分布。通过对UCI数据实验分析,结果表明很大程度上减少了决策树的节点数和决策树的深度。
其他文献
中国作为一个发展中国家参与贸易全球化,其对外贸易不论是从初级产品出口占主导的阶段,还是发展到制成品出口占主导的阶段,再到现在加工贸易出口占主导的阶段,始终是一个低附
听障生高等教育是残疾人高等教育的重要组成部分,经过30年的发展,在理论研究与实践层面积累了一定的研究成果。本研究采用文献计量学方法对在中国知网上检索到的368文献从文
强制休假是西方银行业广泛采用的内控方法。这种休假往往是在下班前突然下发强制休假通知单,并指定了交接人员立即办理交接,而且新上岗的都是能洞察秋毫的高手,实际是稽核人员$$
报纸
从研究动画人物造型为出发点,分析造型的方法、用线绘画造型的技法,区分中国式的"线"与西方"线"的差异,同时,注重动画人物造型基本规律的学习研究。文章就如何在写生中重新塑
<正>关系型数据库是一种"纵向扩展"的技术,想要扩展容量(无论数据存储还是I/O),都需要更换更大的服务器。现代应用结构的解决却是使用"横向扩展"----无需新购买更大的服务器,
把减少系统风险和提高开发效率放在首位,分析了多种开发方法的优点与缺点,运用了较为成熟完善的系统开发方式对农产品交易平台进行开发,即运用结构化和原型法的系统开发法相
笔者近日与意大利时尚协会及米兰时装周前主席波塞利通话,他热切地期盼中国消费能迅速恢复正常。意大利时尚行业年销售额约800亿欧元,而中国是其最大市场,中国消费的全面恢复就
报纸
应用广义逆矩阵的理论,导出了无需事先提供待估计量的任何先验统计知识而能获得严格意义下的最小二乘滤波的递推算法。
为推广图书馆现有资源,提高资源使用率,从工作原理、利弊分析、价格对比等方面,分析反向代理服务与SSL VPN技术两种技术方式,从适用性和易用性等方面,选择反向代理服务作为校
乡政村治是降低国家对农村管理成本和调动农民自主性的农村基层治理模式。目前由于法律的不完善、行政体制关系未理顺及管理主体素质不高等原因,致使乡镇行政管理和村民自治