基于红黑树的连续属性数据流快速决策树分类算法

来源 :南京邮电大学学报:自然科学版 | 被引量 : 0次 | 上传用户:cyydn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以提高连续属性数据流的分类挖掘效率为目标,设计并实现了一种基于红黑树的连续属性数据流快速决策树分类算法VFDT_RBT。该算法利用红黑树来更有效地处理样本的插入,使得有序插入时的时间复杂度仍为O(nlogn);利用堆栈和红黑树中序遍历有序的特点来降低最佳划分阈值选取过程的时间复杂度;利用hoeffding不等式确定连续属性划分阈值所需的样本数量;在允许连续属性多次出现的原则下选择划分属性建立决策树,提高了算法的分类精度。在多个数据集上的分类实验结果表明:VFDT_RBT比已有的VFDTc具有更低的时间复杂
其他文献
引入了一个新的误差状态变量,研究了有向多智能体系统牵制控制问题。针对这个新的误差系统,运用PI控制方法,使得多智能体系统实现一致。当扰动满足一些条件时,我们可以牵制一
摘要:近年来,我国一般物价水平持续上涨,出现通货膨胀的迹象,特别是2011年以来,通货膨胀压力日益加大,本文以我国新一轮通货膨胀为研究主题,对目前所面临的各个方面的通货膨胀压力进行了探讨,阐述了我国当前通货膨胀压力的成因,并提出了一系列应对通货膨胀压力的对策。  关键词:通货膨胀;CPI;对策研究    一、现阶段我国通货膨胀压力明显增强    通货膨胀指在纸币流通条件下,因货币供给大于货币实际需
保护云南民族优秀传统文化,就要保护好民族文化的传统社会基础,传承入、虚心向文化主体学习、塑造民族精神,这对于云南各民族文化的建设,对云南地区的发展,对中国和谐文化的营造,对
随着时尚潮流更新换代的速度不断加快,服装产品的生命周期正在逐渐缩短,大量服装在百姓家中积压。随着人们对环境的日益重视以及建立循环型社会呼声日益高涨的背景下,研究各国纺织服装循环利用现状的重要性不断显现。    一、目前主要的服装循环利用方式    目前国外纺织服装循环利用可以分为两种情况,一类是服装的循环消费。另一类是服装回收后的纤维循环利用(见图1)。  1.服装循环消费  通过对国外服装循环利
超宽带信号的穿墙传播特性研究是决定穿墙成像成功的关键因素。文中利用时域有限差分方法仿真模拟了超宽带穿墙雷达成像场景,分析了墙体作用对目标散射信号的影响,仿真结果验证
提出了基于数据通信可靠性的单负载决策电耗优化研究方法.该方法通过家庭区域网(HAN)和邻域网(NAN)网关可靠性分析,建立约束马尔可夫决策过程(CMDP)模型,以单负载作为决策者进行缓
财政部、证监会、审计署、银监会、保监会于2008年联合发布了我国第一部《企业内部控制基本规范》,2010年又联合发布了((企业内部控制配套指引》,指导企业具体如何做好内部控制工
中国的主权基金涉及对外投资,很敏感。西方人比我们更讲“政治”,他们会认为是中国政府正在拿钱去收购他们的企业。建议改变二下方法,例如,以养老基金的名义去海外投资。因为,换一
据联合国教科文组织网站2014年8月6日报道,联合国就加沙地区急需的人道主义救援发出了“2014年化解加沙危机”的倡议。教育设施与学校在这场危机中一直首当其冲。大量加沙平民
根据商务部公布的数据显示,今年4月份,居民消费价格同比上涨5.3%,同比涨幅比去年同期扩大2.5个百分点,但比上个月回落0.1个百分点。同时,商务部5月9-15日对36个大中城市重点监测的结果来看,食用农产品价格小幅上涨,生产资料价格小幅回落,食品对居民消费价格的影响有减弱趋势。说明中国的通货膨胀还在上扬,这种趋势会持续多久?當前乃至未来一段时期内,中国怎样既维持价格稳定又能保持经济增长?带着这些