流式大数据下随机森林方法及应用

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户:romeolg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流式计算形态下的大数据分析一直是当前需要解决的问题,而且研究成果和实践经验较少。随机森林方法是目前应用较多的分类算法,但在流式计算应用场景中,数据所呈现出来的实时性、易失性、无序性等特征会使得算法准确度逐渐降低。针对这个问题,分析了随机森林的算法特点,提出了根据决策树的准确度进行随机森林剪枝的思路。同时为了适应数据的变化,结合准确度间隔的概念提出生成、验证并补充新决策树的方法,最终形成可以不断随数据更新的随机森林,满足流式大数据环境对算法的要求。使用实际数据对改进后方法的可行性进行了验证,证明新方法在真实
其他文献
针对大展弦比机翼的柔性大、变形大的特点,基于非定常涡格法求解机翼的非定常气动力,考虑了大展弦比机翼的几何非线性效应,提出了计算大展弦比机翼非线性颤振分析的新方法。以某
《西北工业大学学报》2014年第32卷( v32)第2期( n2)28篇,在学报上的论文英文摘要只共有85个21世纪Ei主题词。《计算机工程索引》数据库( Compendex database)在收录时加了18个减了1
随着计算机被广泛应用于各个领域,操作人员了解一些如何排除计算机常见故障和维护方法很有必要。本人对计算机硬件部件工作异常或软件程序运行出错等故障提出相关的处理方法。
《西北工业大学学报》第33卷第4期全部28篇论文为Ei Compendex数据库收录,Ei编号为20153801281542至20153801281569。
Cooper Electronic Technologies的Coiltronics以太网供电PD可配置变压器提供多种不同输出,有3种功率等级:4W、7W和13W。这些变压器符合IEEE关于以太网供电应用的802.3af标准。
我校学报2014年第3期有3篇论文各有5个21世纪Ei主题词;这3篇中2篇第一作者所属工作单位均为西北工业大学,但第一作者郝海兵所属工作单位是中国航空计算技术研究所。
本文介绍了几种能引起学生兴趣的实验教学方式,其目的在于增强学生的创新意识,提高实验能力。
针对经典ANP模型在解决现实复杂评价决策问题中的困难,通过引入“子网”结构,提出了一个多层递阶分解的网络模型,有效降低了建模工作量与复杂度。同时,考虑比较判断的不确定性与
激光技术是一门高新技术,这种高新技术在许多领域中都取得了广泛而深入的应用;为社会的进步和人类文明的发展做出了很大贡献。目前,世界上许多国家都在进一步研究和开发激光