分布式数据流决策树VFDT分类算法研究

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:mengyidaocaoren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,网络上充斥着大量高速变化的数据流,然而传统数据挖掘技术不能很好地直接应用到数据流上。研究基于决策树的数据流分类挖掘算法,其研究思路是首先描述一般决策树;然后重点阐述数据流决策树VFDT的算法的实现,采用TwitterStorm分布式流式计算框架的并行计算和YahooSAMOA机器学习平台.对VFDT算法进行并行化设计;最后通过实验验证并行化的VHT决策树算法具有良好的运行效率与性能。
其他文献
本刊讯:教育部围绕立德树人根本任务,将社会主义核心价值观融入教育教学之中,实现全课程融入、全方位融入。
目的:研究浆细胞性乳腺炎(PCM)组织中白细胞介素-1β(IL-1β)及肿瘤坏死因子-α(TNF-α)的表达及其临床意义。方法:选择2013年11月到2016年4月在内蒙古自治区人民医院就诊的P
儿歌即儿童歌曲,它是少儿日常生活中不可缺少的一种娱乐、审美与教育活动,对儿童的成长具有不可替代的重要作用。20世纪80年代后,由于学校对儿童音乐教育的重视不足,还有流行歌曲
目的 探讨舒芬太尼(SF)对1-甲基-4-苯基-吡啶离子(MPP+)诱导的人神经母细胞瘤SH-SY5Y细胞损伤的影响及其可能的分子机制。方法 采用流式细胞术检测MPP+对SH-SY5Y细胞凋亡的促
在体育实践课教学中,学生进行较多的身体动作,承受一定的运动负荷。教师要遵循由易到难逐渐加大难度的原则。在教学中,要培养学生的兴趣,由于学生的兴趣不同,对同一教材,同一
<正>一幸福是一个古老的话题。尽管不同的时期、不同的社会、不同的人对幸福有着不同的看法,但仍旧有比较普遍的相关理论认为:幸福首先是一种主观的心理体验,产生于主客体的
PECB4025是专为高分子量聚乙烯压力管道而开发的炭黑色母。该产品以高密度聚乙烯(HDPE)为载体树脂,采用原生粒径20nm的高遮盖纯净炭黑,炭黑含量为40%。本文介绍了PECB4025的
《仙人》是日本大正时期重要作家芥川龙之介(R·Akudagawa)的初期作品。从《仙人》与《聊斋志异》中《小二》、《雨钱》、《鼠戏》诸篇的比较中,可以发现芥川的《仙人》深受《聊
从1994年至2003年发表的环境会计研究论文有350多篇,通过对其内容、作者、发表时间、作者单位、发表期刊等方面进行实证分析,可以发现我国环境会计研究的一些规律,对我国今后
运动员竞技能力的起始状态与目标状态分别标识着一个完整的训练过程的起点和终点,时训练阶段的划分、训练内容的确定、训练方法与手段的选择、恢复措施的选用及检查评定的设