基于Hadoop云平台的并行数据挖掘方法

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:love4898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
业界已经开始运用云平台来处理海量高维数据,将各种异构系统仿真为一个系统,其中在Hadoop环境进行数据挖掘会遇到数据模型的全局性、HDFS的文件随机写操作、数据生命周期短等问题。为解决这些问题,在Hadoop上实现高效海量数据挖掘,提出了在Hadoop上一种高效数据挖掘框架,利用数据库来模拟链表结构,管理挖掘出来的知识,提供了树形结构、图模型的分布式计算方法;在此基础上实现一个统计算法——Yscore分箱算法,以及决策树和KD树的建树算法;并利用Vega云对Hadoop集群进行仿真。实验数据表明该框架和算法实用可行,且可能拓展与数据挖掘之外的其他领域。
其他文献
虚拟装配的拟实性是影响该技术能否得到广泛应用的主要因素之一。基于物理属性的虚拟装配技术通过对物体的物理属性进行仿真和模拟,使得虚拟环境中的装配过程更接近于实际的
针对典型弹道体目标多普勒信号时频效应的分析,建立了连续波多普勒体制毫米波近程雷达的视频回波信号数学模型,并利用信号重排小波gabor变换方法对某靶机进行时频谱图仿真,仿
车载自组网是近年来无线网络以及智能交通领域的研究热点之一。在真实环境中测试和评估车载自组网的协议和应用有很大难度,因此利用车载自组网仿真工具进行研究就成为了一种
采用等维新信息和提高原始数据列光滑度的方法对灰色预测模型进行改进,具有预测更准确的效果,结合采用模糊神经网络控制的精确稳定性特点,提出一种改进的灰色预测的孵化模糊
指出了多分辨率作战仿真系统中存在的不同分辨率的聚合级实体之间以及聚合级实体和平台级实体之间的交互问题。针对这一问题,提出了通过指挥实体的指挥控制关系有机的连接不
基于智能互补融合的思想,将粗糙集理论与贝叶斯网络有机结合在一起,提出了一种超视距空战战术决策的新方法。利用粗糙集理论实现对专家知识的约简和空战态势信息集的压缩,提
对提出的一种新型6-PUS/UPU 5自由度并联机器人进行了动力学建模与仿真研究。首先利用凯恩方法对并联机器人进行动力学分析,然后Pro/E软件对并联机器人进行了建模,最后利用Ad
为了寻求更好的高动态GPS载波跟踪解决方案,设计了适于高动态环境的基于参数估计的载波跟踪环路,分析了高动态GPS载波跟踪系统模型,比较了EKF、UKF和PF三种滤波算法的参数估
针对Web文档的结构及其特征,提出了一种新的加权后缀树聚类方法WSTC。首先,根据Web文档的HTML标签,把文档划分为具备不同重要性等级的段,段划分成句子,句子分割为词。其次,用
直升机由于其得天独厚的飞行特点,将能在国家应急救援体系工程建设中发挥主导作用。在我国的救援体系中,救援直升机将承担搜索营救遇险人员、救护伤员、运送人员、紧急撤离、