基于MapReduce模型可扩展的序列模式挖掘的研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:woshishouhushen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列模式挖掘是数据挖掘领域的研究课题之一,针对传统算法对处理大数据普遍存在扩展性问题.为了改进扩展性,本文提出云模式下基于MapReduce的序列模式挖掘算法(SPAMC),本文设计出迭代MapReduce框架来高效生成候选模式,并在构建词法序列树时进行修剪.该框架不仅将树结构的子任务分给并行排列的独立映射机,而且能实现对支持计数的并行处理.选用32台虚拟机构建云环境,对多达1300万个交易序列进行了全面实验,实验结果表明SPAMC可大大缩短大数据的挖掘时间,达到极高的可扩展性,并提供云聚集的理想负载平衡.
其他文献
合理的电源布局可以提高电能质量和供电可靠性,降低能耗.在我国远距离大容量输电的环境下,可再生能源的利用被认为是传统电网的有效补充,很有发展潜力.小水电厂接入配电网,对
固原地区属干旱半干旱气候带,旱作农业占耕地面积的94.1%。农业生产结构单一,耕作粗放,半数以上农田无肥可施,地力瘠薄,产量低而不稳,我们认为地力不足是生产水平不能提高的
同步注浆是盾构隧道施工的重要施工工艺,对控制地层变形影响显著.为得到盾构同步注浆施工引起的地层变形理论解析解,将同步注浆浆体在土体中扩散引起的地层位移问题简化为半
利用8/20 μs冲击平台对回路线缆进行冲击,模拟雷电放电通道向外辐射电磁波,并建立天线接收雷电电磁波信号的等效电路,主要研究了天线耦合雷电电磁波的频谱、能量及峰值的分
襄城县孙祠堂乡刘楼村烟农林中选,今年种植烟叶2.5亩,截止七月三十日已收烤四炕,出售三炕,共卖烟叶261.5斤,收入335.7元,均价1.284元,交售上等烟65.5斤,占25%,中一烟20.5斤,
TS,黑的与灰的是岩石,白的是“冰”rn近日,一些报纸报道:海底地层中的一种物质“可燃冰”有望成为解决未来能源危机的新能源.
我县是全国名晾晒烟主产县之一。八四年冬至八五年春出现了冬暖春寒的反常气候,对一些农作物生长带来影响,特别是烟株早花老苗现象严重。据3月13日科研基地调查,有7户繁种户
针对小排量传统化油器式发动机存在的油耗及排放问题,对168F发动机的进气系统进行改进设计与研究.首先对沼气汽油双燃料的发动机进气系统进行改进方案设计,分析计算出进气管
为了提高轮式机器人控制精度,提出了一种新型的机器人速度控制方法.设计了一种基于大脑情感学习的速度误差自适应调节器,通过计算大脑情感数学模型内部节点权值的在线学习,对
高8—22新品系:根据育种目标,选育早熟,抗倒伏,高产质优,抗逆性强,适宜水地栽培品种。1974引种73—7原始材料,前后选择单株,在本院农场,云南省元谋县南育。稳定后,参加三年