基于Hadoop的大数据频繁模式挖掘算法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:suifengangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的频繁模式挖掘算法不能满足大数据环境下的挖掘需要,提出一种高效挖掘大型数据库中频繁模式的并行算法H_PrePost.首先从压缩数据库、简化数据表示以及采用高效的连接和剪枝策略等方面对PrePost算法进行改进,以提高单机模式下的挖掘效率.然后将改进算法迁移到Hadoop平台上,利用MapReduce模型进行并行计算,同时提出一种负载均衡策略保证集群高效运行.最后使用kulczynski度量和不平衡比对所挖掘的频繁模式进行评估,以确保所挖掘模式具有实际应用价值.实验结果表明,H_PrePost算法可
其他文献
吡虫啉是烟碱类超高效杀虫剂,多菌灵是苯并咪唑类杀菌剂,被广泛地用于农作物中多种病虫害的防治,其产生的农药残留问题,不仅关系到农产品的出口贸易,而且关系到消费者的食用
对阳江市1980—2015年降雨资料进行统计分析,结果表明:阳江市强降水(小时雨强≥20 mm)年平均天数为14.2 d,连续性强降水(1 d出现2次或以上的强降水)年平均天数为4.2 d,超强降水(小
在现代农业中,农药的大量使用已经对环境和食品的安全造成了严重的威胁,进而也对人们的身体健康造成了巨大的危害。有机磷农药(OPS)作为一种最常用的农药,能够极大地破坏人体
培养学生良好的行为习惯是学前教育和初等义务教育的根本任务,培养学生良好的行为习惯,要从言传、身教和监督三方面入手,需要老师、家长共同努力,是学校教育、家庭教育和社会
为了研究藻类水华对沉水植被恢复的影响,通过模拟不同浓度的藻类水华,开展了篦齿眼子菜(Potamogeton pectinatus)和伊乐藻(Elodea nuttallii)在不同浓度藻类水华下(0,6.25×108,2
由数字网络技术所构建的新媒体手段对于传统艺术传播媒体造成了巨大的冲击,但以数字化互动性为其基本特征的新媒体相较以往的传统媒体更具开放性与融合性。其所具有的优势和
行为是冯友兰人生境界说的理论基点,也是其觉解的客观对象之一。在境界的生成上,冯友兰考察的是行为的动机。境界是思的结果,是一种主观精神状态,总是和行为者的品德联系在一
介绍一些描述超价化合物结构的理论,从改进的8电子规则和分子轨道理论出发,结合计算,对超价化合物结构进行解释。说明了超价化合物结构大量存在非键轨道的特征,同时给出了一
文章剖析了苏联、南斯拉夫两种典型的社会主义模式 ,对社会主义所有制、计划经济与市场经济、社会主义阶段国家的作用以及共产党的领导地位等重大理论和现实问题进行了探讨 ,
随着媒体的迅速发展,对电视访谈节目中主持人的个人素质要求也越来越高,访谈节目主持人若要在谈话中挖掘深度,使节目内涵更加丰富,培养质疑意识十分重要。通过分析优秀访谈节