基于MapReduce的海量数据挖掘技术研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:qdled2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce是一种编程模型,可以运行在异构环境下,编程简单,不必关心底层实现细节,用于大规模数据集的并行运算。将MapReduce应用在数据挖掘的三个算法中:朴素贝叶斯分类算法、K-modes聚类算法和ECLAT频繁项集挖掘算法。实验结果表明,在保证算法准确率的前提下,MapReduce可以有效提高海量数据挖掘工作的效率。
其他文献
针对变换域维纳滤波算法在低配置T264编码环境下降噪性能存在急剧下降的现象,提出在计算DCT系数归一化协方差矩阵时,利用块内数据间的强相关性,对交流系数的方差值进行估值修
目的:探讨苯磺酸左旋氨氯地平对老年高血压患者颈动脉粥样硬化斑块的治疗作用。方法:选择老年高血压患者合并颈动脉粥样硬化斑块82例,随机分为苯磺酸左旋氨氯地平组(治疗组42
婚姻家庭是社会的基础,与每个人都息息相关。随着社会的发展,近年来,法院处理的婚姻家庭纠纷案件逐年增多。根据最高人民法院提供的数据,2008年全国法院一审受理婚姻家庭纠纷案
近年来,随着人民生活水平不断提高,艺术教育水平也逐步走向规范化、国际化,呈现出良好的发展势头。声乐教育在艺术教育中异军突起,受到社会各界的广泛关注和大力支持。人们渐渐的
新闻采访不仅实践性强,艺术性也极强。提问,作为新闻采访的最基本环节,具备更强的技巧性。一名记者,要想完成出色的新闻采访,进而写出一篇出色的新闻报道,让提问取得良好的效
在各种水处理方法中,絮凝法是一种较为常用的处理方法,所以絮凝剂也已成为现代重要的水处理材料之一。研制安全无害、高效低耗、无二次污染的絮凝剂成为目前絮凝剂的主要研究
在社会不断进步,科技水平不断发展的今天,生态理念已深入人心。为促进农业基地的进一步发展,坚持走可持续发展的道路,统筹人与自然的关系,生态型新农村农业基地的建设显得尤
能源是社会经济正常发展的物质基础,也是历史发展、社会进步和人民生活水平提高的动力保障。浙江省是一个经济强省,也是能源消费大省,但却是一个能源小省,能源供需矛盾已成为
19世纪70年代到20世纪20年代,美国联邦政府开展了以“强制性”为主要特征、旨在“文明开化”土著美国人的同化教育运动。为实现在一代人之内将蒙昧的印第安人融入白人文明社会
个性化推荐是目前解决电子商务中产品信息过载问题的有效工具之一。对综合用户偏好模型和BP神经网络的个性化推荐算法进行了研究。具体讨论了如何建立用户偏好模型,采用神经