基于Hadoop的并行朴素贝叶斯分类算法

来源 :玉林师范学院学报 | 被引量 : 0次 | 上传用户：rliang

【摘要】

：

串行的朴素贝叶斯分类算法对大数据分类需较长的执行时间，针对这个问题，设计了一种基于Hadoop的并行朴素贝叶斯分类算法．并行算法使用一个HapReduce任务对训练子集并行计算各个

【作者】

：

周国军程裕强吴庆军

【机构】

：

玉林师范学院数学与信息科学学院

【出处】

：

玉林师范学院学报

【发表日期】

：

2015年5期

【关键词】

：

HADOOP平台朴素贝叶斯分类 MAPREDUCE 并行计算 Hadoop platform Naive Bayesian classification

【基金项目】

：

玉林师范学院校级一般项目（项目编号：2014YJYB03）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

串行的朴素贝叶斯分类算法对大数据分类需较长的执行时间，针对这个问题，设计了一种基于Hadoop的并行朴素贝叶斯分类算法．并行算法使用一个HapReduce任务对训练子集并行计算各个类别的先验概率和每个属性值的条件概率，从而实现了分类模型的构造，使用一个MapReduce任务对测试子集并行计算被正确分类的样本数，输出分类器的分类准确率．使用大数据集测试了串行算法与并行算法的运行时间，结果表明并行算法具有更高的执行效率．

其他文献

贵州荔波1．5万年以来石笋高分辨率古气候环境记录

通过对董哥洞石笋进行高精度的TIMS-U系测年和C、O同位素分析，建立了贵州省荔波地区15470a以来高分辨率的古气候变化时间序列。研究结果表明，荔波地区15470a以来石笋记录的冷暖

期刊

古气候环境高分辨率石笋TIMS年龄stalagmiteTIMS-U seri es dating ag ehigh resolutionpaleo

唐娜·哈拉维“赛博格”理论的女性主义蕴涵

当代美国著名的女性主义科学哲学家唐娜·哈拉维以“赛博格”理论而蜚声学界。哈拉维的“赛博格”理论,展开了一场关于女性与科技的对话,通过“赛博格”的女性主义隐喻揭

期刊

唐娜·哈拉维“赛博格”理论赛博女性主义女性主义隐喻Donna Haraway ＂Cyborg＂ theory Cyborg Feminis

藏北高原海陆相油页岩生物标志化合物对比研究

重点报道了藏北高原双湖地区早侏罗世海相油页岩和可可西里地区中新世陆相油页岩生物标志化合物组合差异。在两套油页岩中均检出丰富的正构烷烃、类异戊二烯烷烃、萜类化合物

期刊

油页岩生物标志化合物有机质输入沉积环境biomarkers contrastorganic matt e r importdepositional

水利施工技术及灌浆施工应用分析

随着社会经济和科学技术的不断发展,我国水利工程建设越来越受到社会的广泛关注。本文从分析水利工程中灌浆技术的应用价值出发,指出了灌浆技术在水利施工中存在的问题,最后

期刊

水利工程施工技术灌浆施工

高岭石-水溶液的界面反应特征

高岭石的表面荷电性、溶解及其对 Cu2+、 Pb2+的吸附等实验结果表明, 高岭石的零净质子电荷点 pHPZNPC=5.2,但端面 >AlOH的 pHPZNPC在 6.5～ 7.0之间,而 >SiOH的 pHPZNPC < 2.3

期刊

高岭石重金属吸附溶解质子化kaolinite heavy metals adsorption dissolution protonation

建筑工程中的深基坑支护施工技术

随着科学技术的发展,建筑行业也在进行着高速的发展。人们的生活生产水平也显著提高,深基坑支护施工技术在大型的建筑物中应用的非常普遍,比如说地下室的工程施工,而现在随着

期刊

深基坑支护技术绿色环保

NE100板链式提升机的改造

我公司余热电站燃煤制备生产线中的煤矸石输送提升机采用的是板链式提升机。输送2-30mm粒度的煤矸石物料，输送高度30m，输送能力150t／h。其传动机构采用链式传动（图1），并配有摆线针

期刊

板链式提升机摆线针轮减速机输送能力改造传动机构余热电站煤矸石减速比板结构牵引链

北大别洪庙榴辉岩相岩石Sm-Nd年龄：峰期变质时代

前人工作认为北大别榴辉岩在榴辉岩相变质后,经历了麻粒岩相退变质作用,因此获得的Sm-Nd矿物等时线年龄代表了麻粒岩相变质时代.本文对北大别安徽洪庙百丈岩榴辉岩相岩石(辉

期刊

辉石石榴石岩馏辉岩相变质SM-ND等时线年龄同位素平衡大别造山带pyroxene-garnetiteeclogite-facies metamorp

溧水盆地晚中生代基性火山岩成因与深部动力学过程探讨

下扬子地区溧水盆地晚中生代龙王山组基性火山岩属高钾钙碱性-钾玄岩系列,具有低MgO(3.16%～4.97%)和相容元素含量(如Cr11～34μg/g、Ni 9～27 μg/g),强烈富集大离子亲石元素(Ba/N

期刊

富集岩石圈地幔俯冲交代作用基性火山岩晚中生代溧水盆地下扬子地区enriched lithospheric mantlesubduction-rel

利用生烃动力学研究鄂尔多斯盆地抬升后上古生界源岩生气作用结束时间

鄂尔多斯盆地上古生界气藏的研究已有较多的报道,但盆地抬升过程中源岩是否生气以及生气作用结束的时间等问题还存在争论或认识不清.本研究通过封闭体系的模拟实验,利用生烃

期刊

上古生界生烃动力学生烃史鄂尔多斯盆地Upper Paleozoichydrocarbon generation kineticshydrocarbo

基于Hadoop的并行朴素贝叶斯分类算法

与本文相关的学术论文