基于Map Reduce的Bagging贝叶斯文本分类

来源 :计算机工程 | 被引量 : 0次 | 上传用户:metor2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集中式系统框架难以进行海量文本数据分类。为此,提出一种基于Map Reduce的Bagging贝叶斯文本分类算法。介绍朴素贝叶斯文本分类算法,将其与Bagging算法结合,运用Map Reduce并行编程模型,在Hadoop平台上实现算法。实验结果表明,该算法分类准确率较高,运行时间较短,适用于大规模文本数据集的分类学习。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
194 2年 5月 2日和 5月 2 3日 ,毛泽东主席在延安和文艺界的同志座谈 ,发表了两次重要的讲话 ,这就是著名的《在延安文艺座谈会上的讲话》。 6 0年来 ,中国广大文艺工作者在
目的分析长期住院慢性精神分裂症患者社会功能的缺陷。方法收集符合标准的164例患者分为长期住院治疗组(〉4个月)和常规住院治疗组(≤3个月),在常规药物治疗的基础上,住院期间采用
论文介绍了电力煤炭公司人力资源信息管理系统的项目背景,阐述了该项目的重要性以及重要意义,对国内同类的系统有关研究和其相关应用的现状进行了分析,并简要阐述了研究项目
文章通过对河南偃师二里头遗址发掘以及夏文化研究的回顾 ,从认知方法、考古学范例、文献的运用、推论程序和通则、个案五个方面 ,剖析了中外学者在中国早期国家研究中存在歧
通过377例妊娠晚期的胎盘分级、胎头双顶径(BTD)和羊水超声显象观测.并与羊水生化测定等相对比,对其预测胎儿成熟度的价值进行了研究。结果:(1)胎盘Ⅲ级随着孕龄的增加而持续
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
苏霍姆林斯基曾说:“每一位教师不仅是教书者,而且是教育者。”可见学科教师和班主任的责任是一样的,学科教师没有理由将自己游离于育人职责之外,育人需要任课教师主动参与到
文章利用中国期刊全文数据库对《中国科学A辑:数学》十年(1999-2008)中发表论文的主题分布、地区分布、多产单位分布、作者群增长规律、作者合作度等进行了统计分析,从文献计量
通过对安康市汉滨区农村饮水水质不达标状况及污染原因进行分析,发现该区部分农村饮水标准相对较低,缺乏净化水质的基本设备设施,饮水质量和安全性不达标,农民对饮用水的水质