一种基于Hadoop平台的并行朴素贝叶斯网络舆情快速分类算法

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:flash021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】研究Hadoop平台下一种改进的并行朴素贝叶斯算法并实现网络舆情信息分类。【应用背景】网络舆情信息存在数据量大,分散度高,数据非结构化等特点,现有技术难以实现网络舆情的准确、快速分类。【方法】利用Hadoop平台分布式数据存储与并行处理的优良特性,实现朴素贝叶斯分类算法的并行化运行;将采集的舆情文档依照HDFS架构进行本地化存储,并通过Map Reduce进程完成并行分类处理。【结果】对Map Reduce封装后的并行朴素贝叶斯分类算法进行性能测试,结果表明本算法分类效率比集中式舆情分类算法提升82%,分类准确率达到85%以上。【结论】本算法能够有效提升网络舆情分类能力与分类效率。
其他文献
本文针对《C语言程序设计》教学过程中,从激发兴趣.注重算法、实践和利用多媒体技术等方面,探讨如何提高教学质量、增强教学效果的途径和方法。
目的探讨人工全髋关节置换术规范化护理对策。方法对50例人工全髋关节置换的患者实施围术期的护理干预及康复锻炼指导。结果 50例人工全髋关节置换术患者进行系统的围术期护
一、“十一五”规划推进“三网融合”新闻回放:5月14日,正式公布的“十一五”发展纲要提出:“加强宽带通信网、数字电视网和下一代互联网等信息基础设施建设,推进‘三网融合’,健
在古城西安举行的ICTC2011上,博通公司的基于DOCSIS的EoC满足三网融合的解决方案获得青睐。博通公司是唯一拥有端到端DOCSIS芯片解决方案的公司,也是唯一拥有调制解调系统全部
本文通过对环境保护目标责任制的内涵与特征,及制度的确立与实施的意义的概述,探讨了现行环境保护目标责任制存在的问题,即制度本身缺乏完整、有效的法律规范支持,责任内容涵盖面
6月9日20时15分.我国直播卫星——中星9号在西昌卫星发射中心用“长征三号乙”运载火箭成功发射升空,该星由中国卫星通信集团公司采购.中国直播卫星有限公司负责运营.在我国提供
数字电视平移之后,HFC网络传输的信号由以模拟为主的传输形式转变为以数字为主的传输形式,对于网络传输设备输入指标的要求发生了较大的变化本文结合真实网络中的调试情况,提
在BIRTV2012期间展示全新及升级的整合媒体制作解决方案用于先进的基于资产的工作流程,跨越分布式制作、多平台分布、服务器和存储及广播图形,并演示了如何在新闻、体育、电视
多年来,我校林业专业的实践教学经过不断改革,取得了较大成效。为了了解我校学生对实践教学改革的看法,2008年5-6月,在学生毕业之际,我们对学院的学生做了实践性教学现状和教
CT对上颌骨额突骨折可清昕显示,为临床及早诊治和法医鉴定提供依据.本文收集我院24例上颌骨额突骨折,回顾性分析其发生原因,CT检查适应症及CT诊断价值.