舆情系统中倾向性分析与实现

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:ApexLiuNck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
舆情反映了公众对于事件的看法,表达了公众的诉求。及时掌握舆论情况,对社会舆论进行正确积极的引导,具有十分重要的意义。随着互联网的发展,网络已经成为群众获取信息,发表意见的重要途径。胡锦涛总书记指出:“互联网已成为思想文化信息的集散地和社会舆论的放大器。”网络舆情具有以下特点:网络舆情覆盖面广泛,具有很高的突发性,舆情往往带有明显的倾向性和煽动性,舆情信息本身的真实性先天不足。正因为网络舆情的上述特点,对网络舆情进行分析与监控,及时做出正确的舆论引导,有着十分重要的现实意义。舆情信息往往都带有明显的倾向性,正确的识别舆论对话题的整体倾向,可以为舆情的了解与引导,提供很有价值的参考。文本对倾向性分析进行了研究,并提出了一种基于词激活力的话题倾向性识别算法,经过实验该方法取得了很好的效果,并将其应用到了网络舆情分析系统中。本文的主要工作如下:第一,面向海量网络数据,设计舆情分析系统的处理流程、存储方式和总体架构。针对海量数据快速处理的需求,设计了系统的总体框架,多服务器处理的负载均衡机制,数据同步机制和数据库存储方案。第二,详细论述了海量网络数据舆情分析系统各个模块的设计实现。包括数据采集端网页去重设计,分词模块,聚类模块,热点词模块,敏感词模块,分类器训练模块,倾向性模块,数据库表设计,对相关模块数据库接口进行了详细的说明。针对海量数据的处理与存储,重点介绍了Oracle数据批量更新及MongoDB数据库分表存储解决方案。第三,通过研究传统的文本倾向性分析方法的不足,提出更为有效的基于词激活力的话题倾向性识别算法。传统方法往往不能有效反映话题文档集的整体倾向,基于激活力的方法可以有效发现文档集的倾向性特征,更好的识别文档集的整体倾向。将该方法与基于情感词加权的方法进行了实验对比,充分验证了该方法的有效性。
其他文献
职高教育肩负着为国家建设和社会发展培养一线生产建设型人才的教学重任,相对于普通教学而言,职业教学更加注重学生的技能培养和实践能力的提升。根据调查发现,在职高教学体
食用碱是一种食品添加剂,具有增加面条风味、中和胃酸的作用。通过测定蛋白质分子间作用力、麦谷蛋白大聚体含量及利用原子力显微镜观察,探讨不同添加量(0%、0.1%、0.2%、0.3
通过对创意经济的一些重要问题进行研究,我们认为,创意经济是人本经济、新经济、无限经济、知识产权经济的总称。要促进创意经济的发展,就要建立扎实的发展基础与政策环境,营造良
针对现有黄曲霉毒素B 1(AFB 1)定量检测操作复杂、用时较长等问题,提出一种基于TMR磁传感器和磁性层析试纸的AFB 1定量检测方法。在垂直匀强磁场中,使用TMR磁传感器检测磁性
为研究中等硬度小麦粉不同粒度配比对混合粉及鲜湿面条品质的影响,以周麦27的3种不同中等粒度小麦粉为原料,按照不同比例制成6种(A、B、C、D、E、F)混合粉,分析混合粉的基本
心理学课程在当今各大高校的教学过程中占有重要地位,现代社会经济,物质文化飞速发展,学生们的思想观念也在不断地改变,也就引发了许多高校学生的心理问题,不好的心理会不利
建立超高效液相色谱-串联质谱法同时测定玉米中4种交链孢霉毒素的分析方法。样品粉碎后经磷酸二氢钠缓冲液-甲醇-乙腈的混合液提取,固相萃取柱净化,XBridge BEH C 18色谱柱分
麦麸改性是为了有效降低小麦加工副产物麦麸中的抗营养成分,充分利用其中对人体有益的营养成分,提高麦麸的食用价值。在35℃、相对湿度80%条件下,采用酵母固态发酵24 h对麦麸
唐末士人创作隐逸诗是一时的风气,留下大量作品,学界对这类作品有过一些研究,但缺乏全面系统的讨论。本文从创作背景、思想内容和艺术表现对这类诗做了进-步研究。绪论主要是
通过建立浮小麦指纹图谱,研究不同产地浮小麦质量差异,为药食两用浮小麦的质量控制和开发利用提供理论依据。采用高效液相色谱分析,建立浮小麦HPLC指纹图谱。利用“中药色谱