论文部分内容阅读
随着网络的覆盖和智能移动设备的普及,网络已经深入到我们日常生活的方方面面。同时,由于网络的无界性和交互性,人们可以在网络上接触不同的文化、接受不同的知识以及相互交流观点。但也正是网络的这些特点,使得网络文化鱼龙混杂、不良信息蔓延其中,甚至使得网络成为犯罪行为滋生的温床,近些年在网上爆发越来越多的群体性事件也让人们认识到了监控网络舆论这块“阵地”的重要性。舆情,是网络舆论情况的简称,通常是指作为社会主体的人民群众对于某些事件或者一些社会现象,所表现出来的观点、态度和情绪的总和,网络舆情的主要来源有论坛、博客、帖子和回复等。对舆情进行分析和处理对事情的解决有很大帮助,比如从公司角度出发,可以利用舆情监控得到行业动态、品牌口碑以及消费者评价,为日后公司做出正确的战略决策提供数据依据;对政府职能部门,特别是公安部门而言,对网络舆情的监控可以更好地控制舆情的发展,在预防犯罪、维持人民生活安宁、社会安定方面起到积极的作用。研究和开发网络舆情监控系统已经成为一件必须要做的事情了。本文在对舆情监控系统结构进行研究和分析后,按功能将系统分为四部分:数据抓取、数据预处理、数据分析和异构数据集成,从而完成舆情监控任务。用到的技术包括数据抓取部分的网络爬虫和垂直搜索引擎、数据预处理部分的中文分词和文本分类、数据分析部分的热点发现与追踪和文本倾向性分析。本文还将异构数据库集成的方式引入到舆情监控系统中来,实现公安各部门,以及其他机关、第三方数据库的数据共享,大大提高数据的使用价值。最后,本文对系统给予实现,实时监测网络舆情状况。实验表明该系统监测结果良好,可以为公安部门掌握舆论情况、控制舆论导向、维持社会和谐提供帮助。