论文部分内容阅读
网络舆情形成迅速,对社会影响巨大。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会民生的主要载体之一。已日益成为舆情产生和传播的重要领域,网络舆情在社会生活中扮演着越来越重要的角色。其直接性,突出性,偏差性使网络舆情双刃剑角色的作用越发明显。为了加强网络管理和监控,如何更好的开展网络舆情信息的监测、追踪与分析,已经成为目前政府、企业、学校等机构面临的首要现实问题。网络舆情监测追踪系统可以实现针对网络中海量舆情信息自动实时的采集与分析,有效地解决以传统的人工方式对舆情监测、追踪和分析的难题。传统的基于文本聚类的网络舆情热点追踪算法,在处理海量网页时,文本聚类速度过低,聚合结果较差。本文提出了一种基于关键词提取的网络舆情热点追踪方案,并根据微博、新闻、论坛和博客的不同特点分别设计了热点分析模型。通过在笔者开发的啄木鸟网络舆情监测追踪系统上的实验表明,该方案行之有效,热点分析模型识别热点准确率高。网络舆情监测与传统搜索引擎最大的区别就在于其时效性强,滞后的信息毫无价值。及时性包括两个方面,采集性的及时性与信息分析的高效性。本文提出了首先在海量的网站中根据影响力的排名,选取有限的主流权威站点作为首要信息采集源,将有限的资源充分利用,最终提升监测效率。最后,根据网络的发展现状,本文给出了一个具体的应用系统啄木鸟舆情监测追踪系统。引入近几年来针对网络舆情监控方面进行系统建设的过程中出现的问题以及解决具体问题的思路,全面分析了设计建设的目标和原则,同时深入阐述了各项功能的详细作用及最终实现,为及时准确预警网络突发事件和全面应对分析做出一些自己的贡献。