论文部分内容阅读
在当前的社会环境和Internet网络环境日趋复杂的条件下,网络舆情已经对社会的稳定和众多上网的人们产生了重大的影响。网络舆情与一般的舆情不同,它发生的范围广,传播的速度快,并且舆情的爆发点具有不易发现和控制等特点,这使得对网络中舆情的有效的发现与监控变得非常重要。本文从WEB舆情监控与上报系统的设计和实现技术入手,深入分析了一个有效的舆情监控系统的系统架构的设计和基本处理流程的安排等方面的问题。在本文中,分别介绍了WEB舆情监控与上报系统中的,舆情信息收集模块、信息预处理模块以及热点发现与跟踪模块的设计和实现过程中所采用的多种技术。本文的最后通过实验的方法比较了热点发现以及事件跟踪功能中所使用的多种文本分类、文本聚类算法,证明了热点发现与跟踪模块设计的合理性和必要性。本文针对网络舆情的监控设计了一个WEB舆情监控与上报系统,为使得网络环境能够健康有序地发展做出了自己的贡献。综合起来本文的主要工作如下:(1)结合当前国内外各种相关技术,设计了WEB舆情监控与上报系统的整体架构;(2)分析了系统中两个重要的辅助模块:舆情信息收集模块和信息预处理模块的设计和实现的方法;(3)重点介绍了系统的核心功能模块——热点发现与跟踪模块的设计和实现的方法;(4)比较了热点发现和事件跟踪算法中所用到的数据挖掘算法的优缺点;(5)通过实验的数据证明了系统设计中系统架构的优越性。