论文部分内容阅读
随着互联网的快速发展,网络已经成为人们表达情绪和态度的重要“场所”,不论是正面的、还是负面的网络舆情都对社会的稳定产生重要的影响。因此,国家相关部门对网络舆情的重视与日俱增,相应的互联网舆情监测系统也应运而生。它实时地采集互联网信息,智能地分析信息的内容,为相关部门监测网络舆情,引导正向舆情,处理舆情危机提供了良好的支持。本文对构建网络舆情监测系统相关技术,如自然语言处理技术、信息挖掘技术进行了研究,同时对目前已有的舆情监测系统进行研究,在此基础上构建舆情监测系统。本文重点对网络舆情监测系统的关键技术——热点话题发现与跟踪进行研究分析,在已有的技术手段上对其进行改进以适应现实监测环境。本文的贡献主要体现在以下3个方面:1.提出一种改进的Single-Pass增量聚类方法应用于热点话题发现。本文研究了热点话题发现的具体流程,将文本聚类作为其实现的关键技术之一。通过分析几种已有的文本聚类算法的原理及步骤,从五个方面对比分析了各算法的优缺点,最终选取Single-Pass增量聚类作为话题发现的实现方法。但是,Single-Pass算法存在对文本输入顺序敏感等缺点,在对该算法进行分析的基础上本文对其进行了改进,在算法精度、响应时间上有所提高,使其能适应大规模文本聚类。最后,经过对比实验证明,本文提出的算法具有良好的实际应用效果。2.提出一种改进的SVM算法应用于话题跟踪。本文研究了话题跟踪的具体流程,将文本分类作为其实现的关键步骤。通过分析文本分类方法和实验对比,选择了SVM算法作为其具体实现。但SVM算法比较适合二值分类问题,因此本文对其进行了改进,使其适应现实中多分类的要求,最终通过实验证明其有较好的实际应用效果。3.在对相关技术研究的基础上,本文设计了网络舆情监测系统的物理构建框架与逻辑实现框架,详细介绍了舆情监测系统各个模块的实现及功能,最终实现部署该系统。通过系统的实际运行,证明本文所提出的设计方案具有功能全面、速度较快、性能稳定等特点,为用户对网络舆情的监测与分析提供了有效的支持。