论文部分内容阅读
随着我国互联网的飞速发展,我国正处于加强和创新社会管理、健全网上舆论引导机制的重要时期。同时随着信息网络的日益社会化,以微博为代表的新兴媒体已成为网络舆情事件的主要爆发源与传播途径。特别是近年来,在事件的发生、发展过程中,微博以社会化人际关系为基础进行传播,已经成为网络舆情事件的重要推动力量。探索如何利用互联网收集社情民意、更好地服务民生,是情报管理与技术研究的热点。但当前国内外对微博舆情事件感知系统的建立方法和技术还不够成熟,其难点在于网络舆情事件的不确定性、复杂性、主题广泛性,以及微博自身的短文本、半结构化、社会化网络复杂结构等特点。这使得传统基于热点词的网络舆情事件检测方法已不适用,构建适用于微博特征的网络舆情事件感知方法成为亟待解决的问题。本文提出一种微博舆情事件的主动感知方法,通过网络主题爬虫广泛地获取微博各个维度的信息,然后对其进行多维度的舆情分析处理,最后通过对微博的文本特征和社会化关系特征进行主题无监督聚类,计算复合维信息特征的微博舆情事件的热度,从而实现微博网络舆情事件的主动感知。本文主要的创新点:(1)建立了基于LDA的微博网络事件内容与社会化关系主题特征挖掘模型。在网络事件的预警与处置工作中,对于网络事件的主题特征界定比较困难,其中不仅仅包括微博的内容特征,还需要处理微博的社会化关系特征,只有充分挖掘微博网络舆情事件的内容与关系主题特征,才能够最大程度上识别潜在的微博网络舆情事件。(2)提出了微博舆情事件动态感知的增量SVM模式识别算法。微博网络舆情事件具有很强的时间维度关联性,在不同的时期会产生完全不同的结果。本文根据微博网络舆情事件在一定时间内不断动态变化的特点,采用增量SVM算法对相关事件的新微博进行增量的模式识别分类,计算随着时间轴(Time-line)不断变化的舆情热点值。微博舆情事件感知的原型系统仿真实验表明,本文提出的方法对微博网络舆情事件的感知以及舆情热点的动态追踪具有良好的效果。