论文部分内容阅读
目前,随着社交网络的兴起,微博因其快捷方便的优点迅速流行,现在已经成为网络信息传播的主要途径。本文基于获取的危害国家安全的社交网络数据,建立了社交网络中危害国家安全的突发事件搜索系统,论文完成的主要工作如下:(1)利用群智感知和时空模式挖掘技术在大规模社交网络中对突发事件相关的时空大数据进行了获取。对危害国家安全的突发事件进行了分类,构建了危害国家安全的突发事件关键词库,对社交网络中危害国家安全的突发事件数据进行获取,对数据进行分词、去停用词等预处理,将处理后的数据存储到数据库中。基于危害国家安全的突发事件分类体系,从事件、情景、过程、动作、时空关联关系等不同层次完成了突发事件数据的表达。(2)提出了基于WMD的突发事件检测算法(EDW)。EDW算法基于主题爬虫爬取的数据,对数据进行分词、去停用词等预处理,获取每篇文档的词向量表示。使用WMD算法进行文档相似性计算,对突发事件进行聚类,计算突发事件关键词,得到最终的突发事件。实验结果表明,相比于传统突发事件检测算法,EDW算法在突发事件检测准确率、召回率、F均值等指标上均有所提升。(3)提出了基于长短时记忆网络的突发事件搜索算法(EventScore)。EventScore算法通过建立长短时记忆网络,结合时间、空间及用户关注度特征,实现了高性能的危害国家安全的突发事件精准搜索,可适应急剧增长的大规模社交网络数据搜索需要。实验结果表明,相比于传统突发事件搜索算法,EventScore算法在突发事件搜索平均准确率方面提高了 10%。(4)设计和开发了社交网络中危害国家安全的突发事件搜索系统。该系统共分为三个功能模块,分别为危害国家安全的突发事件数据获取与表达模块、危害国家安全的突发事件检测模块、危害国家安全的突发事件搜索模块。实现了社交网络中危害国家安全的突发事件数据获取与表达、突发事件检测、突发事件搜索等功能。系统功能全面,并实现了友好的用户交互界面。本文实现了社交网络中危害国家安全的突发事件检测,完成了社交网络中危害国家安全的突发事件的搜索,实现了对企图通过突发事件煽动网民危害国家安全舆论导向的全面监测,可及时发现危害事件的发生。