论文部分内容阅读
近年来,随着互联网技术的高速发展和日益普及,社交网络在网络活动中发挥着越来越重要的作用。然而与传统媒体有较为正规的获取和验证信息的渠道,互联网中的每个参与者都拥有相对自由的话语权,可以发布和传递信息,因此信息的真伪就难以辨别。虚拟的环境、真实的生活,为国家安全、社会稳定提出了前所未有的挑战。国内外都存在着部分可疑势力利用社交网络传递流言,煽动骚乱。在社交网络的信息传播的研究中,如何挖掘出有影响力的用户并对于消息来源进行搜索与追踪,对信息的传播、切断传播、信息推荐都是很有意义的。本文完成的主要工作如下:(1)利用基于在线社交网络的群智感知技术,获取社交网络中的用户情境信息,包括时间特征、位置特征及事件的动作变量、目标变量等社交特征,为社交用户中意见领袖的挖掘奠定基础。采用社交网络中所提供的接口,获取用户在特定时间内的微博内容及属性,并根据国民安全相关的事件关键字对收集的微博进行了筛选和分类,从中提取了微博特征并存储。(2)提出了结合层次结构和情感分析的意见领袖挖掘方法。以信息流量树为存储结构计算用户影响力,信息流量树是一种频繁模式树思想下的紧缩的数据结构。采用用户微博文本的情感分析,计算用户威胁程度,综合用户的影响力和威胁得分,挖掘出威胁国民安全的意见领袖。利用最大化影响力传播模型优化意见领袖列表,使挖掘的结果更精准。实验结果表明,采用结合层次结构的情感分析的意见领袖算法,在平均准确率方面相比平均提高了 21%,经过最大化影响力传播模型的分析后,在MAP方面提高了 5倍,在NDCG方面也有显著提高。(3)提出了基于位置的主题词与用户来源搜索算法,对社交网络中威胁国民安全的来源进行了搜索与追踪。通过词语的位置和相关词典匹配危险言论信息,搜索得到满足用户需求的危险言论结果向量和威胁性较高的用户群体。结合用户信息传播过程,搜索得出可能的威胁来源用户集合,并重点监控来源用户。采用改进的SIS模型BFS方法,分析威胁来源用户的受众状态,分析和追踪社交网络中威胁国民安全言论的传播行为特征。实验结果表明,采用本文提出的算法在用户来源搜索方面MAP平均提高了54%,在召回率和准确率方面提高了4%和 25%。(4)设计并实现在线社交网络中威胁国民安全来源的搜索与追踪系统。针对不同算法进行统一的展示与结果分析。系统分为三个模块,分别是社交网络大数据采集模块、社交网络意见领袖集合挖掘模块和社交网络威胁国民安全来源追踪模块。系统运行良好,功能较为全面,交互界面友好。