论文部分内容阅读
随着互联网技术、通信技术的快速发展,网络上出现了大量的社交网络平台,微博是其中具有代表性的。由于微博的即时性、自主性以及互动性等特点能够对传统媒体的不足进行改进并突破,因此得到了极大的发展,已经成为互联网用户发布、分享信息的重要途径,逐渐演变成为大众化的互联网舆论平台。而也正是由于其发言方式更自由、更多样,舆情事件的爆发往往呈现病毒扩散式,给舆情监控带来巨大的挑战。本文面向社交网络中不同领域的舆情传播与控制的问题开展研究,将从领域划分、用户影响力度量以及不同领域的舆论控制三个具体的问题开展研究:首先,研究了适用于面向微博用户的用户领域划分方法。用户的领域划分主要依据其所发布的微博,而由于微博平台的特点,发布的微博都是短文本。对短文本分类技术进行了研究,在研究的基础上,针对短文本具有主题聚焦性差和特征稀疏的问题,提出了一种结合词向量、LDA主题模型以及CNN的短文本分类算法,将词向量与LDA主题模型训练得到的主题向量拼接后输入到CNN中,使得词、文本之间的联系得到加强,从而实现精准可靠的短文本分类,为本文后续工作奠定了理论基础。其次,研究了微博中关键用户挖掘的方法。考虑到在微博网络中,近期活跃用户所引起的关注关系动态变化对节点影响力产生重要影响,以及网络中互惠边更利于用户间的信息传递,提出一种微博网络用户影响力排序算法。该算法中,对微博网络加权,赋予互惠边更高的权重;对比一段时间内微博关注关系的动态变化,提取动态增量网络,分别计算微博网络和增量网络节点影响力进行叠加和归一化处理,最终得到微博用户影响力排序。通过挖掘新浪微博实际数据,使用SIR模型对提出的算法进行验证,结果表明提出的算法在提高传播覆盖率和排名预测方面好于其它同类算法;同时,增量网络对节点排序产生重要影响。另外还考虑了信息转发树的因素,提出了另一个用户影响力排序算法。最后,研究了面向微博的舆情控制方法。根据提出的短文本分类算法和用户影响力排序算法,分别得到每个用户在各领域的占比以及用户综合影响力,通过计算得到用户的各领域影响力,从而能够发现各领域的高影响力用户,再结合经典的目标免疫方法,最终提出了一种基于领域划分的微博舆情免疫策略。经过实验仿真分析,发现相较于传统的免疫策略,免疫效果得到了提升。