论文部分内容阅读
复杂网络(Complex Networks)从被提出的时候,就吸引了许多学者们的高度关注。经过多年的发展,复杂网络的应用价值逐渐展现出来,并得到了社会的认可。复杂网络可以被应用在许多领域中,剖析人与人之间的社会关系,分析城市交通网络线路等等。在众多领域专家学者的推动下,复杂网络已经被应用于生物学、社会学、计算机科学、管理学,甚至是语言文学等诸多领域中。社团发现算法是复杂网络中的一个重要课题,社交网络是一种典型的复杂网络。通过复杂网络社团算法去挖掘、分析社交网络中有用的信息,能够凸显社团算法的应用价值。然而社交网络上谣言的出现使得许多用户获取不真实的信息,大量虚假信息在社交网络上层出不穷,社交网络的特点也使得谣言在网络上传播迅速,难以遏制。目前谣言检测方法大多数都是基于机器学习的方法,而且都是利用文本的内容特征,并没有考虑到社交网络中社区结构信息。为了更好地检测出社交网络上的谣言,本文提出了RICD(Rumor Identification with Community Detection)框架,通过抓取新浪微博社交平台上的微博数据,利用官方的标注信息抽取谣言特征,剖析出基于微博内容的特征和基于用户网络的特征集,首次将机器学习算法和社团算法串联起来,结合微博内容特征和本文新提出的基于用户关系的特征,对谣言检测结果进行了优化,为谣言检测提供了一种新思路。找到谣言的源头能够从根源上遏制谣言的传播。本文通过研究相关检测谣言源的技术,总结了网络中影响谣言源检测的因素,在谣言源检测算法MPA(Message-Passing Algorithm)的基础上,对其算法结构提出了改进算法IMPA(Improved Message-Passing Algorithm),提升了MPA的准确率,加快了MPA的执行效率。在实验部分,利用四个现实的大型复杂网络数据集对IMPA算法进行了验证,实验结果显示了IMPA相对于MPA算法略有改善。