论文部分内容阅读
近年来,由于大型在线社交网络的爆炸式增长,产生了大量的应用,最显著的应用是病毒营销。其中的核心问题是如何量化在线社交网络中的用户的影响力。主要的方法将用户影响力的量化过程分解成两个阶段,第一阶段对用户间影响力进行量化,第二阶段基于用户间影响力量化用户的影响力。本文将主要研究用户间影响力量化模型。现有的用户间影响力量化模型主要针对传统的社交网络,因此并不适用于在线社交网络。虽然研究者也提出了针对在线社交网络的用户间影响力量化模型,但这些模型本身存在着缺陷,可能会导致不准确的量化结果。由于用户间影响力量化是整个应用的基础,将直接影响最终应用的效果,因此需要能够准确量化在线社交网络用户间影响力的模型。本文主要基于微博平台,将用户间的影响力定义为转发概率。本文首先从理论上推导了现有的均匀模型和极大似然模型,并分析了它们存在的问题。随后通过对真实数据集的分析来验证了理论分析的结果。在此基础之上,本文通过引入贝叶斯概率的理论和虚拟转发的概念来修正现有模型,提出了贝叶斯用户间影响力量化模型。最终,本文证明均匀模型与极大似然模型都是贝叶斯模型的特例。本文的实验部分通过直接和间接的方法来验证模型的理论。通过直接比较模型量化得到的用户间影响力,验证贝叶斯模型解决了极大似然模型的问题,提供了更准确的用户间影响力量化。同时,通过对不同模型找到的影响者排名列表进行定性和定量地分析,验证了贝叶斯模型是一个泛化的模型,提供了更全面的用户间影响力量化。最终,通过实验分析了虚拟转发在贝叶斯模型中的核心作用。