论文部分内容阅读
在我们的工作、生活以及学习中,人们的思想、行为、感情经常受到他人的影响,这种影响是广泛存在的,比如在生活中受朋友影响去看某一部电影,在工作中受同事影响改变工作方法,在学习中受同学影响购买某一本学习书籍。用户的思想、行为、感情是如何被他人影响的,一直以来是社会心理学中广泛研究的问题之一,近年来,随着在线社交网络的爆炸式增长,对社交网络中的影响力以及影响力驱动的信息传播和用户行为分析的研究,已经成为计算机科学、社会科学等领域的研究人员广泛关注的课题。由于在真实的生活中,不同的朋友产生的影响大小是不同的,因此,如何准确的度量社交用户之间的影响成为一个重要的研究问题。目前,对社交网络中的影响力计算已经提出了一些技术方法,但是大部分研究只考虑到用户之间的积极影响,而忽略了消极影响。实际上,影响通常是两个方面的,比如在电影评价网站中,用户会对电影打分,有可能会打高分,也有可能会打低分,用户打分的高低决定了其对朋友产生的是不同极性的影响。当用户对某一部电影打分比较高时,他的朋友会觉得这部电影不错,很有可能也去观看这部电影,我们认为此时用户对朋友产生的影响是积极影响,反之,用户对电影打分比较低,那么他的朋友会觉得这部电影不太好而不去看,此时用户对朋友产生的影响是消极影响。因此,在计算用户之间的影响力时我们应同时考虑到积极影响因素和消极影响因素。社交网络中的用户行为分析在商品推荐、精准营销、广告定位等方面有着重要的价值,但是影响社交网络中用户行为的因素是多方面的。如前面所分析,社会影响力是影响用户行为的一个因素,除此之外,用户的行为还会受到自身的兴趣偏好以及产品的流行度等因素的影响。虽然目前也有很多工作关注社交网络中用户行为分析及预测,但是大部分工作只从社会影响力或者兴趣偏好其中一个角度去分析,没有综合多个因素去考虑。因此,如何综合影响用户行为的多个因素进行分析,从而更准确的预测用户行为是一个非常有意义的问题。本文研究社交网络中基于多极性因素计算用户之间影响力以及基于社会影响力和用户偏好等多种因素预测用户行为的问题,主要工作和贡献概括如下:1.针对多极性因素计算用户之间影响力的问题,提出了基于多极性因素的独立级联模型MFIC (Multipolar Factors aware Independent Cascade model),并给出了MFIC模型下的影响概率计算方法。在MFIC模型中,我们基于用户受到的朋友对他的积极影响和消极影响来建模社交网络中的信息传播,由于模型中参数众多,我们利用用户行为日志,基于EM (Expectation Maximization)算法学习模型的参数,通过不断的迭代更新,获得用户之间的影响概率。最后,我们在真实的数据集Digg和Flixster上进行实验,实验结果表明基于多极性因素学习得到的用户之间的影响概率更能准确的描述真实的信息传播情况。2.针对结合社会影响力和用户偏好等多种因素预测用户行为的问题,提出了一种基于影响力和用户偏好的逻辑斯蒂回归模型IPLR (Influence and Preference aware Logistic Regression model)。在该方法中,我们考虑到驱动用户行为的主要因素:社会影响力、用户偏好、产品流行度。首先,我们基于用户行为日志以及产品的属性信息,分别度量这三方面影响因素。然后,基于逻辑斯蒂回归方法学习出不同因素的权重。最后,我们在MoiveLens数据集上进行实验,实验结果表明综合考虑用户偏好,社会影响力以及产品流行度,更符合用户的决策过程,能够提高对用户行为预测的准确性。