社交网络中影响力计算与用户行为预测问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:Carlower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们的工作、生活以及学习中,人们的思想、行为、感情经常受到他人的影响,这种影响是广泛存在的,比如在生活中受朋友影响去看某一部电影,在工作中受同事影响改变工作方法,在学习中受同学影响购买某一本学习书籍。用户的思想、行为、感情是如何被他人影响的,一直以来是社会心理学中广泛研究的问题之一,近年来,随着在线社交网络的爆炸式增长,对社交网络中的影响力以及影响力驱动的信息传播和用户行为分析的研究,已经成为计算机科学、社会科学等领域的研究人员广泛关注的课题。由于在真实的生活中,不同的朋友产生的影响大小是不同的,因此,如何准确的度量社交用户之间的影响成为一个重要的研究问题。目前,对社交网络中的影响力计算已经提出了一些技术方法,但是大部分研究只考虑到用户之间的积极影响,而忽略了消极影响。实际上,影响通常是两个方面的,比如在电影评价网站中,用户会对电影打分,有可能会打高分,也有可能会打低分,用户打分的高低决定了其对朋友产生的是不同极性的影响。当用户对某一部电影打分比较高时,他的朋友会觉得这部电影不错,很有可能也去观看这部电影,我们认为此时用户对朋友产生的影响是积极影响,反之,用户对电影打分比较低,那么他的朋友会觉得这部电影不太好而不去看,此时用户对朋友产生的影响是消极影响。因此,在计算用户之间的影响力时我们应同时考虑到积极影响因素和消极影响因素。社交网络中的用户行为分析在商品推荐、精准营销、广告定位等方面有着重要的价值,但是影响社交网络中用户行为的因素是多方面的。如前面所分析,社会影响力是影响用户行为的一个因素,除此之外,用户的行为还会受到自身的兴趣偏好以及产品的流行度等因素的影响。虽然目前也有很多工作关注社交网络中用户行为分析及预测,但是大部分工作只从社会影响力或者兴趣偏好其中一个角度去分析,没有综合多个因素去考虑。因此,如何综合影响用户行为的多个因素进行分析,从而更准确的预测用户行为是一个非常有意义的问题。本文研究社交网络中基于多极性因素计算用户之间影响力以及基于社会影响力和用户偏好等多种因素预测用户行为的问题,主要工作和贡献概括如下:1.针对多极性因素计算用户之间影响力的问题,提出了基于多极性因素的独立级联模型MFIC (Multipolar Factors aware Independent Cascade model),并给出了MFIC模型下的影响概率计算方法。在MFIC模型中,我们基于用户受到的朋友对他的积极影响和消极影响来建模社交网络中的信息传播,由于模型中参数众多,我们利用用户行为日志,基于EM (Expectation Maximization)算法学习模型的参数,通过不断的迭代更新,获得用户之间的影响概率。最后,我们在真实的数据集Digg和Flixster上进行实验,实验结果表明基于多极性因素学习得到的用户之间的影响概率更能准确的描述真实的信息传播情况。2.针对结合社会影响力和用户偏好等多种因素预测用户行为的问题,提出了一种基于影响力和用户偏好的逻辑斯蒂回归模型IPLR (Influence and Preference aware Logistic Regression model)。在该方法中,我们考虑到驱动用户行为的主要因素:社会影响力、用户偏好、产品流行度。首先,我们基于用户行为日志以及产品的属性信息,分别度量这三方面影响因素。然后,基于逻辑斯蒂回归方法学习出不同因素的权重。最后,我们在MoiveLens数据集上进行实验,实验结果表明综合考虑用户偏好,社会影响力以及产品流行度,更符合用户的决策过程,能够提高对用户行为预测的准确性。
其他文献
随着信息技术的发展以及云服务的普及,越来越多的企业或机构将本地大量的数据以及复杂的管理外包给云服务提供商,简化了租户对相关配套基础设施、后续改造升级、维护、运营管
随着数字化、信息化、网络化的发展和应用,计算机安全成为保证信息系统正常运行、发挥效能的不可忽视的重要因素,而其中文件存储安全成为计算机信息安全中的重要一项。文件的泄
数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则挖掘是数据挖掘的主要研究内容,它从大量的数据项中寻找隐藏着的联系或相关性。Apriori算法是关联规则挖
随着互联网技术的蓬勃发展及其普及应用,用户迈入了信息快速发展的时代。一方面,如此庞大的信息库满足了用户对各类信息的需求,而另一方面,信息库中内容过于繁杂,想要准确检
随着社会现代化程度的不断提高,计算机动画仿真技术的应用需求也越来越大,在计算机游戏、动画以及影视广告领域中都有仿真技术的身影。而自然景物诸如海浪、云、烟、火焰、雨
大规模数据的共享和访问引发了网络技术的迅速发展,结合传统计算机的应用,出现了云计算这一新的计算模型。云计算以其容错性强、成本低廉等优势获得广泛的研究与应用,与此同
随着计算机网络通信技术,高速半导体技术,音视频压缩技术的迅猛发展,人们对视听产品的移动化,便携化的需求日益强烈,比如远程视频监控,可视电话,视频点播等业务,而这些业务的
论文主要阐述了在IP机顶盒上基于SIP协议的PRESENCE业务的实现。目前,机顶盒不再局限于作为家用多媒体的数字平台,更多的将是家庭间的互通,家庭之间多媒体信息的共享和家庭的
随着网络的演进和融合,传统的消息业务已经不能适应未来网络和用户的发展需求,消息类业务的融合呈现出一种必然的趋势。现有的各种消息业务(包括SMS、MMS、IM、MEM、PoC等)都
随着网络技术的高速发展,网络信息的安全性显得越来越重要。访问控制是以一种特定的方式限制用户的访问能力和访问范围,以此来保证信息安全。本文以中国-加拿大政府合作项目