论文部分内容阅读
近年来基于在线社交网络的各种服务正在改变人类的日常生活,同时吸引了来自计算机科学、社会学、经济学等不同领域的研究者投身于社交网络分析这一研究课题。不同于传统媒体,在在线社交网络中,用户是信息的生产者、发布者和传播者,而且信息的传播依托用户的社交影响力。因此在线社交网络的影响力分析是社交网络分析中的关键问题之一,并带来了许多相关应用,譬如推荐系统、链路预测、社团发现、病毒式营销和突发事件检测等。在线社交网络中影响力分析的研究对象是某个特定社交网络,称为目标网络。现有的工作通常只收集目标网络中的数据,研究的范围也只限定在目标网络中。但是在真实场景中,这样的设定具有明显的局限性。因为随着大量在线社交网络的涌现,用户分布在不同社交网络中,同一用户会根据自身不同的社交需求在不同网络中分别注册账号。因此在评估个人影响力时,只考虑此人在目标网络中的表现是不充分的,引入其他网络的多元信息能有效完善用户的信息。同样地,信息不会只在目标网络中传播,所以在研究影响力扩散过程时,应该将其影响范围拓展到多个网络中。因此在本文中,我们将融合目标网络外部的多元信息对在线社交网络影响力分析中的三个主要阶段进行研究:个体传播影响、影响力扩散以及个体接受影响。我们利用诸如Twitter和Foursquare等在线社交网络数据以及电视信息数据来观察与分析在线社交网络中的影响力,所得结论促使我们重新思考与解决社交网络影响力研究中的重要问题,包括关键节点挖掘、影响最大化问题、社团发现问题和用户社交行为预测等。具体而言,本文的主要工作和创新点如下:1.基于跨网络影响力的关键节点挖掘在个体传播影响阶段,本文的第一个工作是对个体的影响力进行度量,挖掘在跨网络信息传播中具有高影响力的关键节点。这些连接不同网络,充当桥梁作用的关键用户被称为引爆者。为了描述跨异构网络中的信息传播过程,我们设计了跨网络信息传播模型,该模型提取异构网络中的各种信息扩散渠道,并从数据中学习各种关系的权重,从而计算用户的激活概率。我们还提出了新的算法来识别带来最大影响力增益的引爆者,在真实社会网络数据集上进行的实验验证了模型与算法的有效性。2.跨网络传播中的影响最大化问题影响最大化问题是影响力扩散研究的经典应用。在现实中执行病毒式营销时,常常会遇到目标网络结构未知以及营销成本过高的困难。在本文中我们通过从目标网络和其他外部源网络中选择种子用户,以迂回的方式在目标网络中进行病毒式营销。除了目标网络内部信息传播,经由共享用户传播信息,间接地从外部网络激活目标网络中的用户。我们提出了基于网络随机游走的网内与网间信息传播模型,并设计了基于动态规划的算法来解决跨网络的影响最大化问题。而基于真实社交网络的数据验证了模型与算法的高效性和有效性。3.基于影响力扩散的社团发现问题社团发现是影响力扩散的另一个应用。本文的第三个工作研究从用户之间的信息交互程度来对新兴网络进行社团划分。由于新兴网络中结构稀疏、信息很少,难以计算用户之间的相似性,要解决这类网络中的社团发现问题很有挑战性。因此我们提出从某些成熟的网络传播有用的信息到新兴网络中,从而克服信息的短缺。在充分考虑网络间的差异后,我们根据有效的信息传播模型,提出了一种高效的方法,使用来自其它异构社交网络的信息来发现新兴网络中的社团。在真实的社交网络上进行的实验表明我们的算法可以有效地解决新兴网络中的社团发现问题。4.融合电视信息的用户社交行为预测在用户接受影响力的阶段,我们发现在现实生活中用户通常受到多种渠道的信息影响,譬如电视广告会激发并影响信息在社交网络中的传播。本文最后一个工作是研究电视广告信息在在线社交网络中的传播过程,并预测用户是否会被广告信息感染并在网络中讨论广告。为了解决该问题,我们提出了电视广告的社交网络影响力推断模型。模型首先认识到用户的社交行为同时受到来自在线社交好友和离线电视广告的影响。接着又将观众对广告的态度分为3个不同的阶段:认知、情感、行为。基于社交好友和电视广告的协同效应,模型用特定概率模型来描述观众在每个阶段的反应。在两个真实的电视广告数据集上进行的实验验证了模型的有效性。