论文部分内容阅读
近些年来,以在线社交网络、博客、微博、社会化新闻站点、线上虚拟世界等为代表的社会媒体网站出现了井喷式发展。这些平台为数以亿计的用户提供了一个前所未有的机会来创建并分享各种形式的内容信息。伴随着海量信息的生产和消费,人们在频繁的信息交流和传播的过程中也交换着各自的思想、观点和情感。因此,对于社会影响力的研究正变得越来越重要。社会影响力是指个体由于和其他个体或团体之间的交互而改变自身思想、情感、态度和行为的现象。社会影响力的研究成果可以应用于诸多重要领域,如:病毒营销、信息传播分析、推荐系统、专家发现、链接预测以及流量骇客等。除了上述线上的应用之外,公共健康行为推广、传染病疫情防控等重要线下领域也都将受益于与社会影响力相关的研究。 本文主要从三个方面来研究在线社交网络中的社会影响力:1)如何从非线性动态系统的角度出发衡量在线社交网络用户之间的影响力;2)如何在信息传播过程中同时对用户间的相互影响以及信息间的相互交互关系进行建模;3)如何在含有竞争信息和时间因素敏感的条件下优化社会影响力的传播。本文的主要贡献有以下三个方面: 从非线性动态系统的视角,提出了一种新型的在线社交网络用户社会影响力衡量方法 现有的在线社交网络用户社会影响力衡量方法没有有效利用用户行为模式中的非线性动态信息,并且过于依赖于显式的传播信息与特定的用户交互模型。受生态系统领域研究进展的启发,本文提出从非线性动态系统的角度出发,运用收敛交叉映射(CCM)方法来衡量社会媒体用户之间的相互影响关系。该方法能够分析用户间的非线性影响关系,且具有不依赖显式的传播信息、普适性强等特点。通过在仿真数据集和真实数据集上的实验评估表明:与现有基准算法相比,该方法能够更为有效地还原在线社交网络用户间隐藏的相互影响关系,并且能够进一步提高用户行为预测的准确度。 提出了一种可同时对用户间的相互影响与信息间的相互交互关系进行建模的方法 现有的在线社交网络中的信息传播建模方法通常只考虑了用户间的相互影响关系,而忽略了在社交网络中不同信息间的相互交互关系。除了社会影响力的作用,考察信息间的相互交互也有助于进一步理解用户的行为。本文基于多维Hawkes过程建模方法,提出了一种可同时对用户间的相互影响与信息间的相互交互关系进行建模的方法,并给出了基于ADMM算法和MM算法的模型参数估计方法。该建模方法能够刻画用户行为的重复性、用户行为之间的自激励和互激励效应、用户影响网络和信息交互网络的稀疏性。通过在仿真数据集和真实数据集上的实验评估表明:与现有基准方法相比,本文所提出的方法能够更为有效地挖掘在线社交网络用户间的相互影响以及信息间的相互交互关系。 提出了一种连续时间多信息传播模型,并基于此模型进一步研究了影响力最小化问题 已有的绝大多数关于影响力优化问题的研究工作没有充分考虑信息在社交网络中的传播速率特征,而考虑信息传播速率特征对于时间因素敏感的影响力优化的应用却十分关键。在此背景之下,本文提出了一种基于连续时间的多信息传播模型,并在该模型的基础上形式化定义了一个时间因素敏感的敌对信息影响力最小化问题,证明了该优化问题是一个NP-hard问题,且其目标函数具有单调性、亚模性等重要特征。此外,本文还进一步给出了一个近似比为1-1/e的贪心算法,同时也给出了三种启发式规则解法。通过在真实在线社交网络数据上的实验评估表明:本文给出的近似算法可以有效地在较短时间内最大限度地压制敌对信息在社交网络中的传播。此外,实验结果还表明:时间窗口越短,有效地利用信息传播速率特征对于敌对信息影响力最小化越为关键。