论文部分内容阅读
针对社会网络的研究起源于人文社会科学领域,但随着社交网络和社会媒体等在线社会网络的大量涌现,人们传播信息、交流沟通方式都有了新的格局。由此产生的病毒式营销和口碑效应成为营销行业的研究焦点,在麦肯锡有关社会网络的研究报告中显示,社交网络的出现改变了“消费者旅程”,使得借由在线社交网络能够监督、引导消费者行为,并能借由消费者本身对网络中的积极效应进行扩大化传播。Domingos和Richardson首先将这类问题归约为影响传播最大化问题,并引入到社会网络领域。针对社会网络影响传播最大化的研究中,主要存在两个方向:其一是寻找最有影响力的点,通常用于领袖发现、专家挖掘等;其二探讨如何实现影响传播最大化。即讨论如何正确选择初始传播对象,使得影响传播的范围最广。本文主要针对后者展开研究。社会网络中信息的传播是以人与人之间的关系为传播路径,以一系列传播者行为累加或群体贡献汇集的结果。因此,对扩散全貌的分析应当综合考虑社会网络的传播机制和结构特征。但现有的研究多是探讨具体应用场景(如微博)中的传播机制,对于用户间关系所形成的网络拓扑结构对传播的影响没有给予充分考虑。因此本文在充分考虑社会网络拓扑结构特征的基础上,提出了基于代数连通性的社会网络影响传播最大化模型,该模型的核心是以代数连通性为主要参量计算边的中心性,以此实现网络社区的快速划分;挖掘社区内区域影响力大的核心节点和度中心节点,并找到社区间的桥节点(也称连通点),从三者的合集中选择Top-K全局影响力最大的节点最为初始传播点集。本文的主要创新点在于:1.基于拓扑结构研究社会网络影响传播最大化问题,根据社区内外的节点角色属性构建种子节点集,再从种子节点集中选取全局最优解,通过降维达到了算法效率优化的目的。2.利用网络的次小特征向量性质(代数连通性),实现对桥节点的寻找,是对现有桥节点发现算法的补充。3.将社区思想和全局思想相结合,保证了算法效果的优化。实验结果显示, 本文所提模型与现有算法相比,在最终影响范围和运行时间上都更有优势。而且提供了对局部社区加强管控能力的可能性。