论文部分内容阅读
随着互联网模式的不断创新,线上线下服务的融合加速以及移动互联网服务场景不断丰富,移动互联网产品成为人们获取信息的主要途径。微博由于其信息更新速度快、信息来源多样,事件和话题的发展脉络清晰等特点,受到了广大用户的欢迎,也成为近几年众多学者的研究热点。其中微博网络中的影响力传播问题是近几年学者们的研究热点,在影响最大化问题中寻找种子节点集合是其中一个重要的分支,其在信息传播和病毒营销方面都有着广泛的应用。本文针对两种竞争信息在微博网络中的传播,从时间和代价两个方面综合考虑,提出了一种基于时间和最小代价的竞争种集选取算法。该算法为后进入网络的信息B选取付出最小代价的竞争种集,使得信息最终的传播影响范围超过竞争信息的影响范围,即获取竞争胜利。该算法分为两个部分:信息A单独传播部分、信息A和信息B同时传播部分。信息A单独传播部分,单个信息利用独立级联模型进行传播,本文根据信息B进入微博网络中的时间,计算该时间内信息A独自传播的影响力;两种竞争信息同时传播部分,信息B进入微博网络后,两种竞争信息同时传播,本文根据时间和最小代价的竞争种集选取算法计算花费最小代价的信息B的初始节点,使得信息B的影响范围大于信息A的影响范围。为了证明该算法的可行性和正确性,本文采用真实的微博数据对算法进行实证。首先实验对算法本身进行分析,发现后者信息在不同时间进入网络所需的代价不同,选取的竞争种集也不同。并且若进入时间超过一定的范围,后者信息将不能取得竞争胜利。然后将CELF算法和基于最小代价的CELF算法进行对比,发现基于最小代价的CELF算法得出的竞争种集所需要的总代价更小。本文的创新点主要有两点:第一,本文在两种竞争信息同时传播的基础上进行改进,考虑两种竞争信息进入网络的时间差,选取花费最小代价的竞争种集,使得后者信息获得竞争胜利。第二,为了方便计算前者信息在微博网络中单独传播的影响范围,本文选用基于扩展独立级联模型的CELF算法,先选取可能图再计算影响范围。本文也存在一些不足。为了保证实验效果,本文选取了 CELF算法作为基础算法,但是最终结果显示,该算法的时间复杂度较高,本文下一步的研究需要改进竞争种集选取算法,减少时间复杂度,使其更加适合运用在大型的社交网络中。