论文部分内容阅读
病毒式营销是一种非常有效的市场营销策略,通过个人社交圈的朋友、家人或同事进行社会影响力传播的口碑效应。在这个背景下,影响力最大化问题已经成为社会网络领域的研究热点,近年来已经有大量有关社会网络影响力最大化算法各方面的研究。影响力最大化问题就是找到社会网络中一小部分节点子集(种子节点),可以最大限度地发挥影响力的传播。找出学术网络中影响力最大的经典论文和科研带头人对促进科研合作和引导科研工作有着重要作用。学术网络可以看作一个有向加权图,节点代表论文,边代表论文间的引用关系。影响力是通过影响力传播模型在网络中传播的,大多基于两个最基本的影响力传播模型,即线性阈值模型(Linear Threshold model, LT模型)和独立级联模型(Independent Cascade model, IC模型),以及他们的扩展。考虑话题模型,提出了一种在LT模型基础上改进的基于话题的线性阈值模型T_LT (Linear Threshold based onTopic model)传播模型。通过总结经典的贪心算法和启发式算法的特点,提出了一个新的基于话题的影响力最大化算法TIM (Influence Maximization based on Topicalgorithm)。TIM算法综合考虑了学术网络的结构特性和传播特性,先用启发式方法基于话题聚类选择部分影响力值最大的节点,然后用贪心方法选择剩下的最具影响力的节点。最后基于Arnetminer平台上的学术论文引用网络数据集进行了实验,并从效果和效率两个方面与经典影响力最大化算法贪心KKT算法和度最大MaxDegree算法作对比。实验结果表明:TIM算法与KKT算法效果接近但是时间复杂度低很多,而比MaxDegree算法效果更好。TIM算法是一种有效的影响力最大化问题算法。